8月8日消息,近日,快手高級副總裁、研發(fā)線負(fù)責(zé)人于冰表示,AI大模型作為當(dāng)下最重要的革命性技術(shù),進(jìn)入爆發(fā)期,有望開啟AGI時代,而多模態(tài)內(nèi)容
生成與理解是其核心能力。
于冰認(rèn)為,當(dāng)前,多模態(tài)AI大模型因其在文本、代碼、圖像和視頻等多種內(nèi)容上突出的生成與理解能力,有望為視頻生產(chǎn)、理解、分發(fā)、消費(fèi)等全鏈路打開
新的技術(shù)視角,突破傳統(tǒng)音視頻編碼的技術(shù)天花板,突破基于用戶行為的搜廣推算法的傳統(tǒng)思路,將視頻內(nèi)容創(chuàng)作從PGC、UGC帶動進(jìn)入AIGC時代,創(chuàng)造AI
大模型驅(qū)動的視頻內(nèi)容創(chuàng)作工具,激發(fā)創(chuàng)作者的創(chuàng)意空間,高效率、低成本地生產(chǎn)高質(zhì)量的視頻內(nèi)容。
而短視頻、直播作為最典型的多模態(tài)媒介,快手也抓住平臺基因,在AI大模型領(lǐng)域重度投入,全方位探索技術(shù)突破。于冰介紹,目前,快手在AI大模型的布局
體系分為三個層級:基于具備高性能、高并發(fā)、高算力的“大基建”,構(gòu)建快手多模態(tài)的AI“大模型”,進(jìn)而在搜廣推、內(nèi)容創(chuàng)作、用戶增長、研發(fā)效能等領(lǐng)
域內(nèi)打造“大應(yīng)用”。
他提到,在多模態(tài) AI大模型的加持下, AI技術(shù)和工具可全方位地賦能影視創(chuàng)作者,助其在創(chuàng)作、拍攝、后期等各階段激發(fā)創(chuàng)意、提升效率和內(nèi)容質(zhì)量,影視
制作的周期也能大幅提高,過去花費(fèi)數(shù)年拍攝的大片有望數(shù)月完成。
快手自2011年成立至今,回顧過往經(jīng)歷,于冰表示,業(yè)務(wù)發(fā)展會經(jīng)歷入局、成長、成熟等多個階段,在業(yè)務(wù)發(fā)展的不同階段,快手所采取的研發(fā)策略也各有側(cè)
重。創(chuàng)新成長期更注重持續(xù)投入,探索新產(chǎn)品、新周期;而成熟階段則需聚焦優(yōu)化效率,兼顧體驗(yàn),既保證產(chǎn)品體驗(yàn)的競爭力,又保證業(yè)務(wù)的穩(wěn)健成長。
于冰以快手音視頻業(yè)務(wù)為例,目前該業(yè)務(wù)已步入成熟期,研發(fā)策略重點(diǎn)也轉(zhuǎn)移至提升效率、優(yōu)化成本,追求單位成本下算力、存儲和網(wǎng)絡(luò)使用效率的提升。快
手基于自研視頻質(zhì)量評估KVQ、視頻增強(qiáng)修復(fù)KEP和KRP、視頻壓縮編碼算法KVC等一系列核心技術(shù),形成數(shù)據(jù)驅(qū)動的視頻處理閉環(huán),在兼顧體驗(yàn)的同時極致
壓縮視頻。
2022年,快手技術(shù)toB業(yè)務(wù)StreamLake推出了首款自研智能視頻處理芯片SL200,該芯片集成了快手領(lǐng)先的視頻編解碼、圖像處理、AI推理、內(nèi)容自適應(yīng)編碼
等關(guān)鍵技術(shù),具備高質(zhì)量、高密度、智能化的特點(diǎn)。目前,SL200芯片已全面應(yīng)用于快手的直播和短視頻業(yè)務(wù),實(shí)現(xiàn)成熟技術(shù)通過StreamLake對產(chǎn)業(yè)賦能。
而在數(shù)字人領(lǐng)域,于冰介紹,快手全鏈路自研了光場掃描重建、超寫實(shí)人像建模、智能綁定、動作捕捉與驅(qū)動、物理仿真等數(shù)字人核心技術(shù),推出「快手虛擬演
播助手(KVS)」和「快手智播」兩大解決方案。未來,結(jié)合智能編曲、圖像/視頻生成、LLM等AI能力,快手?jǐn)?shù)字人技術(shù)將繼續(xù)在文旅、教育、游戲、直播電商
等領(lǐng)域廣泛應(yīng)用,助力客戶打造高品質(zhì)低成本的3D和2D數(shù)字人。(一橙)