視(shi)頻大模型迎來(lai)Sora時(shi)刻,生產力(li)工具蓄(xu)勢待(dai)發。自(zi)Sora發布(bu)以來(lai),國(guo)內外已有十多家公司發布(bu)或更新(xin)視(shi)頻生成模型。
客(ke)觀對比:與(yu)Sora差距縮(suo)小,搶占用(yong)戶(hu)或(huo)為未來主(zhu)線(xian)。國內外之間的差距正(zheng)在(zai)逐步(bu)縮(suo)小,視(shi)(shi)頻時長(chang)、分辨率等基礎功能具有(you)復 制性,未來競爭(zheng)或(huo)向(xiang)搶占用(yong)戶(hu)、提升粘性等方向(xiang)遷移(yi),從而需要保障生成質量更(geng)高(gao)的可用(yong)視(shi)(shi)頻,使得視(shi)(shi)頻一致性更(geng)高(gao)、文本指 令遵循(xun)更(geng)準確、物理真(zhen)實模(mo)擬能力更(geng)強。
主觀對比(bi):視頻質量提升(sheng)顯著,離物(wu)(wu)理(li)世界模(mo)(mo)擬(ni)器仍(reng)有距離。文生(sheng)視頻領(ling)域(yu),視頻畫(hua)面(mian)普遍清晰,而在(zai)動作幅度(du)與物(wu)(wu)理(li)還(huan)原度(du) 方(fang)面(mian)差異較大,我國(guo)(guo)(guo)Vidu、清影(ying)或已處(chu)于(yu)視頻生(sheng)成(cheng)大模(mo)(mo)型第一(yi)(yi)梯(ti)隊,生(sheng)成(cheng)時間相(xiang)對其他模(mo)(mo)型倍數減少,且在(zai)動作幅度(du)、物(wu)(wu)理(li)還(huan) 原度(du)等復雜任務完成(cheng)性較好;圖生(sheng)視頻領(ling)域(yu),整體效果優于(yu)文生(sheng)視頻,國(guo)(guo)(guo)內與國(guo)(guo)(guo)外(wai)差距進一(yi)(yi)步縮小。
視頻大模型(xing)具(ju)備商用潛(qian)力,下游(you)應用正在儲能(neng)。未來隨著用戶(hu)習慣(guan)的(de)培(pei)育以及算力基礎設施的(de)完善,視頻大模型(xing)的(de)或者辦公、 廣(guang)告、電影(ying)、游(you)戲等多領域具(ju)有(you)廣(guang)闊(kuo)的(de)前景。
算法(fa)、算力、數據三要素,視頻大模(mo)型(xing)通(tong)往AGI的(de)必(bi)經(jing)之路。
算(suan)法:視頻生(sheng)(sheng)成(cheng)(cheng)模型(xing)算(suan)法主要(yao)由(you)基(ji)于(yu)SD逐幀(zhen)生(sheng)(sheng)成(cheng)(cheng)和基(ji)于(yu)時空Patches兩(liang)種(zhong)范式(shi)構成(cheng)(cheng),是效(xiao)率(lv)與(yu)(yu)效(xiao)益(yi)的(de)比拼。前者模型(xing)更(geng)容易訓練(lian), 而視頻內容一致(zhi)性(xing)要(yao)差一些,長(chang)視頻訓練(lian)存在困(kun)難(nan);后者訓練(lian)成(cheng)(cheng)本更(geng)高,但是生(sheng)(sheng)成(cheng)(cheng)視頻的(de)長(chang)度與(yu)(yu)一致(zhi)性(xing)更(geng)容易得(de)到保障。
算(suan)力:以Sora為例(li),一定條件下(xia)測算(suan),Sora訓練算(suan)力需求(qiu)是GPT-4的4.5倍,而推理(li)算(suan)力需求(qiu)接近GPT-4的400倍。
數據(ju):高(gao)質量數據(ju)是模型能力(li)的保(bao)障,而用(yong)戶數量或為開(kai)啟(qi)模型迭代(dai)“數據(ju)飛(fei)輪(lun)”的關鍵。
投資(zi)建議(yi):建議(yi)關注(zhu)(1)視頻大(da)(da)模型(xing)廠商:科(ke)大(da)(da)訊(xun)飛、商湯、云從科(ke)技(ji)、格(ge)靈(ling)深瞳、拓爾思(si)、昆侖萬(wan)維等(deng)(deng)。(2)算力(li):海光 信息、寒武紀(ji)、景嘉微、中科(ke)曙光、浪潮(chao)信息、工(gong)業富聯、神州數碼、拓維信息、四(si)川長虹(hong)等(deng)(deng)。(3)接入(ru)大(da)(da)模型(xing)的(de)應用標的(de): 金(jin)山辦(ban)公(gong)、萬(wan)興科(ke)技(ji)、福昕軟件、虹(hong)軟科(ke)技(ji)、彩訊(xun)股(gu)份(fen)、焦點(dian)科(ke)技(ji)、潤達醫(yi)療(liao)、金(jin)證股(gu)份(fen)、泛微網絡、金(jin)蝶國際(ji)等(deng)(deng)。
智能服務機器人 |