侃股網(wǎng)-股民首選股票評論門戶網(wǎng)站

     找回密碼
     立即注冊

    QQ登錄

    只需一步,快速開始

    搜索
    熱搜:

    2024年2月28日早間投資機會一覽

    2024-2-28 08:59| 發(fā)布者: admin| 查看: 11101| 評論: 0

    摘要: 早間投資:5G-A商業(yè)化浪潮來襲,移動、華為雙雙發(fā)力,部分公司爭搶“頭啖湯”,早間投資機會:游戲版號發(fā)放持續(xù)放量 廠商加大投入高質(zhì)量產(chǎn)品,早間投資機會:AI文生視頻大模型出爐 預計視頻生產(chǎn)成本有所降低,早間投 ...
    早間投資機會:AI文生視頻大模型出爐 預計視頻生產(chǎn)成本有所降低


    美國人工智能公司OpenAI發(fā)布了最新的“文生視頻”大模型Sora,并同時公布了一系列樣片,展現(xiàn)了較為驚艷的視頻生成效果。盡管Sora仍處于開發(fā)早期階段,但它的推出類似于2021年問世的OpenAI初代“文生圖像”系統(tǒng)DALL-E,標志著AI生成視頻有望提速。

    現(xiàn)階段,文字、圖片、音頻的AI生成都已較為成熟,圖片領(lǐng)域Stable Diffusion、Midjourney等工具已廣泛應(yīng)用于游戲、廣告營銷行業(yè)的日常經(jīng)營之中,但AI視頻生成的應(yīng)用尚不完善。而移動互聯(lián)網(wǎng)中,視頻是消耗用戶時長最多的內(nèi)容形態(tài)。AI生成視頻短期可以應(yīng)用在廣告營銷、短劇等對畫質(zhì)要求較低的領(lǐng)域,長期則在影視制作等領(lǐng)域有較大空間。

    AI視頻生成的難點在于,一方面視頻是連續(xù)的多幀圖像,并且要有邏輯性,并非簡單的圖片組合,另一方面帶來模型復雜度提升、計算難度和成本的提升,此外,文生視頻需要大量的“文本-視頻”配對數(shù)據(jù),而目前缺乏多樣化的數(shù)據(jù)集,且數(shù)據(jù)標注的工作量較大。因而此前視頻大多為5-15秒,而Sora將視頻時長提升至1分鐘,支持生成多個鏡頭,同時基本維持了角色和視覺風格的一致性,并能在一定程度上“理解”現(xiàn)實世界。

    技術(shù)角度來看,Sora采用了“擴散+Transformer”的視頻生成大模型技術(shù)路線,可謂有了里程碑式的技術(shù)進步。相比以往使用的同為擴散模型的U-Net,Transformer架構(gòu)的參數(shù)可拓展性強,即參數(shù)量增加,性能加速提升,同時支持任意分辨率、長寬比、時長的視頻訓練數(shù)據(jù),不會因為壓縮導致訓練數(shù)據(jù)質(zhì)量下降。此外,Sora訓練了能在時間和空間上壓縮視頻的自編碼器,這也是其能夠大幅提升生成視頻時長的原因。

    商業(yè)角度來看,從“idea或IP→內(nèi)容生產(chǎn)→內(nèi)容分發(fā)”的產(chǎn)業(yè)鏈,長期預計視頻生產(chǎn)的成本將大幅降低。目前AI生成視頻的水平還有待提升,可能更適合做對視頻質(zhì)量要求低的互聯(lián)網(wǎng)廣告素材,如游戲買量素材等。由于Sora基本處于閉源狀態(tài),技術(shù)細節(jié)并未公布,相比于GPT有較多開源模型而言,國內(nèi)視頻生成模型方面尚有差距,利好有idea但落地較慢的動畫電影公司、IP公司、以及能夠降本增效的游戲行業(yè)。


    路過

    雷人

    握手

    鮮花

    雞蛋
    ?
    侃股網(wǎng)簡介|手機版|網(wǎng)站地圖|友情鏈接|
    返回頂部