早間投資機會:多模態推理場景拉動算力網絡
近期,OpenAI與谷歌分別推出了AI視頻模型Sora和多模態大模型Gemini1.5,多項技術均實現創紀錄的突破。其中,OpenAI發布文生視頻模型Sora,開創AI視頻新時代;谷歌Gemini1.5震撼上線,首破100萬極限上下文紀錄。 業內人士表示,隨著近期北美云商及部分AI產業鏈公司明確上調資本開支以及積極投資AI的態度,修復了國內投資者對于AI及算力板塊的信心,光模塊作為算力基建重要環節,對其2024年至2025年的需求持續保持樂觀,疊加行業馬太效應增強,頭部光模塊廠商業績有望維持高增長。 事件驅動 海外AI巨頭接連推出新模型 2月16日,OpenAI推出了一款能根據文字指令即時生成短視頻的模型,命名為Sora。根據介紹,Sora使用擴散模型技術,完美繼承了DALL·E3的畫質和遵循指令能力,能夠從文本說明中生成長達60秒的視頻,并能夠提供具有多個角色,特定類型的動作和詳細背景細節的場景。借助GPT的能力,Sora實現對語言的深入理解,使其能夠準確地解釋提示詞,并生成引人注目的字符來表達充滿活力的情感。 Sora還能在一個生成的視頻中創建多個鏡頭,體現人物和視覺風格。OpenAI表示,通過讓模型一次生成多幀畫面,Sora解決了一個具有挑戰性的問題,即:即使生成的主體暫時離開視線內,也能確保主體不變。除文生視頻外,Sora還具有更多功能:根據圖像生成動畫;在時間上向前或向后擴展視頻;編輯輸入的視頻;在兩個輸入視頻之間逐漸進行插值,從而在具有完全不同主題和場景構成的視頻之間創建無縫過渡;根據文字生成圖像。 同日,谷歌發布“下一代AI模型”——Gemini1.5。Gemini1.5建立在谷歌基礎模型開發和基礎設施的研究與工程創新的基礎上,包括通過新的專家混合(MoE)架構使Gemini1.5的訓練和服務更加高效。MoE模型由眾多小型的“專家”神經網絡組成,這些模型可以根據不同的輸入類型,學會僅激活最相關的專家網絡路徑。在此架構下,Gemini1.5在許多方面都實現了突破,最令人眼前一亮的是超長的上下文窗口。Gemi-ni1.5版本中首個登場的多模態通用模型Gemini1.5Pro,把穩定處理上下文的上限擴大至100萬tokens,并且支持處理文字、代碼,以及圖片、語音、視頻等多模態內容。 通俗的來說,Gemini1.5Pro可以一次性處理超過70萬個單詞的文本、3萬行代碼、11個小時的音頻,或1個小時的視頻。根據谷歌的報告,Gemini1.5Pro對于100萬tokens的文本、音頻、視頻能夠實現100%的檢索完整性,對于更長的上下文,也有著優秀的檢索效果。與之對比鮮明的是,GPT-4Turbo的性能則飛速下降,無法處理超過12.8萬個token的文本。目前谷歌開放給開發者的測試版本中,Gemi-ni1.5Pro的token限制只有12.8萬個,后續會推出新的收費層級,供解鎖100萬tokens的版本。 事件影響 多模態推理產業節奏正在加快 據OpenAI的Sora文檔,Sora基于DiT(diffusiontransformer)等設計。DiT原作者SainingXie第二作者總結,DiT模型的架構即VAEencoder+ViT+DDPM+VAEde-coder,視頻的可擴展性是Sora的重要亮點。訓練數據的來源、構建、視頻生成的能力是Sora的重要產業增量,而非過去討論LLM的參數量。據DiT模型論文,較大模型的計算效率更高,較小模型即使拉長訓練時間,最終計算效率也會下降;通過使transformer更深、更寬,訓練效果會提升;通過增加DiT處理token數量,訓練效果會顯著改善。 Sora的推出啟示我們,多模態推理的產業節奏正在加快。過去市場對算力網絡的需求測算,主要聚焦在模型訓練階段,關注模型路徑、技術格局、參數量、芯片創新等。更長期的AGI應用爆發,推理需求指數增長,需求增長的持續性是下一步光通信等算力網絡定價的關鍵。 相比訓練,推理階段更重視內存+網絡平衡。大模型推理過程,模型參數和KVcache是主要的內存使用者,盡管相比訓練階段減少了梯度、優化器等占用,但最大瓶頸在于顯存,且隨著模型增大需要減少并行或優化并行通信。 以英偉達H200芯片為例,產業硬件側已經開始重視長期推理需求。英偉達H200重要硬件變化是HBM3升級至HBM3e,容量帶寬顯著優化;重要軟件變化是大幅強化了推理性能 (匹配TensorRT-LLM)和HPC性能;顯著降低能耗和整體成本。相比H100,H200幾乎提升了Llama270B推理性能1.9x,提升GPT3175B推理性能1.6x;從單位成本和模型復雜度角度考慮,對未來旗艦AI芯片在推理場景的應用判斷應當更樂觀,相應的光網絡需求亦同步。 投資思路 頭部光模塊廠商業績有望維持高增長 廣發證券認為,前期導致AI算力板塊持續調整的主要原因是國內外投資者對于AI應用的前景有明顯預期差,A股投資者對于AI應用偏向保守,擔心算力板塊的增長難以延續。隨著近期北美云商及部分AI產業鏈公司明確上調資本開支以及積極投資AI的態度,修復了國內投資者對于AI及算力板塊的信心,光模塊作為算力基建重要環節,對其2024年至2025年的需求持續保持樂觀,疊加行業馬太效應增強,頭部光模塊廠商業績有望維持高增長。 此外,廣發證券判斷,2025年高速光模塊將主要受到三重共振的牽引:第一,2025年將是傳統以太網數據中心800G光模塊升級大年;第二,AWS、Meta、特斯拉等其他AI主要玩家也將會在2025年加速建設;第三,AI使得GPU帶寬快速增長,帶動光模塊迭代加速,新一代1.6T光模塊也將會在2025年放量。伴隨光模塊迭代升級,光模塊產品定制化程度更高,光模塊公司和下游客戶綁定更強,馬太效應更加強烈。建議持續關注信息、算力基建產業鏈的相關標的。建議關注整體方案商環節中興通訊;算力網絡運營商中國移動、中國電信、中國聯通;光模塊、光器件環節的新易盛、天孚通信;高速數據通信電纜領域的兆龍互連;交換機環節的銳捷網絡、菲菱科思。 平安證券表示,當前,全球范圍內大模型領域的競爭依然白熱化,這將持續拔升大模型的整體能力水平。大模型需要大算力,大模型算法的迭代升級將為全球和中國AI算力市場的增長提供強勁動力。在美國對華半導體出口管制升級的背景下,我國國產AI芯片產業鏈將加快成熟,相關AI芯片和服務器廠商將深度受益。另外,在應用端,我國國產大模型能力持續升級,AIGC產業未來發展前景廣闊。算力方面,推薦浪潮信息、中科曙光、紫光股份、海光信息,建議關注工業富聯、寒武紀、景嘉微;算法方面,推薦科大訊飛;應用場景方面,強烈推薦中科創達、恒生電子、盛視科技,推薦金山辦公,建議關注萬興科技、同花順、彩訊股份;網絡安全方面,強烈推薦啟明星辰。 申萬宏源證券提出,Sora為代表的多模態推理場景,會極大拉動高速算力網絡、尤其光通信的需求持續提升。疊加此前云服務廠商資本支出預增及芯片加速迭代體現海外算網高需求,國內光通信廠商基于出海邏輯有望充分獲益;高速趨勢下,關注1.6T、硅光等落地情況。關注光通信產業鏈之中際旭創、新易盛、天孚通信、華工科技、源杰科技等;算力設備產業鏈之紫光股份、銳捷網絡、中興通訊、盛科通信等。 |