侃股網-股民首選股票評論門戶網站

     找回密碼
     立即注冊

    QQ登錄

    只需一步,快速開始

    搜索
    熱搜:

    性能堪比GPT-4o,DeepSeek-V3刷屏了!算力行業迎來機遇期(受益概念股) ...

    2024-12-31 09:13| 發布者: admin| 查看: 235| 評論: 0

    摘要: DeepSeek-V3在能力上已經與GPT-4o以及Claude-3.5-Sonnet等主流大模型不相上下,但在訓練成本及訓練效率方面展現出了明顯的優勢。深度求索用了兩個月的時間,花費約558萬美元,實現了較高的訓練效率。 ...
    根據深度求索官方消息,12月26日,公司全新系列模型DeepSeek-V3重磅發布并同步開源。

    根據專業測評報告,DeepSeek-V3在能力上已經與GPT-4o以及Claude-3.5-Sonnet等主流大模型不相上下,但在訓練成本及訓練效率方面展現出了明顯的優勢。深度求索用了兩個月的時間,花費約558萬美元,實現了較高的訓練效率。

    隨著國內AI大模型進一步發展,尤其是AI消費電子產品逐漸成為熱點,算力產業鏈有望迎來機遇。

    1、DeepSeek-V3首個版本正式發布,AI大模型再成焦點

    12月以來,AI行業持續迎來重磅事件,前有OpenAI發布完全版o1模型、蘋果在國內尋找大模型供應商,后有深度求索(DeepSeek)正式上線并開源全新系列模型 DeepSeek-V3。

    盡管深度求索此前并未被市場廣泛關注,但是DeepSeek-V3的綜合表現已經與多個主流AI大模型不相上下。

    根據深度求索官方發布的信息,DeepSeek-V3采用了混合專家架構(MoE),該架構包含了256個專家,每次推理將動態選擇前8個專家來參加計算,這可以提升計算效率。

    我們試用了DeepSeek-V3,大模型應答速度較快,并提供了深度思考和聯網搜索兩種模式,任務處理能力較好。

    DeepSeek-V3大模型總參數量高達6850億,每次推理將激活370億參數。DeepSeek-V3在14.8萬億token上進行了預訓練,整體訓練效率極高,這顯著降低了訓練成本。

    根據DeepSeek透露的數據,DeepSeek-V3大模型訓練僅用了約兩個月的時間,成本約為558萬美元。

    DeepSeek為大模型訓練打造了一條高速通道,這背后就有很多創新的技術。在框架方面,DeepSeek打造了HAI-LLM框架,可以實現16路流水線、64路專家模塊并行,還創新使用多令牌預測(MTP)。通過設立了MTP訓練目標,DeepSeek突破了傳統大模型訓練的束縛。再加上監督微調與強化學習兩個階段深入的打磨,DeepSeek-V3進一步提升了能力。

    根據官方公布的測評結果,DeepSeek-V3在多項測評均優于Llama-3.1-405B等開源大模型,在性能上已經媲美GPT-4o以及Claude-3.5-Sonnet等主流大模型。

    獨立評測網站Artificial Analysis認為,DeepSeek-V3質量指數達到80,優于平均水平。在價格方面,DeepSeek-V3更具有優勢,每百萬個Token的價格為0.48美元。

    隨著DeepSeek-V3等低成本、高效率大模型展現了強大的競爭力,未來AI大模型將進一步賦能更多的行業。

    2、AI應用和AI消費電子產品發展迅速,算力行業迎來機遇

    此前國內獨角獸企業智譜AI憑借出色的智能體AutoGLM,獲得了市場高度關注。用戶只需要對手機說話,便可以實現網絡購物、訂購火車票、點外賣、發微信、搶紅包等功能,公司也已經獲得了淘寶、微信、美團等APP的授權。

    智譜AI已經與國內手機廠商展開了深入的合作,其中就包括榮耀。早在今年9月,榮耀CEO趙明便表示,榮耀Magic7將是首款中國消費者可以體驗AI Agent的手機。榮耀此前發布個人化全場景AI操作系統MagicOS 9.0,宣布將YOYO助理升級為智能體,具備“自然語義理解和計算機視覺”、“用戶行為習慣學習和場景環境感知”、“意圖識別及決策能力”、“應用內及跨應用操作”四大核心能力。

    根據界面新聞的報道,蘋果將在中國銷售的iPhone中接入本土AI大模型,目前與騰訊和字節跳動進行洽談。此前財經媒體報道,蘋果與百度達成合作協議,計劃在2025年推出生成式人工智能服務,雙方有望在端側小模型及云端大模型展開合作。

    蘋果接洽騰訊、字節跳動的消息,瞬間成為資本市場焦點。眾所周知,騰訊和字節跳動均在人工智能大模型領域擁有深厚的技術積累,分別推出了混元大模型和豆包大模型。在2024火山引擎FORCE原動力大會上,字節跳動升級了豆包大模型產品,發布了視覺理解模型,視覺生成模型也將在2025年1月對外開放。

    蘋果近期加速了AI功能落地,這也成為9月發布的iPhone 16最強殺手锏。美國當地時間10月28日,蘋果公司在美國正式推送iOS 18.1正式版,Apple Intelligence集成在iOS 18.1。同時iPadOS 18.1和macOS Sequoia 15.1也對外推送,符合條件的用戶將在iPad、Mac上使用蘋果AI。

    隨著AI應用及AI消費電子產品不斷發展,算力產業鏈將迎來機遇期。

    根據iFinD金融數據終端,算力概念股包括:工業富聯、寒武紀、中興通訊、海光信息、科大訊飛、中科曙光、中國移動、光啟技術、紫光股份、浪潮信息、中國能建、寶信軟件、昆侖萬維、中國長城、軟通動力、龍芯中科等。

    路過

    雷人

    握手

    鮮花

    雞蛋

    相關閱讀

    ?
    侃股網簡介|手機版|網站地圖|友情鏈接|
    返回頂部