侃股網-股民首選股票評論門戶網站

     找回密碼
     立即注冊

    QQ登錄

    只需一步,快速開始

    搜索
    熱搜:

    DeepSeek-R1模型帶來一場AI風暴(受益概念股)

    2025-2-6 09:35| 發布者: admin| 查看: 56| 評論: 0

    摘要: 2月5日,蛇年第一個交易日迎來科技股的全面爆發,軟件、傳媒、半導體、IT設備等板塊集體上漲。特別是AI概念股,DeepSeek概念股、華為算力、智譜AI等題材表現十分強勢,批量DeepSeek概念股漲停。 ...
    2月5日,蛇年第一個交易日迎來科技股的全面爆發,軟件、傳媒、半導體、IT設備等板塊集體上漲。特別是AI概念股,DeepSeek概念股、華為算力、智譜AI等題材表現十分強勢,批量DeepSeek概念股漲停。

    春節假期,DeepSeek-R1模型帶來一場AI風暴,不僅展示了低成本實現頂尖AI大模型能力的技術路徑,還全面拔高了國產大模型、開源大模型的上限。

    正是看到了DeepSeek模型的強大實力和廣闊應用空間,國內外主流云服務平臺快速上線DeepSeek模型,幫助用戶快速、便捷部署R1模型。同時,DeepSeek應用程序每日活躍用戶急速增長并跨越2000萬大關,并成為多個地區用戶熱衷的大模型APP。

    早在去年12月26日,深度求索便發布DeepSeek-V3并同步開源,該模型能力與GPT-4o以及Claude-3.5-Sonnet等主流大模型不相上下,但在訓練成本及訓練效率方面展現出了明顯的優勢。

    為了應對DeepSeek的強力競爭,OpenAI快速上線o3-mini推理模型和Deep Research。

    1、DeepSeek掀起開源大模型風暴,AI巨頭加速行業發展

    一直以來,OpenAI、Anthropic等AI巨頭不斷推動閉源大模型的發展。開源大模型也有長足的進步,但一直被閉源大模型壓制。

    隨著深度求索(DeepSeek)接連上線DeepSeek-V3、DeepSeek-R1大模型,天平開始向開源大模型傾斜。更讓整個科技界驚訝的是,DeepSeek可以通過低成本算力預算來實現較高的模型能力。

    全球AI巨頭在春節期間全面探索DeepSeek的技術路線,這也進一步顯示國產AI大模型的綜合實力已經追上國際先進水平。

    1月20日,DeepSeek-R1重磅發布,模型性能堪比OpenAI-o1大模型,在編程、數學運算等復雜任務方面比肩o1正式版。

    更讓用戶驚訝的是,R1模型License統一使用MIT,這就意味著該模型完全開源、不限制商用。R1模型還允許用戶通過蒸餾模型的方式訓練其他模型,API服務定價也極為低廉,每百萬輸入tokens 僅需1 元(緩存命中)/ 4 元(緩存未命中),每百萬輸出tokens僅需16元,較OpenAI-o1大模型定價大幅降低。

    早在2024年12月,深度求索(DeepSeek)正式上線并開源全新系列模型 DeepSeek-V3,性能優于Llama-3.1-405B等開源大模型,已經媲美GPT-4o以及Claude-3.5-Sonnet等主流大模型。

    根據深度求索官方發布的信息,DeepSeek-V3采用了混合專家架構(MoE),該架構包含了256個專家,每次推理將動態選擇前8個專家來參加計算,這可以提升計算效率。

    DeepSeek-V3大模型總參數量高達6850億,每次推理將激活370億參數。V3在14.8萬億token上進行了預訓練,整體訓練效率極高,這顯著降低了訓練成本。根據DeepSeek透露的數據,DeepSeek-V3大模型訓練僅用了約兩個月的時間,成本約為558萬美元。

    DeepSeek為大模型訓練打造了一條高速通道,這背后就有很多創新的技術。在框架方面,DeepSeek打造了HAI-LLM框架,可以實現16路流水線、64路專家模塊并行,還創新使用多令牌預測(MTP)。通過設立了MTP訓練目標,DeepSeek突破了傳統大模型訓練的束縛。再加上監督微調與強化學習兩個階段深入的打磨,DeepSeek-V3進一步提升了能力。

    隨著DeepSeek低成本、高效率大模型展現了強大的競爭力,未來AI大模型將進一步賦能更多的行業。

    2、DeepSeek吸引眾多用戶,國內多家公司與DeepSeek展開合作

    1月15日,DeepSeek就已經發布DeepSeek APP,憑借著強大的模型能力吸引海量用戶下載并使用DeepSeek模型。

    在1月26日上線蘋果App Store之后,DeepSeek應用程序便迅速成為多國熱門應用,甚至占據140個國家蘋果App Store下載排行榜首位。

    在DeepSeek APP發布20天之際,應用軟件日活規模已超2000萬,表現遠好于ChatGPT APP。

    國內主流云服務平臺也快速上線DeepSeek V3和R1大模型,方便用戶快速部署該模型。根據華為云2月1日的消息,在硅基流動和華為云團隊的努力下,基于華為云昇騰云服務的R1/V3推理服務正式上線,可以讓模型在規模生產環境中穩定運行。

    隨后,騰訊云也宣布DeepSeek-R1大模型一鍵部署至騰訊云HAI(騰訊云高性能應用服務)上,用戶可以省去買卡、安裝驅動、配置網絡等一系列繁瑣步驟,僅用3分鐘便可以調用R1大模型。

    360數字安全對外表示,安全大模型正式接入DeepSeek,通過強化學習等技術訓練“DeepSeek版”安全大模型。

    2月3日,百度智能云、阿里云也宣布正式上架DeepSeek-R1和 DeepSeek-V3模型,方便用戶快速調用。

    除了國內科技廠商,國際科技巨頭也積極擁抱DeepSeek模型。1月底,英偉達便宣布NIM微服務上線DeepSeek R1 671b版本的預覽版。微軟也將DeepSeek-R1整合至其企業級AI服務平臺,亞馬遜云平臺也可以使用該模型。AMD與SGLang、DeepSeek團隊緊密合作,迅速將DeepSeek-V3集成至Instinct MI300X GPU之中。

    根據iFinD金融數據終端,DeepSeek概念股包括:海光信息、三六零、杭鋼股份、萬興科技、天娛數科、每日互動、夢網科技、美格智能、安恒信息、安凱微、青云科技等。


    路過

    雷人

    握手

    鮮花

    雞蛋

    相關閱讀

    ?
    侃股網簡介|手機版|網站地圖|友情鏈接|
    返回頂部