DeepSeek-R1模型帶來一場AI風暴（受益概念股）

2025-2-6 09:35| 發布者: admin| 查看: 56| 評論: 0

摘要: 2月5日，蛇年第一個交易日迎來科技股的全面爆發，軟件、傳媒、半導體、IT設備等板塊集體上漲。特別是AI概念股，DeepSeek概念股、華為算力、智譜AI等題材表現十分強勢，批量DeepSeek概念股漲停。 ...

2月5日，蛇年第一個交易日迎來科技股的全面爆發，軟件、傳媒、半導體、IT設備等板塊集體上漲。特別是AI概念股，DeepSeek概念股、華為算力、智譜AI等題材表現十分強勢，批量DeepSeek概念股漲停。

春節假期，DeepSeek-R1模型帶來一場AI風暴，不僅展示了低成本實現頂尖AI大模型能力的技術路徑，還全面拔高了國產大模型、開源大模型的上限。

正是看到了DeepSeek模型的強大實力和廣闊應用空間，國內外主流云服務平臺快速上線DeepSeek模型，幫助用戶快速、便捷部署R1模型。同時，DeepSeek應用程序每日活躍用戶急速增長并跨越2000萬大關，并成為多個地區用戶熱衷的大模型APP。

早在去年12月26日，深度求索便發布DeepSeek-V3并同步開源，該模型能力與GPT-4o以及Claude-3.5-Sonnet等主流大模型不相上下，但在訓練成本及訓練效率方面展現出了明顯的優勢。

為了應對DeepSeek的強力競爭，OpenAI快速上線o3-mini推理模型和Deep Research。

1、DeepSeek掀起開源大模型風暴，AI巨頭加速行業發展

一直以來，OpenAI、Anthropic等AI巨頭不斷推動閉源大模型的發展。開源大模型也有長足的進步，但一直被閉源大模型壓制。

隨著深度求索（DeepSeek）接連上線DeepSeek-V3、DeepSeek-R1大模型，天平開始向開源大模型傾斜。更讓整個科技界驚訝的是，DeepSeek可以通過低成本算力預算來實現較高的模型能力。

全球AI巨頭在春節期間全面探索DeepSeek的技術路線，這也進一步顯示國產AI大模型的綜合實力已經追上國際先進水平。

1月20日，DeepSeek-R1重磅發布，模型性能堪比OpenAI-o1大模型，在編程、數學運算等復雜任務方面比肩o1正式版。

更讓用戶驚訝的是，R1模型License統一使用MIT，這就意味著該模型完全開源、不限制商用。R1模型還允許用戶通過蒸餾模型的方式訓練其他模型，API服務定價也極為低廉，每百萬輸入tokens 僅需1 元（緩存命中）/ 4 元（緩存未命中），每百萬輸出tokens僅需16元，較OpenAI-o1大模型定價大幅降低。

早在2024年12月，深度求索（DeepSeek）正式上線并開源全新系列模型 DeepSeek-V3，性能優于Llama-3.1-405B等開源大模型，已經媲美GPT-4o以及Claude-3.5-Sonnet等主流大模型。

根據深度求索官方發布的信息，DeepSeek-V3采用了混合專家架構（MoE），該架構包含了256個專家，每次推理將動態選擇前8個專家來參加計算，這可以提升計算效率。

DeepSeek-V3大模型總參數量高達6850億，每次推理將激活370億參數。V3在14.8萬億token上進行了預訓練，整體訓練效率極高，這顯著降低了訓練成本。根據DeepSeek透露的數據，DeepSeek-V3大模型訓練僅用了約兩個月的時間，成本約為558萬美元。

DeepSeek為大模型訓練打造了一條高速通道，這背后就有很多創新的技術。在框架方面，DeepSeek打造了HAI-LLM框架，可以實現16路流水線、64路專家模塊并行，還創新使用多令牌預測（MTP）。通過設立了MTP訓練目標，DeepSeek突破了傳統大模型訓練的束縛。再加上監督微調與強化學習兩個階段深入的打磨，DeepSeek-V3進一步提升了能力。

隨著DeepSeek低成本、高效率大模型展現了強大的競爭力，未來AI大模型將進一步賦能更多的行業。

2、DeepSeek吸引眾多用戶，國內多家公司與DeepSeek展開合作

1月15日，DeepSeek就已經發布DeepSeek APP，憑借著強大的模型能力吸引海量用戶下載并使用DeepSeek模型。

在1月26日上線蘋果App Store之后，DeepSeek應用程序便迅速成為多國熱門應用，甚至占據140個國家蘋果App Store下載排行榜首位。

在DeepSeek APP發布20天之際，應用軟件日活規模已超2000萬，表現遠好于ChatGPT APP。

國內主流云服務平臺也快速上線DeepSeek V3和R1大模型，方便用戶快速部署該模型。根據華為云2月1日的消息，在硅基流動和華為云團隊的努力下，基于華為云昇騰云服務的R1/V3推理服務正式上線，可以讓模型在規模生產環境中穩定運行。

隨后，騰訊云也宣布DeepSeek-R1大模型一鍵部署至騰訊云HAI（騰訊云高性能應用服務）上，用戶可以省去買卡、安裝驅動、配置網絡等一系列繁瑣步驟，僅用3分鐘便可以調用R1大模型。

360數字安全對外表示，安全大模型正式接入DeepSeek，通過強化學習等技術訓練“DeepSeek版”安全大模型。

2月3日，百度智能云、阿里云也宣布正式上架DeepSeek-R1和 DeepSeek-V3模型，方便用戶快速調用。

除了國內科技廠商，國際科技巨頭也積極擁抱DeepSeek模型。1月底，英偉達便宣布NIM微服務上線DeepSeek R1 671b版本的預覽版。微軟也將DeepSeek-R1整合至其企業級AI服務平臺，亞馬遜云平臺也可以使用該模型。AMD與SGLang、DeepSeek團隊緊密合作，迅速將DeepSeek-V3集成至Instinct MI300X GPU之中。

根據iFinD金融數據終端，DeepSeek概念股包括：海光信息、三六零、杭鋼股份、萬興科技、天娛數科、每日互動、夢網科技、美格智能、安恒信息、安凱微、青云科技等。

路過

雷人

握手

鮮花

雞蛋

收藏分享邀請

		自動登錄	找回密碼
密碼			立即注冊

DeepSeek-R1模型帶來一場AI風暴（受益概念股）

相關閱讀

相關分類

下級分類