計算機行業周報:DeepSeek開啟大模型產業變革,AI應用加速推進
市場回顧
過去一周(2.3-2.7)上證綜指上漲1.63%,創業板指上漲5.36%,上漲1.98%,計算機(申萬)指數上漲13.47%,跑贏上證綜指11.84個百分點,跑贏創業板指8.11個百分點,跑贏滬深300指數11.49個百分點,位列全行業第1名。
周觀點
DeepSeek持續火熱,雲服務及芯片大廠紛紛力挺。1月20日,DeepSeek發布全新的開源推理大模型DeepSeek-R1,在數學、編程和推理等多個任務上達到了與OpenAI o1相當的表現水平。2月8日,QuestMobile數據顯示,DeepSeek在1月28日的日活躍用戶數首次超越豆包,隨後在2月1日突破3000萬大關,成為史上最快達成這一裏程碑的應用。DeepSeek的AI大模型持續火熱,全球眾多的科技大廠紛紛下場對DeepSeek模型進行支持。國內方麵,據智東西,截至2月7日,已有包括華為昇騰在內的16家國產AI芯片企業相繼宣布適配或上架DeepSeek模型服務,華為雲在內的10家國內雲計算巨頭以及至少12家獨立雲及智算企業均宣布對DeepSeek的支持。海外方麵,亞馬遜AWS、微軟等雲服務大廠紛紛上線基於DeepSeek模型的雲服務,英偉達、AMD、英特爾等芯片大廠紛紛完成對於DeepSeek模型的適配。
DeepSeek以模型開源推動AI平權,促進AI應用生態繁榮。DeepSeek憑借“低成本+高性能”模型全球破圈,通過“模型架構創新”和“軟硬件協同工程優化”將大模型訓練成本大幅度降低。DeepSeek早前發布的V3模型每訓練1萬億tokens僅需在2048塊H800GPU集群上耗時3.7天,總計278萬GPU小時、557.6萬美元的訓練成本,約為GPT-o1的1/20、Llama3.1的1/10;新發布的R1模型API服務價格為每百萬輸入tokens1-4元、每百萬輸出tokens16元,遠低於同期OpenAI o1API定價水平,且在邏輯、數學及中文任務中表現優異。通過最開放的MIT開源協議,和將推理大模型蒸餾給開源小模型等一係列工程方法,DeepSeek為業界帶來低成本的端側模型商品。我們認為,DeepSeek開源低成本的高性能模型,有望促進AI平權,加速AI應用的爆發,帶動推理算力需求加速釋放。
AI競賽加劇,穀歌發布Gemini2.0。2月5日,穀歌發布AI模型套件Gemini2.0,包含適用於大規模且高頻率任務的Gemini2.0Flash、具有最佳編程性能與處理複雜任務能力的Gemini2.0Pro Experimental以及極具性價比的Gemini2.0Flash-Lite,還有大幅提升推理能力的Gemini2.0Flash Thinking模型。在Chatbot Arena大模型排行榜上,Gemini2.0Flash Thinking實驗版和Gemini2.0Pro實驗版位居榜首,綜合得分超過ChatGPT-4o和DeepSeek-R1。我們認為,以字節為代表的國產大模型崛起,有望拉動國內互聯網大廠在算力端的支出,字節搶跑之後,騰訊、阿裏、京東、快手或將開啟追趕模式,國內算力競賽剛剛開始,國產AI算力鏈將持續景氣。
投資建議
建議關注:(1)AI算力:、、、、、、、、、、等;(2)AI應用:、、、、、、、、、、、軟通動力、中軟國際、等。
風險提示
下遊景氣度不及預期;政策推進不及預期;技術創新不及預期、行業競爭加劇。
