歲末年初,,國內(nèi)外主流大模型的再次降價讓行業(yè)開始反思,,無限追逐更大算力集群、更多數(shù)據(jù)量是否是大模型優(yōu)化的唯一道路,。業(yè)界認為,,在與互聯(lián)網(wǎng)大廠價格比拼中不具備優(yōu)勢的創(chuàng)業(yè)公司,,迫切需要找到一條差異化道路。
效率成為行業(yè)關(guān)鍵詞
日前,,杭州深度求索人工智能基礎技術(shù)研究有限公司(DeepSeek)推出的新一代大模型DeepSeek-V3,,因其訓練成本之低引發(fā)行業(yè)熱議。從其正式發(fā)布的技術(shù)報告來看,,包括預訓練,、上下文長度外推和后訓練在內(nèi),DeepSeek-V3完整訓練只需2.788M H800 GPU小時,。假設H800 GPU的租金為每GPU小時2美元,,其總訓練成本僅為557萬美元。不過,,Deepseek也透露,,上述成本不包括與架構(gòu)、算法或數(shù)據(jù)相關(guān)的先前研究以及精簡實驗的成本,。
美國人工智能公司Anthropic的CEO達里奧·阿莫迪曾透露,,GPT-4o這樣的模型訓練成本約為1億美元,,這意味著DeepSeek的成本只有GPT-4o的1/20。
訓練成本降低的同時,,DeepSeek-V3卻保持了高性能,。根據(jù)其公告,DeepSeek-V3多項評測成績均表現(xiàn)優(yōu)秀,,性能與世界頂尖的閉源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲,。
圖為位于上海徐匯濱江的全國首個大模型創(chuàng)新生態(tài)社區(qū)“模速空間”。資料圖片
為什么DeepSeek-V3能夠?qū)崿F(xiàn)低成本,、高性能,?“包括模型架構(gòu)、基礎設施優(yōu)化,、數(shù)據(jù)優(yōu)化在內(nèi),,DeepSeek-V3從端到端都進行了工程優(yōu)化,疊加后呈現(xiàn)出很好的效果,?!盙artner研究總監(jiān)閆斌介紹說,大模型進入公眾視野時間尚短,,只有兩年多時間,。期間,行業(yè)模型訓練相對粗放,,通過盡量多收集數(shù)據(jù),,建設更大的數(shù)據(jù)中心,以獲得更好的訓練結(jié)果,,行業(yè)也用“Scaling Law”總結(jié)這一過程,。
“DeepSeek-V3證明,通過更好的工程化能力,,我們可以通過相對較少的算力資源,、較小的模型,也可以達到不錯的訓練效果,?!遍Z斌認為,“目前行業(yè)在數(shù)據(jù)和算法方面仍有優(yōu)化空間,,低成本的訓練和高效推理應用或?qū)⑹窍乱浑A段大模型發(fā)展的方向之一,。”
值得關(guān)注的是,,伯克利大學NovaSky團隊也剛剛發(fā)布了Sky-T1-32B-Preview開源模型,,在常見的推理和編碼基準測試中,與OpenAI的o1-preview“平分秋色”,。據(jù)稱,,其訓練成本不到450美元,,展示了以經(jīng)濟高效的方式復制高水平推理能力的可能性。
NovaSky團隊能夠以如此低成本進行模型訓練,,其關(guān)鍵之處包括使用了數(shù)據(jù)篩選機制,,如通過QwQ-32B-Preview生成初始數(shù)據(jù),通過GPT-4o-mini重寫數(shù)據(jù)格式等,。此外,,NovaSky團隊選擇了Qwen2.5-32B-Instruct作為基礎模型進行訓練。行業(yè)人士評價稱,,“這個項目證明,,高水平AI研發(fā)不需要天價預算?!?/p>
瑞銀證券中國軟件分析師張維璇說:“效率是2025年大模型行業(yè)的關(guān)鍵詞之一,。除了少數(shù)公司有能力、有愿景用萬卡,,乃至十萬卡繼續(xù)追求頂級大模型,,大多數(shù)公司未來要降本增效,。事實上,,優(yōu)化注意力機制、采用MOE架構(gòu),、降低模型激活的參數(shù)量等,,都已經(jīng)是很主流的降本方式。我們相信這會帶來AI門檻的降低,,以及技術(shù)的普及化,,不僅體現(xiàn)在應用側(cè),還有研發(fā)側(cè),?!?/p>
大模型創(chuàng)業(yè)公司將直面降價沖擊
伴隨著訓練成本的降低,DeepSeek-V3的API價格目前為每百萬輸入tokens 0.5元(緩存命中)/2元(緩存未命中),,每百萬輸出tokens 8元,。同時,DeepSeek提供了45天優(yōu)惠價格體驗期,,在2025年2月8日之前,,所有用戶使用DeepSeek-V3 API的價格分別下降了80%(輸入命中)、50%(輸入未命中),、75%(輸出),。
事實上,2024年上半年中國大模型價格競爭的發(fā)起者正是DeepSeek,。2024年5月,,DeepSeek率先宣布降價,,其發(fā)布的第二代MoE大模型DeepSeek-V2定為0.001元/千tokens的輸入價格與0.002元/千tokens的輸出價格。隨后,,智譜AI,、火山引擎、阿里云,、百度,、科大訊飛、騰訊云等國內(nèi)主要大模型廠商迅速跟進,。
可以看到,,2024年年底,除了DeepSeek-V3新版本的推出以及API價格調(diào)整,,國內(nèi)大模型其他廠商也在降價,。2024年12月31日,阿里云宣布2024年度第三輪大模型降價,,通義千問視覺理解模型全線降價超80%,,其中,Qwen-VL-Plus直降81%,;更高性能的Qwen-VL-Max降幅高達85%,。此前,在12月18日舉辦的火山引擎Force大會上,,字節(jié)推出的豆包視覺理解模型也宣布進行降價,。
“大模型的不斷降價,無疑有利于吸引更多企業(yè)使用新的技術(shù),,為大模型創(chuàng)業(yè)公司提供了更大的市場,。同時,這也對大模型創(chuàng)業(yè)公司構(gòu)成了挑戰(zhàn),?!毥谦F’僅僅做到提升大模型能力還不夠,還要不斷優(yōu)化算法,,快速降低模型的推理成本,。只有真正做到為用戶提供更有性價比的大模型服務,才能贏得市場份額,?!盡iniMax副總裁劉華說。
經(jīng)過一年多來的行業(yè)競爭,,中國人工智能大模型的行業(yè)格局不斷清晰,,主要玩家從“百模大戰(zhàn)”時代不斷收斂。MiniMax與智譜AI、百川智能,、月之暗面,、階躍星辰、零一萬物6家行業(yè)“獨角獸”企業(yè)估值均超10億美元,,被行業(yè)稱為國內(nèi)“大模型六小虎”,;再加上關(guān)注度較高的幻方和面壁智能,以及互聯(lián)網(wǎng)大廠中的字節(jié),、阿里,、百度和騰訊,行業(yè)主要玩家縮減到十來家,。
API接口調(diào)用付費是大模型企業(yè)B端重要商業(yè)化實現(xiàn)路徑之一,。不過,ToB業(yè)務中,,由于互聯(lián)網(wǎng)大廠可以將AI功能綁定算力和云服務業(yè)務,,二者疊加商業(yè)推廣效率更高。因此,,在“價格戰(zhàn)”中,,大廠因為業(yè)務復合、資金雄厚,,也更有優(yōu)勢,。面對價格競爭,創(chuàng)業(yè)公司只能化壓力為動力,,從加快迭代模型,、不斷優(yōu)化算法中尋找解法,。
“如果要拼低價和資源,,創(chuàng)業(yè)公司肯定不如大廠。下一步,,大模型創(chuàng)業(yè)公司可以聚焦在提供個性化服務,,比如提供情感類大模型的API接口?!毙袠I(yè)人士對記者表示,。
“獨角獸”還需差異化發(fā)展
無疑,大模型訓練成本,、推理成本的下降,,將進一步加快行業(yè)場景應用落地。事實上,,尋找更合適的大規(guī)模落地場景,、更好的商業(yè)閉環(huán)模式,已經(jīng)成為大模型企業(yè)下一階段發(fā)展的當務之急,。
在接受采訪時,,多位行業(yè)人士提到,,上述“大模型六小虎”開始出現(xiàn)分化,已有獨角獸企業(yè)出現(xiàn)“掉隊”勢頭,,“這也說明,,大模型行業(yè)發(fā)展遇到了瓶頸?!?/p>
“從全球來看,,大模型企業(yè)都面臨一定的融資壓力。大模型出現(xiàn)之初,,大家對它的預期很高,,后面又經(jīng)歷了預期的回調(diào)。與此同步,,行業(yè)融資熱度稍降,。當然這也符合一項新技術(shù)的發(fā)展曲線。單純通過講故事已經(jīng)很難找到投資人,?!遍Z斌表示。
從B端應用來看,,Gartner的一份最新調(diào)研結(jié)果顯示,,截至2024年6月,只有8%的中國企業(yè)將生成式人工智能部署在生產(chǎn)環(huán)境中,。對此,,閆斌解釋稱,目前大模型在中國企業(yè)生產(chǎn)場景中小規(guī)模落地已出現(xiàn),,但大規(guī)模企業(yè)落地仍然較為少見,。“如果把最終落地應用比作一場考試,,那么大模型能力,、數(shù)據(jù)、工程化,、產(chǎn)品設計將是幾門關(guān)鍵課程,。根據(jù)我們觀察,國內(nèi)很多大模型能力已經(jīng)不錯,,目前落地短板更聚焦在其他幾個方面,。”
再來看C端的落地情況,。根據(jù)AI產(chǎn)品榜數(shù)據(jù),,目前用戶量排名靠前的應用分別為抖音的豆包、MiniMax的Talkie AI、月之暗面的Kimi智能助手,、百度的文小言,,全球2024年12月的月活分別為7117萬、2977萬,、1669萬,、1347萬,在全球主要C端產(chǎn)品榜單中,,分別位列第2位,、第4位、第15位,、第20位,。
與創(chuàng)業(yè)“獨角獸”相比,“大廠”在C端應用推廣上,,展示出了流量和資本方面的巨大優(yōu)勢,。字節(jié)2024年5月才推出AI對話助手“豆包”,憑借投流買量后來居上,,成為過去半年增長最快的移動應用,。“一些創(chuàng)業(yè)公司此前通過投流買量的方式迅速擴大了用戶量,。但隨著‘大廠’下場,,這種做法就顯得不那么劃算了?!庇行袠I(yè)人士對記者表示,。
“目前國內(nèi)大模型企業(yè)的C端產(chǎn)品存在‘同質(zhì)化’的問題,很多企業(yè)都推出了AI對話助手類產(chǎn)品,,功能大同小異,。但是,大模型技術(shù)在不斷迭代,。各家企業(yè)需要基于大模型能力的提升趨勢,,去探索新的AI產(chǎn)品形態(tài),去滿足客戶尚未被滿足的需要,。尤其是創(chuàng)業(yè)公司,更是要把資源聚焦于技術(shù)和產(chǎn)品的創(chuàng)新,,而不是通過投流買量進入變成‘紅?!馁惖馈,!眲⑷A說,。