如果說(shuō)2023年是大模型的資格賽,融資額度決定了能否晉級(jí),2024年已然快進(jìn)到了淘汰賽的階段。
字節(jié)跳動(dòng)、阿里云、百度智能云、騰訊云等先后在5月中下旬加入“價(jià)格戰(zhàn)”,輕量級(jí)模型直接免費(fèi),主力模型的API價(jià)格普遍下調(diào)了90%以上。曾經(jīng)以“燒錢(qián)”著稱(chēng)的大模型,迅速進(jìn)入到“白菜價(jià)”時(shí)代。
當(dāng)時(shí)就有人提出這樣的問(wèn)題:大廠選擇“燒錢(qián)狂飆”,大模型創(chuàng)業(yè)公司怎么辦?
時(shí)間過(guò)去半個(gè)多月,幾家獨(dú)角獸級(jí)的大模型創(chuàng)業(yè)者紛紛表明了態(tài)度:智譜AI果斷跟進(jìn),一個(gè)月里兩次下調(diào)價(jià)格;MiniMax悄然啟動(dòng)了注冊(cè)認(rèn)證贈(zèng)送1億tokens,以及TPM擴(kuò)容不收費(fèi)的活動(dòng);百川智能創(chuàng)始人王小川公開(kāi)表態(tài)不會(huì)跟風(fēng)降價(jià);零一萬(wàn)物CEO李開(kāi)復(fù)直言“國(guó)內(nèi)大模型市場(chǎng)瘋狂降價(jià)是雙輸?shù)拇蚍?rdquo;。
作為大模型行業(yè)真正意義上的“第一戰(zhàn)”,大廠們不計(jì)成本的拼價(jià)格,到底會(huì)對(duì)初創(chuàng)企業(yè)產(chǎn)生什么樣的影響?
三種可能的結(jié)果
截止到目前,大模型降價(jià)潮還在蔓延中,市場(chǎng)格局的變化至少需要半年乃至更長(zhǎng)時(shí)間。但在故事塵埃落定前,并不難揣測(cè)一些可能的結(jié)局。
第一種比較理想化的結(jié)果:大模型降價(jià)利好開(kāi)發(fā)者,AI原生應(yīng)用加速爆發(fā),逐漸從量變引發(fā)質(zhì)變。
目前大多數(shù)中小企業(yè)和個(gè)人開(kāi)發(fā)者是通過(guò)API接口來(lái)調(diào)用大模型能力的,瘋狂降價(jià)前的價(jià)格普遍在0.02元/千tokens上下,對(duì)于缺少盈利模式的開(kāi)發(fā)者來(lái)說(shuō),算力成本儼然是一座沉重的大山。
大模型降價(jià)甚至免費(fèi),意味著開(kāi)發(fā)者的成本曲線將大幅下降,促使開(kāi)發(fā)者更低成本進(jìn)行開(kāi)發(fā)、試錯(cuò),進(jìn)而打造出更多的AI原生應(yīng)用,讓大模型能力滲透到更多場(chǎng)景中。也許當(dāng)下的應(yīng)用仍存在同質(zhì)化,主要以智能助手和情感陪伴為主,卻不乏從量變引發(fā)質(zhì)變,孕育出超級(jí)應(yīng)用的可能。
可以佐證的是,百度宣布ERNIESpeed和ERNIELite免費(fèi)開(kāi)放使用后,兩款模型的日調(diào)用量翻了10倍。有點(diǎn)像移動(dòng)互聯(lián)網(wǎng)早期的一幕,因?yàn)檫\(yùn)營(yíng)商下調(diào)了流量費(fèi),用戶(hù)開(kāi)始嘗試各種新奇應(yīng)用,最終迎來(lái)了百花齊放的繁榮景象。而在一個(gè)生機(jī)勃勃的生態(tài)里,每個(gè)大模型廠商都將是受益者。
第二種更符合現(xiàn)實(shí)的結(jié)果:部分缺少“護(hù)城河”的大模型廠商被淘汰,算力、人才和資本越來(lái)越集中。
一種較為流行的觀點(diǎn)是:誰(shuí)的用戶(hù)多,產(chǎn)生的數(shù)據(jù)就越豐富,投喂給大模型的“飼料”就越多,越有可能訓(xùn)練出更好的AI。大模型廠商降價(jià)的目的,是為了吸引更多人使用,將用戶(hù)的真實(shí)使用數(shù)據(jù)反哺給大模型,然后進(jìn)行訓(xùn)練迭代。
資本市場(chǎng)的謹(jǐn)慎態(tài)度,讓“百模大戰(zhàn)”的局面曇花一現(xiàn),但不少拿到了融資的中腰部創(chuàng)業(yè)者,仍在煉模型這件事上苦苦掙扎。頭部玩家們打出的價(jià)格牌,有望讓部分搖擺的創(chuàng)業(yè)者放棄自研大模型,將注意力轉(zhuǎn)移到應(yīng)用層或其他領(lǐng)域,避免大模型在底層硬件、軟件等方面的重復(fù)建設(shè),推動(dòng)整個(gè)行業(yè)朝同一個(gè)方向發(fā)力。
不管是出于什么樣的考量,行業(yè)集中度的提升都不是什么壞消息。大模型屬于極限考驗(yàn)算力資源和人才密度的賽道,即使“百模大戰(zhàn)”沒(méi)有上演,活躍的大模型廠商仍然多達(dá)兩位數(shù),還需要進(jìn)一步優(yōu)勝劣汰。
第三種相對(duì)悲觀的結(jié)果:價(jià)格戰(zhàn)是同質(zhì)化的表現(xiàn),當(dāng)價(jià)格成為市場(chǎng)的主導(dǎo)力量,將上演“圈地運(yùn)動(dòng)”。
網(wǎng)約車(chē)、外賣(mài)、社區(qū)團(tuán)購(gòu)等移動(dòng)互聯(lián)網(wǎng)時(shí)期的經(jīng)典戰(zhàn)役,無(wú)不經(jīng)歷了價(jià)格戰(zhàn)的階段,且或多或少是同質(zhì)化競(jìng)爭(zhēng)導(dǎo)致的。倘若大模型卷性能帶來(lái)的收益越來(lái)越低,而且能力大同小異的時(shí)候,價(jià)格無(wú)疑是攻城略地的有效手段。
可能在一些人眼中,大模型的關(guān)鍵在于效果,比起價(jià)格,客戶(hù)更在意落地帶來(lái)的價(jià)值。這樣的觀點(diǎn)沒(méi)有錯(cuò),卻忽略了價(jià)格戰(zhàn)的時(shí)機(jī):如果企業(yè)已經(jīng)深入使用了一段時(shí)間,價(jià)格上的差異很難撬走客戶(hù);如果客戶(hù)還處于選型的階段,誰(shuí)能吸引到更多的客戶(hù),誰(shuí)就在競(jìng)爭(zhēng)中拿到了先手棋。
借用智源研究院總工程師林詠華的說(shuō)法:“大模型的降價(jià)潮是一場(chǎng)生態(tài)的爭(zhēng)奪戰(zhàn)。當(dāng)一家企業(yè)已經(jīng)適配了一個(gè)模型,他未必還愿意再去適配更換另一個(gè),在更換成本客觀存在的前提下,行業(yè)企業(yè)會(huì)希望先通過(guò)價(jià)格的方式拉攏一批用戶(hù)。”沿循這樣的邏輯,大模型的價(jià)格戰(zhàn)和網(wǎng)約車(chē)、共享單車(chē)等并無(wú)本質(zhì)的區(qū)別,都是一場(chǎng)有預(yù)謀的“圈地運(yùn)動(dòng)”,不過(guò)是目標(biāo)對(duì)象不同而已。
客觀的說(shuō),大模型價(jià)格的下降是必然的結(jié)果,畢竟推理成本下降了。就像百度創(chuàng)始人李彥宏在 Create 2024 百度 AI 開(kāi)發(fā)者大會(huì)上提到的:“相比一年前,文心大模型推理的成本降到了原來(lái)的1%。”
問(wèn)題在于,國(guó)內(nèi)大模型的價(jià)格幾乎是斷崖式的,并未給大模型創(chuàng)業(yè)者足夠的緩沖時(shí)間,尚未找到行之有效的盈利方式。
這場(chǎng)價(jià)格戰(zhàn)中最活躍的選手,基本都是云廠商,降價(jià)乃至免費(fèi)獲取到的客戶(hù),可以通過(guò)模型微調(diào)、模型部署以及各種配套云服務(wù)對(duì)沖成本。而大模型創(chuàng)業(yè)者缺少足夠厚的生態(tài),甚至要向云廠商租賃算力,API的商業(yè)模式被“切斷”后,短期內(nèi)恐怕難以實(shí)現(xiàn)“自我造血”。
無(wú)論以哪一種結(jié)果收?qǐng)?,大模型?chuàng)業(yè)者都是弱勢(shì)的一方。
怎么才能活下來(lái)
歷史經(jīng)驗(yàn)告訴我們,在充滿(mǎn)不確定的賽道里,從來(lái)都沒(méi)有穩(wěn)操勝券的戰(zhàn)局。大模型的背后是一場(chǎng)萬(wàn)億級(jí)的資本盛宴,比起場(chǎng)上的幾家云廠商,初創(chuàng)企業(yè)的想象空間更大,總有人希望他們可以留在牌桌上。
云廠商推波助瀾的價(jià)格戰(zhàn),無(wú)疑會(huì)加重大模型初創(chuàng)企業(yè)的危機(jī)感,但并不意味著沒(méi)有破局的可能。
對(duì)策一:技術(shù)側(cè)破局,在大模型性能上搶先打破天花板,或者在大模型的落地部署上找到最優(yōu)解。
按照獵豹移動(dòng)董事長(zhǎng)傅盛的說(shuō)法:“短期來(lái)看,大模型的性能遇到了瓶頸。誰(shuí)也甩不開(kāi)誰(shuí),誰(shuí)也拿不出撒手锏,降低推理成本、降低售價(jià)成了現(xiàn)在每一家的高優(yōu)先級(jí)任務(wù)”。撥開(kāi)價(jià)格戰(zhàn)迷霧最好的方式,正是在大模型性能上甩開(kāi)對(duì)手。面對(duì)不明晰的技術(shù)路線,不乏“運(yùn)氣”的成分,但初創(chuàng)企業(yè)往往更有“賭”的勇氣。
即使不能在性能上拉開(kāi)太大差距,提升大模型工程化能力也是一個(gè)可行方向。目前API調(diào)用的是“標(biāo)準(zhǔn)版模型”,想要將大模型能力和場(chǎng)景深度融合的企業(yè)類(lèi)用戶(hù),仍需要對(duì)大模型進(jìn)行精調(diào)或本地化部署。如果能夠進(jìn)一步降低大模型的落地門(mén)檻和成本,不無(wú)對(duì)沖“價(jià)格戰(zhàn)”沖擊的可能。
這也是一些大模型創(chuàng)業(yè)者正在嘗試的應(yīng)對(duì)方案。比如智譜AI在MaaS 2.0大模型開(kāi)放平臺(tái)上推出的一鍵微調(diào)功能,用戶(hù)僅需準(zhǔn)備訓(xùn)練數(shù)據(jù),不需要代碼即可完成一個(gè)“私有大模型”的訓(xùn)練。
對(duì)策二:專(zhuān)注提升大模型的差異化能力,做云廠商的“ISV服務(wù)商”,低姿態(tài)熬過(guò)大模型浪潮的淘汰賽。
鑒于隱私、安全、性能等種種因素,行業(yè)內(nèi)一直存在“模型混用”的現(xiàn)象,即在不同場(chǎng)景調(diào)用不同的大模型。在各家模型能力水平相近、價(jià)格不相上下的情況下,打造某一塊的“比較優(yōu)勢(shì)”,同樣是一種活法。
況且阿里云、百度智能云等云廠商,也在“拉攏”大模型創(chuàng)業(yè)者:一方面在算力資源上和大模型廠商綁定,比如阿里云對(duì)MiniMax、月之暗面的投資,都將一部分資金限定用于購(gòu)買(mǎi)阿里云服務(wù);另一方面積極布局一站式大模型開(kāi)發(fā)及服務(wù)運(yùn)行平臺(tái),比如百度智能云千帆大模型平臺(tái),用戶(hù)可以同時(shí)調(diào)用不同大模型的能力。至少就現(xiàn)階段而言,沒(méi)有云廠商愿意為了大模型的“芝麻”,丟了云服務(wù)的“西瓜”。
就像許多行業(yè)曾出現(xiàn)的,價(jià)格戰(zhàn)常常是行業(yè)進(jìn)入“大混戰(zhàn)”的標(biāo)志。對(duì)于那些沒(méi)有拿到巨額融資的大模型創(chuàng)業(yè)者,以ISV服務(wù)商的身份“茍活”,熬過(guò)大模型浪潮的淘汰賽,何嘗不是一種生存哲學(xué)。
對(duì)策三:繞過(guò)或弱化在To B市場(chǎng)的競(jìng)爭(zhēng)壓力,選擇To C作為突圍方向,試圖成為下一個(gè)時(shí)代的行業(yè)巨頭。
王小川不摻和“價(jià)格戰(zhàn)”的理由是:“在國(guó)內(nèi)的商業(yè)環(huán)境里,To B的市場(chǎng)比To C小十倍。”百川智能同步發(fā)布了AI助手“百小應(yīng)”,開(kāi)啟“超級(jí)模型+超級(jí)應(yīng)用”雙輪驅(qū)動(dòng)模式,希望能夠和云廠商進(jìn)行錯(cuò)位競(jìng)爭(zhēng)。
有相似想法的不只有王小川。MiniMax先后孵化出了星野、海螺AI等多款日活超過(guò)百萬(wàn)的產(chǎn)品;月之暗面一開(kāi)始就專(zhuān)注于To C路線,推出了Kimi智能助手;對(duì)價(jià)格戰(zhàn)詬病連連的李開(kāi)復(fù),出任零一萬(wàn)物旗下AI助手“萬(wàn)知”的“首席體驗(yàn)官”;就連To B布局最深的智譜AI,也開(kāi)始加碼推廣AI助手智譜清言。
踏足To C賽道就能避免內(nèi)卷了嗎?正如前面所提到的,目前To C應(yīng)用以智能助手和情感陪伴為主,大模型初創(chuàng)企業(yè)尚未給出更好的產(chǎn)品形態(tài),同樣集中在陪聊、提效等場(chǎng)景,功能大同小異。不過(guò),相較于To B價(jià)格戰(zhàn)的被動(dòng)性,To C承載了大模型創(chuàng)業(yè)者的希望。
創(chuàng)業(yè)從來(lái)都是九死一生,所有的成功之路都充滿(mǎn)荊棘,沒(méi)有人能提前知道哪種對(duì)策是正確的選項(xiàng)。
至少就目前而言,情況遠(yuǎn)沒(méi)有到糟糕的程度。字節(jié)跳動(dòng)放出的降價(jià)“大招”,并未影響智譜AI、月之暗面的新一輪融資,且估值均已超過(guò)30億美元;布局多模態(tài)通用大模型的生數(shù)科技,憑借對(duì)標(biāo)OpenAI Sora的視頻大模型Vidu,日前完成了百度領(lǐng)投的數(shù)億元Pre-A輪融資......
然而,并非所有的創(chuàng)業(yè)者都這么“幸運(yùn)”。前微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(zhǎng)簡(jiǎn)仁賢創(chuàng)辦的竹間智能,已經(jīng)在現(xiàn)金流壓力下停工了6個(gè)月;憑開(kāi)源模型Stable Diffusion走紅的Stability AI,傳出了尋求被收購(gòu)的消息......
突如其來(lái)的大模型價(jià)格戰(zhàn),某種程度上為行業(yè)敲響了警鐘,在信息差越來(lái)越小的語(yǔ)境下,像互聯(lián)網(wǎng)時(shí)代那樣照搬國(guó)外的商業(yè)模式,抑或是踩著時(shí)間窗口和紅利窗口“一步登天”,已經(jīng)沒(méi)有生存的土壤。
申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!
明知產(chǎn)能?chē)?yán)重過(guò)剩的新能源企業(yè)卻還在重金擴(kuò)產(chǎn),多半因?yàn)樗麄兓ǖ牟皇亲约旱腻X(qián);明知極度燒錢(qián)的AI大模型卻開(kāi)始打價(jià)格戰(zhàn),多半因?yàn)樗麄儾⒉豢窟@東西掙錢(qián)。所有投資人必備的一項(xiàng)技能,就是中觀行業(yè)景氣度及商業(yè)模式對(duì)比。很明顯,AI有很多的商業(yè)邏輯與其他行業(yè)非常相似。就比如:有實(shí)力的才能卷、免費(fèi)的往往才是最貴的。打
近日,斯坦福大學(xué)AI團(tuán)隊(duì)發(fā)布了一個(gè)名為L(zhǎng)lama3-V的開(kāi)源模型,被證實(shí)套殼抄襲國(guó)內(nèi)清華與面壁智能的開(kāi)源模型“小鋼炮”MiniCPM-Llama3-V2.5一事,引起了全網(wǎng)的關(guān)注。目前斯坦福團(tuán)隊(duì)成員已經(jīng)刪除了他們?cè)谏缃黄脚_(tái)上官宣模型的推文,并將該項(xiàng)目在Github和HuggingFace上的庫(kù)一并刪
隨著人工智能技術(shù)的快速發(fā)展,大模型以其強(qiáng)大的數(shù)字處理能力和深度學(xué)習(xí)能力
多模態(tài)是AI大模型發(fā)展的未來(lái)方向。
趕超GPT-4的階段性升級(jí),可以看作是國(guó)產(chǎn)大模型有序迭代部署、不斷拉近差距的標(biāo)志,切莫像手機(jī)跑分那樣,在過(guò)度營(yíng)銷(xiāo)的作用下,淪為被群嘲的對(duì)象。
我覺(jué)得我們AI的目標(biāo)是:從芯片設(shè)計(jì)到軟件生態(tài),全鏈路自主開(kāi)發(fā),建立可控的世界級(jí)AI體系。所以這是俺對(duì)未來(lái)5年中國(guó)AI圈的展望和判斷。(1)2026年,英偉達(dá)造車(chē)、國(guó)產(chǎn)開(kāi)車(chē)26年國(guó)產(chǎn)芯片會(huì)在推理和垂直場(chǎng)景上發(fā)力。以DeepSeek為代表,大多數(shù)AI大模型會(huì)以軟件彌補(bǔ)硬件不足,所以訓(xùn)練和推理分開(kāi),訓(xùn)練就
文/道哥在深陷“后門(mén)”風(fēng)波、接受網(wǎng)信辦問(wèn)詢(xún)之后,英偉達(dá)的“特供版”H20芯片,又有了新消息。近日,美國(guó)科技媒體《TheInformation》援引知情人士消息稱(chēng),英偉達(dá)已悄然向其關(guān)鍵供應(yīng)商——包括負(fù)責(zé)封裝的安靠科技、供應(yīng)高帶寬內(nèi)存的三星電子、以及承擔(dān)后端處理的富士康發(fā)出指令,要求暫停所有與H20AI
文/二風(fēng)來(lái)源/節(jié)點(diǎn)財(cái)經(jīng)一場(chǎng)關(guān)于“中國(guó)芯”的IPO審議,正把投資者們的目光鎖定在上交所。根據(jù)上交所發(fā)布的公告,上市審核委員會(huì)已定于9月26日審議摩爾線程的科創(chuàng)板首發(fā)申請(qǐng)。作為中國(guó)半導(dǎo)體自主化浪潮中最受矚目的“考生”之一,包括其創(chuàng)始人顯赫的英偉達(dá)背景、高達(dá)80億元人民幣的募資雄心,以及在國(guó)產(chǎn)GPU領(lǐng)域取
技術(shù)的進(jìn)步永無(wú)止境,繼創(chuàng)下TPC-C性能&性?xún)r(jià)比雙冠之后,阿里云PolarDB云原生數(shù)據(jù)庫(kù)再度實(shí)現(xiàn)關(guān)鍵突破。9月24日杭州云棲大會(huì)上,阿里云宣布推出全球首款基于CXL(ComputeExpressLink)2.0Switch技術(shù)的PolarDB數(shù)據(jù)庫(kù)專(zhuān)用服務(wù)器。在原有RDMA網(wǎng)絡(luò)的基礎(chǔ)上,Polar
2025年9月24日,在杭州舉辦的云棲大會(huì)上,阿里云正式發(fā)布全新一代服務(wù)器操作系統(tǒng)AlibabaCloudLinux4(簡(jiǎn)稱(chēng)Alinux4)。Alinux4基于Linux6.6內(nèi)核打造,是首個(gè)全面遵循龍蜥社區(qū)“開(kāi)源生態(tài)合作倡議”規(guī)范的商業(yè)發(fā)行版。它不僅兼容主流開(kāi)源社區(qū)生態(tài),更針對(duì)阿里云最新9代ECS
9月24日,杭州云棲大會(huì)技術(shù)主論壇上,阿里云重磅發(fā)布AI安全護(hù)欄,提供五項(xiàng)核心安全能力,護(hù)航AI安全。一方面為客戶(hù)提供融入AIAgent開(kāi)發(fā)全鏈路的原生安全防護(hù),另一方面持續(xù)用AI賦能安全產(chǎn)品智能化升級(jí),打造Agentic-SOC安全運(yùn)營(yíng),提升安全威脅檢測(cè)和響應(yīng)效率。在過(guò)去的一年,AIAgent正在
9月24日,魔搭社區(qū)舉辦了“全球協(xié)作?科學(xué)突破?創(chuàng)意無(wú)限”的專(zhuān)題論壇,并發(fā)布魔搭社區(qū)國(guó)際版、科學(xué)智能專(zhuān)區(qū)與AIGC創(chuàng)作引擎FlowBench,旨在連接全球開(kāi)發(fā)者、加速科研范式創(chuàng)新、賦能創(chuàng)意表達(dá)。自2022年11月初成立至今,魔搭社區(qū)已成長(zhǎng)為中國(guó)最大AI開(kāi)源社區(qū),其模型數(shù)量已突破10萬(wàn),服務(wù)了全球20
9月24日,2025云棲大會(huì)現(xiàn)場(chǎng),阿里云CTO周靖人接連發(fā)布了七款大模型技術(shù)產(chǎn)品。七款技術(shù)產(chǎn)品覆蓋語(yǔ)言、語(yǔ)音、視覺(jué)、多模態(tài)、代碼等模型領(lǐng)域,在模型智能水平、Agent工具調(diào)用以及Coding能力、深度推理、多模態(tài)等方面均實(shí)現(xiàn)突破。在大語(yǔ)言模型中,阿里通義旗艦?zāi)P蚎wen3-Max全新亮相,性能超過(guò)G