參數(shù)競賽趨于冷靜微博為何選擇在此時推出自研大模型？

2025-11-19 19:44:02

11月18日，微博發(fā)布首個自研開源大模型“VibeThinker”，規(guī)模僅15億參數(shù)。微博AI研發(fā)負(fù)責(zé)人稱，此舉旨在回歸核心場景，不盲目追求算力比拼。當(dāng)前大模型廠商主流選擇仍是增加參數(shù)量，但微博方面認(rèn)為小模型有響應(yīng)快、成本低等優(yōu)勢。VibeThinker或率先用于評論羅伯特，未來計劃擴(kuò)展至搜索等場景。

每經(jīng)記者｜可楊每經(jīng)編輯｜魏官紅

當(dāng)大模型競爭從參數(shù)規(guī)模轉(zhuǎn)向落地成效，微博下場了。

11月18日，微博發(fā)布其首個自研開源大模型“VibeThinker”，模型規(guī)模僅15億參數(shù)，訓(xùn)練成本被控制在約7800美元。

在大模型成本與資源壁壘不斷被拉高之際，為何微博選擇在此時入場？其選擇的輕量化技術(shù)路徑是否意味著大模型競爭已出現(xiàn)新的分叉？

11月19日，微博AI（人工智能）研發(fā)負(fù)責(zé)人在接受《每日經(jīng)濟(jì)新聞》記者（以下簡稱“每經(jīng)記者”）采訪時表示，微博并不是要和行業(yè)頭部比拼算力，而是回到微博的核心場景，把真正有效的能力沉淀下來。他認(rèn)為，大模型不必一味追求規(guī)模增大，而應(yīng)圍繞內(nèi)容理解、用戶興趣分層、文本生成等關(guān)鍵場景進(jìn)行針對性訓(xùn)練。

在用戶增長趨穩(wěn)、信息流分發(fā)效率成為競爭焦點(diǎn)的背景下，自研模型既是技術(shù)選擇，也是一種商業(yè)變量。更關(guān)鍵的問題在于：微博的輕量化路線能否真正帶來平臺體驗或商業(yè)化效率的改善？

押注小模型：VibeThinker背負(fù)成本優(yōu)化期待

當(dāng)前，通過增加參數(shù)量來提升模型能力依舊是大模型廠商們的主流選擇，部分前沿模型的參數(shù)規(guī)模已超過萬億級，埃隆·馬斯克旗下的xAI計劃明年初發(fā)布的Grok 5預(yù)計會把模型參數(shù)規(guī)模推高到6萬億左右。

微博AI研發(fā)負(fù)責(zé)人對每經(jīng)記者表示，無論是從模型制作成本、AI應(yīng)用成本、技術(shù)開放性等方面，這種模式都是不可持續(xù)的。

站在推動AI應(yīng)用普惠的角度，已有廠商在大模型技術(shù)“摸高”的同時，開始將目光轉(zhuǎn)向小模型。

上述研發(fā)負(fù)責(zé)人指出，業(yè)界普遍認(rèn)為小模型在解決復(fù)雜任務(wù)和邏輯推理方面存在天生劣勢，這也是阻礙其廣泛應(yīng)用的核心障礙。但他進(jìn)一步解釋道，小模型在實(shí)際應(yīng)用中具有天然優(yōu)勢：模型規(guī)模較小意味著服務(wù)響應(yīng)更快、計算成本更低，同時更易于在特定場景下進(jìn)行優(yōu)化。

“我們在實(shí)際AI應(yīng)用中發(fā)現(xiàn)，模型規(guī)模過大導(dǎo)致服務(wù)慢、成本高、用戶體驗差等，這促使我們探究小模型復(fù)雜邏輯能力的問題??經(jīng)過一些針對性的探索和技術(shù)改進(jìn)，小模型經(jīng)過行業(yè)特有數(shù)據(jù)和合理訓(xùn)練方法，也可以具備強(qiáng)大的邏輯推理能力?！蔽⒉〢I研發(fā)負(fù)責(zé)人表示。

記者注意到，在整體業(yè)績增速放緩的背景下，微博正通過AI應(yīng)用尋找新的增長路徑。

財報顯示，微博三季度凈收入為4.42億美元，同比下降5%，歸屬于公司股東的凈利潤達(dá)到2.21億美元，高于去年同期的1.31億美元。

數(shù)據(jù)背后，AI應(yīng)用正在發(fā)揮越來越重要的作用：三季度，微博智搜MAU突破7000萬，DAU和檢索量環(huán)比增長超過50%，搜索總檢索量環(huán)比提升20%。AI技術(shù)正在成為微博推動搜索生態(tài)增長、增強(qiáng)平臺活躍度的重要工具。

“評論羅伯特”成小模型實(shí)驗場

VibeThinker未來在微博的首要落地場景，很可能是其最為出圈的官方評論機(jī)器人“評論羅伯特”。

2023年底，微博推出“評論羅伯特”，目標(biāo)是在用戶發(fā)帖后自動生成評論，以活躍社交氛圍為核心。它自稱是“天生的捧哏”“有趣的靈魂”“不知疲倦的顯眼包”，被網(wǎng)友戲稱為“賽博街溜子”。

微博用戶“張俊林say”（微博AI研發(fā)人員）在其微博中提到，團(tuán)隊在研發(fā)評論工具“羅伯特”過程中，充分挖掘了微博豐富的心理學(xué)領(lǐng)域數(shù)據(jù)，增強(qiáng)了模型在心理指導(dǎo)和情感撫慰上的能力。今年初，隨著DeepSeek-R1開源論文中強(qiáng)化學(xué)習(xí)方法的公布，團(tuán)隊進(jìn)一步制作了針對評論場景的深度思考訓(xùn)練數(shù)據(jù)，并訓(xùn)練Reward模型，推出深度思考版本的羅伯特。

然而，基座模型體量龐大，深度思考過程耗時且成本高昂。這也正是VibeThinker誕生的初衷：探索一種邏輯推理能力同樣出色、但規(guī)模更小的模型，替代大模型，使每條評論都能經(jīng)過深度思考。換言之，VibeThinker并非直接作為評論羅伯特的底層模型，但其研發(fā)起點(diǎn)源于優(yōu)化評論應(yīng)用的實(shí)際需求。

盡管VibeThinker已對外開源，但上述微博AI研發(fā)負(fù)責(zé)人在接受每經(jīng)記者采訪時強(qiáng)調(diào)，VibeThinker仍處于實(shí)驗階段，尚未在實(shí)際產(chǎn)品中大規(guī)模應(yīng)用。當(dāng)前開源版本主要側(cè)重展示模型在邏輯推理、競賽數(shù)學(xué)和編程能力方面的潛力?！坝行┤藭J(rèn)為這是一種垂直領(lǐng)域的能力增強(qiáng)，這是一種誤解，邏輯推理能力目前是大模型最關(guān)鍵的能力，而這種能力的提升會帶動模型解決現(xiàn)實(shí)場景的復(fù)雜問題?！?/p>

同時，上述負(fù)責(zé)人表示，未來，VibeThinker將計劃在To C產(chǎn)品中首先應(yīng)用，尤其是在“評論羅伯特”這種能體現(xiàn)出微博數(shù)據(jù)優(yōu)勢和特色的應(yīng)用中采用，利用在微博中挖掘的優(yōu)質(zhì)領(lǐng)域數(shù)據(jù)來調(diào)整VibeThinker，然后考慮逐步擴(kuò)展到搜索、推薦等大量消耗算力的場景。

封面圖片來源：圖片來源：每日經(jīng)濟(jì)新聞資料圖

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

大川新材（834193）：公司擬轉(zhuǎn)讓全資子公司杭州銀湖化工有限公司100%股權(quán)

返回每經(jīng)網(wǎng)首頁

下一篇文章

俄羅斯警告高市早苗！

相關(guān)文章