2025-11-19 19:44:02
11月18日,微博發(fā)布首個自研開源大模型“VibeThinker”,規(guī)模僅15億參數(shù)。微博AI研發(fā)負(fù)責(zé)人稱,此舉旨在回歸核心場景,不盲目追求算力比拼。當(dāng)前大模型廠商主流選擇仍是增加參數(shù)量,但微博方面認(rèn)為小模型有響應(yīng)快、成本低等優(yōu)勢。VibeThinker或率先用于評論羅伯特,未來計劃擴(kuò)展至搜索等場景。
每經(jīng)記者|可楊 每經(jīng)編輯|魏官紅
當(dāng)大模型競爭從參數(shù)規(guī)模轉(zhuǎn)向落地成效,微博下場了。
11月18日,微博發(fā)布其首個自研開源大模型“VibeThinker”,模型規(guī)模僅15億參數(shù),訓(xùn)練成本被控制在約7800美元。
在大模型成本與資源壁壘不斷被拉高之際,為何微博選擇在此時入場?其選擇的輕量化技術(shù)路徑是否意味著大模型競爭已出現(xiàn)新的分叉?
11月19日,微博AI(人工智能)研發(fā)負(fù)責(zé)人在接受《每日經(jīng)濟(jì)新聞》記者(以下簡稱“每經(jīng)記者”)采訪時表示,微博并不是要和行業(yè)頭部比拼算力,而是回到微博的核心場景,把真正有效的能力沉淀下來。他認(rèn)為,大模型不必一味追求規(guī)模增大,而應(yīng)圍繞內(nèi)容理解、用戶興趣分層、文本生成等關(guān)鍵場景進(jìn)行針對性訓(xùn)練。
在用戶增長趨穩(wěn)、信息流分發(fā)效率成為競爭焦點(diǎn)的背景下,自研模型既是技術(shù)選擇,也是一種商業(yè)變量。更關(guān)鍵的問題在于:微博的輕量化路線能否真正帶來平臺體驗或商業(yè)化效率的改善?
當(dāng)前,通過增加參數(shù)量來提升模型能力依舊是大模型廠商們的主流選擇,部分前沿模型的參數(shù)規(guī)模已超過萬億級,埃隆·馬斯克旗下的xAI計劃明年初發(fā)布的Grok 5預(yù)計會把模型參數(shù)規(guī)模推高到6萬億左右。
微博AI研發(fā)負(fù)責(zé)人對每經(jīng)記者表示,無論是從模型制作成本、AI應(yīng)用成本、技術(shù)開放性等方面,這種模式都是不可持續(xù)的。
站在推動AI應(yīng)用普惠的角度,已有廠商在大模型技術(shù)“摸高”的同時,開始將目光轉(zhuǎn)向小模型。
上述研發(fā)負(fù)責(zé)人指出,業(yè)界普遍認(rèn)為小模型在解決復(fù)雜任務(wù)和邏輯推理方面存在天生劣勢,這也是阻礙其廣泛應(yīng)用的核心障礙。但他進(jìn)一步解釋道,小模型在實(shí)際應(yīng)用中具有天然優(yōu)勢:模型規(guī)模較小意味著服務(wù)響應(yīng)更快、計算成本更低,同時更易于在特定場景下進(jìn)行優(yōu)化。
“我們在實(shí)際AI應(yīng)用中發(fā)現(xiàn),模型規(guī)模過大導(dǎo)致服務(wù)慢、成本高、用戶體驗差等,這促使我們探究小模型復(fù)雜邏輯能力的問題??經(jīng)過一些針對性的探索和技術(shù)改進(jìn),小模型經(jīng)過行業(yè)特有數(shù)據(jù)和合理訓(xùn)練方法,也可以具備強(qiáng)大的邏輯推理能力?!蔽⒉〢I研發(fā)負(fù)責(zé)人表示。
記者注意到,在整體業(yè)績增速放緩的背景下,微博正通過AI應(yīng)用尋找新的增長路徑。
財報顯示,微博三季度凈收入為4.42億美元,同比下降5%,歸屬于公司股東的凈利潤達(dá)到2.21億美元,高于去年同期的1.31億美元。
數(shù)據(jù)背后,AI應(yīng)用正在發(fā)揮越來越重要的作用:三季度,微博智搜MAU突破7000萬,DAU和檢索量環(huán)比增長超過50%,搜索總檢索量環(huán)比提升20%。AI技術(shù)正在成為微博推動搜索生態(tài)增長、增強(qiáng)平臺活躍度的重要工具。
VibeThinker未來在微博的首要落地場景,很可能是其最為出圈的官方評論機(jī)器人“評論羅伯特”。
2023年底,微博推出“評論羅伯特”,目標(biāo)是在用戶發(fā)帖后自動生成評論,以活躍社交氛圍為核心。它自稱是“天生的捧哏”“有趣的靈魂”“不知疲倦的顯眼包”,被網(wǎng)友戲稱為“賽博街溜子”。
微博用戶“張俊林say”(微博AI研發(fā)人員)在其微博中提到,團(tuán)隊在研發(fā)評論工具“羅伯特”過程中,充分挖掘了微博豐富的心理學(xué)領(lǐng)域數(shù)據(jù),增強(qiáng)了模型在心理指導(dǎo)和情感撫慰上的能力。今年初,隨著DeepSeek-R1開源論文中強(qiáng)化學(xué)習(xí)方法的公布,團(tuán)隊進(jìn)一步制作了針對評論場景的深度思考訓(xùn)練數(shù)據(jù),并訓(xùn)練Reward模型,推出深度思考版本的羅伯特。
然而,基座模型體量龐大,深度思考過程耗時且成本高昂。這也正是VibeThinker誕生的初衷:探索一種邏輯推理能力同樣出色、但規(guī)模更小的模型,替代大模型,使每條評論都能經(jīng)過深度思考。換言之,VibeThinker并非直接作為評論羅伯特的底層模型,但其研發(fā)起點(diǎn)源于優(yōu)化評論應(yīng)用的實(shí)際需求。
盡管VibeThinker已對外開源,但上述微博AI研發(fā)負(fù)責(zé)人在接受每經(jīng)記者采訪時強(qiáng)調(diào),VibeThinker仍處于實(shí)驗階段,尚未在實(shí)際產(chǎn)品中大規(guī)模應(yīng)用。當(dāng)前開源版本主要側(cè)重展示模型在邏輯推理、競賽數(shù)學(xué)和編程能力方面的潛力?!坝行┤藭J(rèn)為這是一種垂直領(lǐng)域的能力增強(qiáng),這是一種誤解,邏輯推理能力目前是大模型最關(guān)鍵的能力,而這種能力的提升會帶動模型解決現(xiàn)實(shí)場景的復(fù)雜問題?!?/p>
同時,上述負(fù)責(zé)人表示,未來,VibeThinker將計劃在To C產(chǎn)品中首先應(yīng)用,尤其是在“評論羅伯特”這種能體現(xiàn)出微博數(shù)據(jù)優(yōu)勢和特色的應(yīng)用中采用,利用在微博中挖掘的優(yōu)質(zhì)領(lǐng)域數(shù)據(jù)來調(diào)整VibeThinker,然后考慮逐步擴(kuò)展到搜索、推薦等大量消耗算力的場景。
封面圖片來源:圖片來源:每日經(jīng)濟(jì)新聞 資料圖
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP