界面新聞?dòng)浾?| 宋佳楠
當(dāng)?shù)貢r(shí)間7月9日,馬斯克旗下的人工智能公司xAI正式發(fā)布了Grok 4,這是該公司自2023年推出首代大模型以來(lái)的第四次重要迭代,號(hào)稱是“世界上最強(qiáng)AI模型”。
Grok 4系列包含Grok 4和Grok 4 Heavy兩個(gè)版本,均為純推理模型。Grok 4是單代理版本,Grok 4 Heavy是多代理版本,支持四個(gè)代理同時(shí)工作,上下文窗口最高支持256k tokens。
根據(jù)xAI的內(nèi)部基準(zhǔn)測(cè)試結(jié)果,Grok 4在Humanity’s Last Exam(一個(gè)涵蓋數(shù)學(xué)、科學(xué)與語(yǔ)言等多學(xué)科、約2500道題目的權(quán)威考試)中,通過(guò)文本輸入達(dá)到了約25%的正確率。這一數(shù)字與OpenAI在今年2月公布的Deep Research工具約26%的正確率不相上下。但xAI方面強(qiáng)調(diào),兩者測(cè)試方式并非完全相同。

此次Grok 4的一個(gè)看點(diǎn)是新增五種聲音模式,以及反應(yīng)速度較早期幾乎縮短了一半。為方便開(kāi)發(fā)者使用,Grok?4加入了專門(mén)的編程模型Grok?4?Code,能在代碼生成、調(diào)試等方面提供更專業(yè)的支持。xAI表示,這一變化將明顯提升開(kāi)發(fā)者效率,以應(yīng)對(duì)GPT?4系列和Meta Gemini在編碼領(lǐng)域的競(jìng)爭(zhēng)。
在xAI的描述中,Grok?4不僅具備“邏輯推理更強(qiáng)、語(yǔ)言理解更準(zhǔn)確”的優(yōu)勢(shì),還首次嘗試加入多模態(tài)信息處理,如圖像、視頻的潛力。這使其在社交媒體內(nèi)容上的應(yīng)用更具時(shí)效性和文化敏感性。

Grok 4目前只有付費(fèi)用戶才能使用,API定價(jià)為每百萬(wàn)tokens輸入3美元,輸出15美元。Grok 4 Heavy需要訂閱300美元/月的SuperGrok Heavy會(huì)員才能使用,價(jià)格超過(guò)了OpenAI最貴的200美元Pro會(huì)員月費(fèi)。
不過(guò),Grok?4的推出伴隨著不小的爭(zhēng)議。直播前夕,舊版本Grok?3曾因傳播不當(dāng)言論引發(fā)外界批評(píng)。有聲音認(rèn)為,xAI若不能在未來(lái)幾周內(nèi)提供更具結(jié)構(gòu)性的模型安全機(jī)制,并公布更透明的訓(xùn)練方式,Grok?4或很難擺脫“高性能之下的高風(fēng)險(xiǎn)”。
對(duì)此,馬斯克強(qiáng)調(diào),Grok?4的更新目標(biāo)是“成為盡可能追求真相的AI”。 他還設(shè)想通過(guò)該模型與類人機(jī)器人結(jié)合,在今年年底或明年發(fā)現(xiàn)新技術(shù),甚至新物理定律?!斑@讓人既興奮又緊張,我希望自己能活著見(jiàn)證它的誕生?!瘪R斯克說(shuō)。
公開(kāi)資料顯示,xAI成立于2023年7月,創(chuàng)始團(tuán)隊(duì)成員除馬斯克外,還有來(lái)自谷歌DeepMind、OpenAI、谷歌研究院等機(jī)構(gòu)的11名成員,其中有4名華人。他們?cè)鴧⑴c過(guò)DeepMind的AlphaCode和OpenAI的GPT 3.5和GPT 4等項(xiàng)目。
此前xAI已發(fā)布多個(gè)大模型產(chǎn)品。去年3月發(fā)布的Grok 1,參數(shù)量達(dá)3140億,是當(dāng)時(shí)參數(shù)量最大的開(kāi)源大語(yǔ)言模型。后續(xù)又推出了Grok 1.5、Grok 1.5V等升級(jí)版模型,不斷提升推理能力、上下文長(zhǎng)度和圖像理解等能力。去年8月至今,該公司又發(fā)布了Grok 2早期預(yù)覽版及Grok 3。
目前xAI累計(jì)融資額已超過(guò)200億美元。4月底有報(bào)道稱,xAI控股公司正在與投資者洽談,計(jì)劃為其整合后的xAI及社交媒體業(yè)務(wù)X平臺(tái)籌集約200億美元資金。若交易達(dá)成,該公司估值將突破1200億美元。
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...