4月7日消息,小米MiMo大模型負(fù)責(zé)人羅福莉昨日在社交平臺發(fā)文,針對AI大模型行業(yè)近期爆發(fā)的TOKEN價格戰(zhàn)發(fā)表系統(tǒng)性觀點。她以Anthropic切斷Claude訂閱用戶對第三方框架OpenClaw的接入為例,指出單純以極低價格銷售token并放任第三方框架接入是一種“陷阱”,小米MiMo已于數(shù)日前推出按量計費的Token Plan作為替代路徑。
羅福莉分析稱,若大模型公司未厘清成本結(jié)構(gòu)就卷入價格戰(zhàn),平臺為彌補虧損可能被迫降配模型、限流或降低推理穩(wěn)定性,形成惡性循環(huán)。她以O(shè)penClaw為例說明第三方框架的低效問題:單次用戶查詢會觸發(fā)多輪低價值工具調(diào)用,每輪均作為獨立API請求并攜帶超過10萬token的上下文窗口,實際API請求次數(shù)是原生框架的數(shù)倍,折算成本可達(dá)訂閱價格的數(shù)十倍。Anthropic切斷訂閱通道后,第三方框架用戶短期內(nèi)將面臨數(shù)十倍的成本跳漲,但這種痛感會倒逼框架開發(fā)者改進(jìn)上下文管理、提高prompt緩存命中率、削減無效token消耗。
小米MiMo選擇的Token Plan以Credit為單位銷售token額度,明確支持第三方框架接入,每個被浪費的token均直接扣除用戶額度,使用量與成本的關(guān)系重新透明化。羅福莉強(qiáng)調(diào),其目標(biāo)是長期穩(wěn)定地交付高質(zhì)量的模型和服務(wù),而非讓用戶沖動付費后棄船。她給出宏觀判斷:全球算力供給增速已落后于Agent場景下的token需求增速,真正的出路不在于更便宜的token,而在于更高token效率的Agent框架與更強(qiáng)大、更高效的模型之間的協(xié)同進(jìn)化。Agent時代不屬于消耗最多算力的人,而屬于最懂得如何高效利用算力的人。Anthropic的舉措可能無意中推動了開源、閉源生態(tài)的發(fā)展。


來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(m.22xuexi.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。