3月3日,
谷歌宣布推出輕量級(jí)AI模型Gemini3.1Flash-Lite,這是其Gemini3系列中速度最快、最具成本效益的模型。開發(fā)者可以通過GoogleAIStudio中的GeminiAPI獲取預(yù)覽版,企業(yè)級(jí)用戶也能在VertexAI平臺(tái)上體驗(yàn)。谷歌為該模型設(shè)定了極具競(jìng)爭(zhēng)力的價(jià)格,每百萬輸入Tokens收費(fèi)0.25美元,每百萬輸出Tokens為1.50美元,旨在降低AI應(yīng)用的門檻。
Gemini3.1Flash-Lite在性能上實(shí)現(xiàn)了顯著提升。根據(jù)ArtificialAnalysis的數(shù)據(jù),與前代2.5Flash相比,新模型的首字響應(yīng)速度(TTFT)提升了2.5倍,整體輸出速度提升了45%。這種低延遲特性使其成為構(gòu)建實(shí)時(shí)響應(yīng)體驗(yàn)的理想選擇。在A
網(wǎng)頁鏈接排行榜上,3.1Flash-Lite獲得了1432分的Elo得分,并在多模態(tài)理解與邏輯推理測(cè)試中全面領(lǐng)先同級(jí)競(jìng)品,如GPQADiamond測(cè)試中得分率高達(dá)86.9%,在MMMUPro測(cè)試中達(dá)到76.8%,甚至在多項(xiàng)指標(biāo)上超越了體積更大的上一代Gemini2.5Flash模型。
此外,3.1Flash-Lite在AIStudio和VertexAI中標(biāo)配了創(chuàng)新的“思考層級(jí)(thinkinglevels)”功能,允許開發(fā)者根據(jù)任務(wù)需求靈活控制模型的“思考深度”。這一機(jī)制使得模型在處理基礎(chǔ)任務(wù)時(shí)追求極致效率,在面對(duì)高難度任務(wù)時(shí)激發(fā)更深度的推理能力。Latitude、Cartwheel以及Whering等企業(yè)已將3.1Flash-Lite部署于復(fù)雜的業(yè)務(wù)場(chǎng)景中,并反饋稱該模型具備卓越的處理效率和邏輯推理能力,能以媲美大型模型的精準(zhǔn)度處理復(fù)雜輸入指令。



來源:一電快訊
返回第一電動(dòng)網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)(m.22xuexi.com)立場(chǎng)。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。