4月8日,智譜科技發(fā)布了其新一代旗艦模型GLM-5.1,并宣布該模型“Day0”版本正式上線華為云。智譜GLM-5.1在昇騰算力上實現(xiàn)了Layer級MOE絕對均衡,通過框架能力優(yōu)化讓專家均衡產(chǎn)出Token,同時結(jié)合昇騰Attention算子特征,通過推理框架和硬件協(xié)同的定向優(yōu)化,提升了算力均衡和HBM訪存均衡能力。華為云通過系統(tǒng)級優(yōu)化,實現(xiàn)了推理加速,整體吞吐提升了30%。
華為云MaaS模型即服務(wù)平臺為開發(fā)者提供了免部署、一鍵調(diào)用智譜GLM-5.1 API的Tokens服務(wù),支持在線體驗。企業(yè)還可以通過華為云魔坊(ModelArts)模型訓推平臺,一鍵完成推理服務(wù)部署上線,支持公共池和專屬池兩種資源部署方式,滿足獨占和非獨占算力的使用需求。智譜GLM-5.1被官方宣稱為目前全球最強的開源模型,是唯一達到8小時級持續(xù)工作的開源模型,并在SWE-benchPro基準測試中,實現(xiàn)了國產(chǎn)模型首次超越Opus4.6。


來源:一電快訊
返回第一電動網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動網(wǎng)(m.22xuexi.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請聯(lián)系郵件刪除。