近日,米哈游創(chuàng)始人蔡浩宇在新加坡創(chuàng)立的新公司Anuttacon發(fā)布了新一代視頻角色表演生成模型LPM1.0(LargePerformanceModel)。該模型專注于AI交互式內(nèi)容和AGI產(chǎn)品研發(fā),采用17B參數(shù)的擴(kuò)散Transformer架構(gòu),旨在提升復(fù)雜視頻生成任務(wù)中的表達(dá)能力。LPM1.0通過逐步加噪與去噪過程學(xué)習(xí)數(shù)據(jù)分布,從隨機(jī)噪聲中恢復(fù)出目標(biāo)內(nèi)容,實(shí)現(xiàn)高質(zhì)量生成。
LPM1.0的設(shè)計(jì)目標(biāo)是面向“角色表演生成”細(xì)分場景,對(duì)人物動(dòng)作、表情以及語義驅(qū)動(dòng)的表現(xiàn)進(jìn)行統(tǒng)一建模。該模型支持不同粒度的控制能力,包括基于文本、參考視頻或圖像等多種條件輸入,生成具有連貫動(dòng)作與表現(xiàn)力的角色視頻內(nèi)容。在推理階段,LPM1.0能夠從用戶音頻生成傾聽視頻,從合成音頻生成說話視頻,并支持文本提示進(jìn)行動(dòng)作控制,所有過程均以實(shí)時(shí)速度運(yùn)行,并保持身份穩(wěn)定和無限長度生成。
LPM1.0的應(yīng)用場景廣泛,包括對(duì)話智能體、直播角色和游戲NPC的視覺引擎等。研究團(tuán)隊(duì)還提出了LPM-Bench,作為首個(gè)交互式角色表演基準(zhǔn),LPM1.0在所有評(píng)估維度上均取得了最優(yōu)結(jié)果,同時(shí)保持實(shí)時(shí)推理能力。目前,該模型僅供非商業(yè)學(xué)術(shù)使用,暫無計(jì)劃對(duì)外發(fā)布模型權(quán)重、源代碼、在線演示、API、產(chǎn)品或任何相關(guān)服務(wù)。



來源:一電快訊
返回第一電動(dòng)網(wǎng)首頁 >
以上內(nèi)容由AI創(chuàng)作,如有問題請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)溝通,AI創(chuàng)作內(nèi)容并不代表第一電動(dòng)網(wǎng)(m.22xuexi.com)立場。
文中圖片源自互聯(lián)網(wǎng)或AI創(chuàng)作,如有侵權(quán)請(qǐng)聯(lián)系郵件刪除。