MoneyDJ新聞 2025-05-28 14:08:42 記者 新聞中心 報導
綜合港媒及陸媒報導,騰訊(0700.HK)旗下大語言模型騰訊混元今(28)日發布並開源的語音數位人模型HunyuanVideo-Avatar。該模型由騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂天琴實驗室MuseV技術聯合研發,支援頭肩、半身與全身景別,以及多風格、多物種與雙人場景,面向影片創作者提供高一致性、高動態性的影片生成能力。
據了解,用戶可上傳人物圖像與音訊,HunyuanVideo-Avatar模型會自動理解圖片與音訊,例如人物所在環境、音訊所蘊含的情感等,讓圖中人物自然說話或唱歌,生成包含自然表情、唇形同步及全身動作的影片。