用配音生成人物对话场景，Meta 推出 audio2photoreal AI 框架-科技今日热点

IT之家1月9日消息，Meta日前公布了一项名为audio2photoreal的AI框架，该框架能够生成一系列逼真的NPC人物模型，并借助现有配音文件自动为人物模型“对口型”“摆动作”。

▲图源Meta研究报告（下同）

IT之家从官方研究报告中得知，Audio2photoreal框架在接收到配音文件后，首先生成一系列NPC模型，之后利用量化技术及扩散算法生成模型用动作，其中量化技术为框架提供动作样本参考、扩散算法用于改善框架生成的人物动作效果。

研究人员提到，该框架可以生成30FPS的“高质量动作样本”，还能模拟人类在对话中“手指点物”、“转手腕”或“耸肩”等不由自主的“习惯性动作”。

研究人员援引自家实验结果，在对照实验中有43%的评估者对框架生成的人物对话场景感到“强烈满意”，因此研究人员认为Audio2photoreal框架相对于业界竞品能够生成“更具动态和表现力”的动作。

	一线美女演员放弃周星驰，嫁给其貌不扬的歌手，还说花光所有运气
	2023年我国全年收购粮食超8000亿斤
	哈尔滨爆火，用「讨好型市格」有效营销
	卫材阿尔茨海默病新药在中国获批，国内还有哪些新药在路上
	河南三门峡：动态调整普通住房标准，按上年度商品住房均价1.2倍执行
	美媒：对华“去风险化”政策正在制造新的风险
	ID.3质量排名第一“最受欢迎合资纯电”出了新款
	新能汽车品牌起火最多的，你知道是谁吗？
	九号电动自行车 Nz MIX 发布：48V 13Ah 铅酸电池，首发 3299 元
	乘联会：2023年乘用车出口同比增长62%

头条资讯网_今日热点_娱乐才是你关心的时事