只需一段语音,就能生成说话视频:视频博主开心了

下载贤集网APP看更多精彩视频

视频介绍

只需一段语音,就能生成说话视频。就像这样。可以看到,表情、动作、神情全都在线,还有不同的穿搭。就连,发型、甚至发际线,都可以不同。不少网友表示:那这样,是不是视频博主就从此省事了?别着急,先来看看研究内容。其实能实现以上效果的,是一个NWT生成,器,用表征学习来实现音视频生成。它由两个模型组成。一个用于离散潜在表示的视频自动编码器dVAE-Adv。另一个自回归先验模型,用来生成新视频。而自回归模型则作为编解,码器模型,能从离散分类分布中自动采样,将音频转化为视频。不过这些视频样本是经过处理的,研究人员将其分成了16127个视频片段,平均长度为7.46秒。最终在主观评价测试中,这一方法都明显优于以往的唇语、脸部生成任务。研究人员表示,这个研究是对话式人类视频合成技术上的一个新突破,展现了未来将普遍应用的潜力。但是目前这个模型还是有一定局限性。比如,不能用其他人声音来生成。接下来,他们将进一步扩大数据集和模型,来处理不同个体。感兴趣的可以关注一下哦。

飞速科创

了解更多有趣的知识,就关注飞速科创

我来说几句


获取验证码
最新评论

还没有人评论哦,抢沙发吧~

)