当前位置：

只需一段语音，就能生成说话视频:视频博主开心了
下载贤集网APP看更多精彩视频

视频介绍

只需一段语音，就能生成说话视频。就像这样。可以看到，表情、动作、神情全都在线，还有不同的穿搭。就连,发型、甚至发际线，都可以不同。不少网友表示：那这样，是不是视频博主就从此省事了？别着急，先来看看研究内容。其实能实现以上效果的，是一个NWT生成,器，用表征学习来实现音视频生成。它由两个模型组成。一个用于离散潜在表示的视频自动编码器dVAE-Adv。另一个自回归先验模型，用来生成新视频。而自回归模型则作为编解,码器模型，能从离散分类分布中自动采样，将音频转化为视频。不过这些视频样本是经过处理的，研究人员将其分成了16127个视频片段，平均长度为7.46秒。最终在主观评价测试中，这一方法都明显优于以往的唇语、脸部生成任务。研究人员表示，这个研究是对话式人类视频合成技术上的一个新突破，展现了未来将普遍应用的潜力。但是目前这个模型还是有一定局限性。比如，不能用其他人声音来生成。接下来，他们将进一步扩大数据集和模型，来处理不同个体。感兴趣的可以关注一下哦。