昨天,合肥警方通报称网传涉卢某某音视频系伪造。
不过,在警方发布通告后,魏某悄悄改了名,删了视频。
然后就可以生成一个角色,这个角色的音色和我们训练的素材是一样的。简单理解为克隆了素材中音色,生成了一个虚拟人。
而且是使用的该平台的免费模式,并没有使用精度更高的收费模式。
笔者个人感觉,如果有音质更好的素材,或者选择精度更高的训练模式,效果会更加逼真。
估计稍加调教,会生成接近于人自然发声的效果。
“操”字的发音暴露蛛丝马迹
不过在尝试复现的过程中,笔者也发现了一些蛛丝马迹,主要体现在一些字的发音上。
因为卢的真人视频网上很多,对比一些词的发音不算难事。
比如在脏话“操”这个字上,卢在真人视频中发音为“cào”,而录音门里的都是“cāo”。也就是录音里是一声,而卢平时发音是四声。
其实四声是一个口语发音,笔者查了下操本身并没有四声这个音,只有一声。
此外,笔者也测试了其他音视频生成平台,发现机器的发音也都是一声。
这或许是音频合成没注意到的细节。
那段流传的音频有很明显的底噪,听起来像是翻录了合成音频,而且还是做成了社交软件语音聊天的形式,估计废了不少功夫。