一个多月前,一个号称「开源语音 TTS 天花板级别」的 ChatTTS 爆火。
没多久,字节也推出一款类似项目 Seed-TTS,喊出的口号同样是「生成自然真实的语音」。
据悉,该模型经过 15 万小时的数据训练,已熟练掌握中英日三种语言,语音处理接近人类水平,对中文支持更是 ——
人间灯火倒映湖中,她的渴望让静水泛起涟漪。若代价只是孤独,那就让这份愿望肆意流淌。流入她所注视的世间,也流入她如湖水般澄澈的目光。
Fish Speech 是一款开源文本转语音模型,由 Fish Audio 公司开发。据介绍,该模型仅有亿级参数,能够在个人设备上轻松运行和微调。
其官网界面设计简洁,在「发现」一栏列表里有网友训练的各种声音,例如丁真、川普、雷军、邓紫棋、董宇辉、单田芳等,还有 AD 学姐、流萤等二次元声音。
前不久,有个 00 后博主 @维 C 动物园,以发疯的方式另类解说《动物世界》而出圈。
例如,在《鸮张跋扈》这一集中,博主以一分正经、两分清奇、三分幽默、四分莫名其妙的解说方式,介绍了一种叫做穴小鸮的动物。
我们就用 Fish speech 中的「纪录片旁白」这个声音,给这个有大病的文案生成一段配音。
绿螳螂其实非常可爱,可爱死了,嘎嘣脆,鸡肉味,但这一切都与美洲鹑无关,因为它也自身难保,黄腹隼表示真香。黄腹隼遍布于南美洲各地,它们的视力极好,能看到10厘米以外的事物,所以我们今天的主角,不是它。
穴小鸮(xiao),江湖人称鸮鲜肉,跟我表哥一样,身高不足 30 厘米,十分可爱。正所谓「虎落平阳被犬欺,鸮在野外不如鸡」,穴小鸮常因捕食能力太差,而被邻居嘲笑。但咱不气馁,既然找不到食物,就去找食物的食物。
Fish speech 的模仿能力一绝,它可以模仿特定人物的音色、语调到以假乱真的程度,比如说单田芳、邓紫棋、特朗普。
不过,它也有一些瑕疵,例如有时候它不识字,「穴小鸮」胡读一通;不懂断句,会把完整的句子读得稀碎。此外,输入的文本一旦太长,它就罢工。
操作也很 easy。只需点星空体育网站 星空体育首页击网页上方的「构建声音」,即可跳转至新界面。然后上传封面、填写声音名称、输入音频即可。
其中,在输入音频这个环节,我们既可以上传现成的,也可以自己录制,不过它对时长有限制,最好在 30 秒左右。
他此刻骑在一只老鹤身上,在云雾里穿梭,想入了神。眼看快飞到启明殿,老鹤许是糊涂了,非但星空体育网站 星空体育首页不减速,反而直直地撞了过去。李长庚回过神来,连连挥动拂尘,它才急急一拍双翅,歪歪斜斜地落在殿旁台阶上。
好呀,哈哈哈哈哈,喜欢笑的人运气都不会差哦,希望你每天笑口常开。Fish Speech:
由于字节的 Seed-TTS 还无法亲自体验,所以我们就用了它的官方示例。
这三款 TTS 模型各有千秋,如果非要给它们的实力排个序,Seed-TTS 的断句、语音语调最自然,其次就是 ChatTTS,Fish Speech 虽然还有所欠缺,但它赢在可自定义音色上。