BoonKiong.com2026™

人气 1

Inworld AI 发布 Realtime TTS-2 语音模型:可感知用户情绪,支持 100 种语言保持同一声线

文***已获得官方认证 2026-5-7 18:23

b5986775-e968-48bb-b597-6570c1626f79.jpg

昨天,Inworld AI 发布新一代语音模型 Realtime TTS-2,以研究预览版形式通过 Inworld API 和 Inworld Realtime API 向开发者开放。

TTS-2 的核心变化在于从单向文本转语音管线转向闭环实时对话架构:模型直接接收对话中的实际音频,从而感知用户的语气、节奏与情绪状态并作出相应调整。新版本新增四项能力:

  • 语音指令(Voice Direction):用自然语言描述表达方式,例如「疲惫但温柔,像刚下班回家」,模型据此调整语音风格,不再依赖固定情感标签;
  • 对话感知(Conversational Awareness):在 Realtime 会话中自动接收前序音频,语气与节奏可跨轮次延续;
  • 跨语言支持(Crosslingual):单一声音身份可在超过 100 种语言间无缝切换,声线与人物特征保持一致,支持同一段生成中混用多语;
  • 高级语音设计(Advanced Voice Design):无需参考音频,通过文字描述即可生成可复用声音角色,并提供「富有表现力」「均衡」「稳定」三种模式。

此外,模型支持内联非语言标记(如【笑】【叹气】)、语音克隆(上传 5 至 15 秒音频样本即可),TTS 层首包延迟低于 200 毫秒。



文章来源:爱范儿




<
您需要登录后才可以回帖 登录 | 立即注册

您还未登录

随手拍~~:

热门推荐~~:

论坛表情分享...

1、洋葱头 ...

Discuz! X3.5 解决小图标不显示的方法...

我发现大多数使用Discuz! X3.5 都有小图标不能显示的问题,提问的时候大家给的回答都是说跨域的问题, ...

如何在 discuz 帖子里添加 APlayer 音乐播...

1、首先将下边的 APlayer.css 和 APlayer.js 代码下载然后解压上传到服务器。 2、单曲音乐的代 ...

Discuz! 相关帖子功能修改随机显示不依赖标...

打开 source/module/forum/forum_viewthread.php 文件,查找: 换行添加: 再查找: 换行添 ...

Discuz! X3.5 手机版 logo 的路径...

打开以下的模板文件,搜索 logo_m.svg 1.template/default/touch/portal/index.htm 2.template/def ...

热度会员~~:

文強berrybkboonkiongadmin老谟深虑TaC9528huaekinteresabitchJCYSORALINc.t.teo

免责声明~~:


本站内容来源于合作伙伴及网络搜集,版权归原作者所有。如有侵犯版权,请立刻和本站联系,我们将在三个工作日内予以改正。
Email:hsbk@hotmail.com

服务与条款|隐私政策|免责声明|手机版|小黑屋|网站地图|友链申请| 文强阁

Powered by Discuz! X3.5|© 2001-2026 Discuz! Team. |本站总访问量已经运行: