多角色台词

用 JSON 脚本精确控制每一句台词由谁来说，实现多角色对话、剧本演绎。

基础的 TTS 是"整段文本 + 单个音色"。Speech 多音色脚本则允许精确控制每一句台词由谁来说 — 编排三人辩论、小说对话、教学场景，每个角色有自己的声线和台词。

发起请求

告诉 AI 想测试多音色脚本功能。AI 自动创建一个多角色对话脚本，分配差异化的音色：

发起 Speech 多音色脚本请求，AI 准备 3 个音色

生成的脚本是一个标准 JSON 文件。每条台词指定 content（台词内容）和 speakerId（音色标识），按数组顺序依次朗读：

JSON 脚本结构：每条台词指定内容和音色 ID

这个结构的意义在于完全可控 — 两个人轮流对话、三人圆桌讨论、一人独白穿插旁白，都可以通过调整 JSON 实现。可以手动编写脚本，也可以让 AI 根据需求自动生成。

提交后约 30 秒，三人对话音频生成完成。AI 返回在线收听链接、字幕文件、音色阵容和对话结构：

多音色脚本生成完成，三人对话约 31 秒