进阶能力
两阶段播客
先生成文本稿,审核修改后再生成音频 — 把播客制作从"一锤子买卖"变成可控流程。
普通播客是一步到位:输入主题 → 等待 → 拿到音频。快,但没有中间审核环节。
两阶段播客把这个过程拆成两步:先生成文本稿,审核修改后再生成音频。适合正式发布的播客、需要精确控制内容的场合、有多轮审核需求的制作流程。
发起请求
告诉 AI 想使用两阶段模式。AI 会解释核心优势 — 先生成文本稿,人工审核和编辑后再生成音频:

阶段一:文本稿生成
AI 提交文本生成任务,返回 Episode ID。这一步只生成文字内容,不生成音频:

等待几分钟后查询状态,文本稿生成完成。AI 给出完整的内容概要 — 标题、字数、内容结构,以及两个选项:直接生成音频,或先审核修改:

审核文本稿
选择"先审核修改"后,AI 展示完整的文本稿内容结构(约 5000 字,10 个章节),每个章节的主题和核心论点一目了然:

AI 同时列出详细的章节目录,并提供编辑入口 — 可以删除、添加、调整任何部分:

在这个案例中,审核意见是"保持结构,但让表达更精练、更口语化"。AI 把 5000 字的学术长文精简为 1500 字的对话稿,更符合播客的听觉节奏。
阶段二:音频生成
修改后的文本稿确认无误,进入阶段二。AI 用精简后的 27 段对话脚本启动音频生成:

两阶段播客完成
等待 2-3 分钟后,音频生成完成。AI 返回在线收听链接、音频下载地址和字幕文件,同时给出完整的工作流验证信息:

一阶段 vs 两阶段
两种模式的核心区别:

日常快速验证想法用一阶段,正式发布或重要内容用两阶段。
完整工作流:
