两阶段播客

先生成文本稿，审核修改后再生成音频 — 把播客制作从"一锤子买卖"变成可控流程。

普通播客是一步到位：输入主题 → 等待 → 拿到音频。快，但没有中间审核环节。

两阶段播客把这个过程拆成两步：先生成文本稿，审核修改后再生成音频。适合正式发布的播客、需要精确控制内容的场合、有多轮审核需求的制作流程。

发起请求

告诉 AI 想使用两阶段模式。AI 会解释核心优势 — 先生成文本稿，人工审核和编辑后再生成音频：

发起两阶段播客请求，AI 解释核心优势

AI 提交文本生成任务，返回 Episode ID。这一步只生成文字内容，不生成音频：

阶段一提交，文本稿生成中

等待几分钟后查询状态，文本稿生成完成。AI 给出完整的内容概要 — 标题、字数、内容结构，以及两个选项：直接生成音频，或先审核修改：

阶段一完成，展示文本稿摘要和审核选项

选择"先审核修改"后，AI 展示完整的文本稿内容结构（约 5000 字，10 个章节），每个章节的主题和核心论点一目了然：

文本稿内容概要：5000 字深度长文的核心结构

AI 同时列出详细的章节目录，并提供编辑入口 — 可以删除、添加、调整任何部分：

10 个章节的详细目录和编辑入口

在这个案例中，审核意见是"保持结构，但让表达更精练、更口语化"。AI 把 5000 字的学术长文精简为 1500 字的对话稿，更符合播客的听觉节奏。

修改后的文本稿确认无误，进入阶段二。AI 用精简后的 27 段对话脚本启动音频生成：

阶段二启动，修改后的文本稿转化为音频

等待 2-3 分钟后，音频生成完成。AI 返回在线收听链接、音频下载地址和字幕文件，同时给出完整的工作流验证信息：

两阶段播客完成，展示链接和工作流验证

两种模式的核心区别：

一阶段与两阶段播客的核心价值对比

日常快速验证想法用一阶段，正式发布或重要内容用两阶段。

完整工作流：

两阶段播客的完整工作流：文本生成 → 人工审核 → 音频生成