ListenHub Skills
进阶能力

两阶段播客

先生成文本稿,审核修改后再生成音频 — 把播客制作从"一锤子买卖"变成可控流程。

普通播客是一步到位:输入主题 → 等待 → 拿到音频。快,但没有中间审核环节。

两阶段播客把这个过程拆成两步:先生成文本稿,审核修改后再生成音频。适合正式发布的播客、需要精确控制内容的场合、有多轮审核需求的制作流程。

发起请求

告诉 AI 想使用两阶段模式。AI 会解释核心优势 — 先生成文本稿,人工审核和编辑后再生成音频:

发起两阶段播客请求,AI 解释核心优势

阶段一:文本稿生成

AI 提交文本生成任务,返回 Episode ID。这一步只生成文字内容,不生成音频:

阶段一提交,文本稿生成中

等待几分钟后查询状态,文本稿生成完成。AI 给出完整的内容概要 — 标题、字数、内容结构,以及两个选项:直接生成音频,或先审核修改:

阶段一完成,展示文本稿摘要和审核选项

审核文本稿

选择"先审核修改"后,AI 展示完整的文本稿内容结构(约 5000 字,10 个章节),每个章节的主题和核心论点一目了然:

文本稿内容概要:5000 字深度长文的核心结构

AI 同时列出详细的章节目录,并提供编辑入口 — 可以删除、添加、调整任何部分:

10 个章节的详细目录和编辑入口

在这个案例中,审核意见是"保持结构,但让表达更精练、更口语化"。AI 把 5000 字的学术长文精简为 1500 字的对话稿,更符合播客的听觉节奏。

阶段二:音频生成

修改后的文本稿确认无误,进入阶段二。AI 用精简后的 27 段对话脚本启动音频生成:

阶段二启动,修改后的文本稿转化为音频

两阶段播客完成

等待 2-3 分钟后,音频生成完成。AI 返回在线收听链接、音频下载地址和字幕文件,同时给出完整的工作流验证信息:

两阶段播客完成,展示链接和工作流验证

一阶段 vs 两阶段

两种模式的核心区别:

一阶段与两阶段播客的核心价值对比

日常快速验证想法用一阶段,正式发布或重要内容用两阶段。

完整工作流:

两阶段播客的完整工作流:文本生成 → 人工审核 → 音频生成

On this page