常见工作流程¶
最常见任务的分步操作指南。
快速转录(最简单)¶
从视频到字幕的最快路径。
- 启动 WhisperJAV GUI
- 拖放 视频文件到应用中
- 保持所有默认设置(Balanced 模式、激进灵敏度、日语)
- 点击 Start
- SRT 文件出现在视频旁边
耗时: 使用现代 GPU 处理 2 小时视频约需 2-5 分钟。
高质量转录(集成模式)¶
使用两个不同的语音识别引擎并合并输出,以获得最佳精度。
- 进入 Ensemble 标签页
- 第一通道: Balanced 处理管线(默认)
- 启用第二通道: 勾选 Pass 2 复选框
- 第二通道: 选择 Qwen3-ASR
- 合并策略: Smart Merge
- 点击 Start
两个通道运行后,结果被智能合并。耗时大约是单通道的 2 倍。
ChronosJAV 处理管线(动漫/JAV 内容)¶
专用处理管线,使用在动漫和 JAV 对白上训练的模型。
- 进入 Ensemble 标签页
- 第一通道处理管线: 选择 ChronosJAV
- 模型: 可选:
- anime-whisper(约 4GB) — 动漫/JAV 最佳质量
- Kotoba v2.1(约 2GB) — 更轻量,带标点
- Kotoba v2.0(约 2GB) — 更轻量,无标点
- 点击 Start
提示
要获得最高质量,可以在第一通道使用 anime-whisper,第二通道使用 Qwen3-ASR,配合 Smart Merge。
一步完成转录和翻译¶
无需额外步骤即可获得翻译好的字幕。
- 配置你的转录设置(任意标签页)
- 在 Ensemble 标签页中,勾选 "AI-translate"
- 选择翻译提供商(DeepSeek、Gemini 等)
- 如需要,输入你的 API 密钥
- 点击 Start
先运行转录,然后自动对结果进行翻译。
翻译已有的 SRT 文件¶
使用标签页 4 翻译已有的字幕。
- 进入 AI SRT Translate 标签页(标签页 4)
- 点击 Add File(s) 选择你的
.srt文件 - 选择提供商和模型
- 输入你的 API 密钥并点击 Test Connection
- 设置目标语言(例如 English)
- 选择风格:Standard 或 Adult-Explicit
- 点击 Start
说明
Adult-Explicit 风格使用针对 JAV 对白的专门指令和相应词汇。
批量处理(多个文件)¶
一次处理整个文件夹的视频。
- 点击 Add Folder 选择一个包含视频的文件夹
- 所有媒体文件被添加到列表中
- 配置你的处理管线设置
- 点击 Start
文件按顺序处理。每个输出 SRT 保存在源视频旁边(或你选择的输出目录中)。
串行集成模式
在集成模式中,启用 Serial 模式可以先完整处理每个文件(第一通道 → 第二通道 → 合并),再处理下一个。这样可以在结果出来时立即查看,而不必等待整个批次完成。
纯 CPU 模式(无 GPU)¶
WhisperJAV 没有 GPU 也能工作,只是速度较慢。
- 进入 Advanced 标签页
- 勾选 "Accept CPU-only mode"
- 使用 Faster 模式以获得无 GPU 时的最佳速度
- 点击 Start
警告
CPU 模式比 GPU 模式慢 5-10 倍。2 小时的视频可能需要 30-60 分钟。
WebVTT 输出¶
生成用于 HTML5 视频播放器的 VTT 字幕。
- 进入 Advanced 标签页
- 将 Output Format 设为 VTT 或 Both(SRT + VTT)
- 按正常流程运行转录
.vtt 文件保存在 .srt 文件旁边。