跳转至

常见工作流程

最常见任务的分步操作指南。


快速转录(最简单)

从视频到字幕的最快路径。

  1. 启动 WhisperJAV GUI
  2. 拖放 视频文件到应用中
  3. 保持所有默认设置(Balanced 模式、激进灵敏度、日语)
  4. 点击 Start
  5. SRT 文件出现在视频旁边

耗时: 使用现代 GPU 处理 2 小时视频约需 2-5 分钟。


高质量转录(集成模式)

使用两个不同的语音识别引擎并合并输出,以获得最佳精度。

  1. 进入 Ensemble 标签页
  2. 第一通道: Balanced 处理管线(默认)
  3. 启用第二通道: 勾选 Pass 2 复选框
  4. 第二通道: 选择 Qwen3-ASR
  5. 合并策略: Smart Merge
  6. 点击 Start

两个通道运行后,结果被智能合并。耗时大约是单通道的 2 倍。


ChronosJAV 处理管线(动漫/JAV 内容)

专用处理管线,使用在动漫和 JAV 对白上训练的模型。

  1. 进入 Ensemble 标签页
  2. 第一通道处理管线: 选择 ChronosJAV
  3. 模型: 可选:
    • anime-whisper(约 4GB) — 动漫/JAV 最佳质量
    • Kotoba v2.1(约 2GB) — 更轻量,带标点
    • Kotoba v2.0(约 2GB) — 更轻量,无标点
  4. 点击 Start

提示

要获得最高质量,可以在第一通道使用 anime-whisper,第二通道使用 Qwen3-ASR,配合 Smart Merge。


一步完成转录和翻译

无需额外步骤即可获得翻译好的字幕。

  1. 配置你的转录设置(任意标签页)
  2. Ensemble 标签页中,勾选 "AI-translate"
  3. 选择翻译提供商(DeepSeek、Gemini 等)
  4. 如需要,输入你的 API 密钥
  5. 点击 Start

先运行转录,然后自动对结果进行翻译。


翻译已有的 SRT 文件

使用标签页 4 翻译已有的字幕。

  1. 进入 AI SRT Translate 标签页(标签页 4)
  2. 点击 Add File(s) 选择你的 .srt 文件
  3. 选择提供商模型
  4. 输入你的 API 密钥并点击 Test Connection
  5. 设置目标语言(例如 English)
  6. 选择风格:Standard 或 Adult-Explicit
  7. 点击 Start

说明

Adult-Explicit 风格使用针对 JAV 对白的专门指令和相应词汇。


批量处理(多个文件)

一次处理整个文件夹的视频。

  1. 点击 Add Folder 选择一个包含视频的文件夹
  2. 所有媒体文件被添加到列表中
  3. 配置你的处理管线设置
  4. 点击 Start

文件按顺序处理。每个输出 SRT 保存在源视频旁边(或你选择的输出目录中)。

串行集成模式

在集成模式中,启用 Serial 模式可以先完整处理每个文件(第一通道 → 第二通道 → 合并),再处理下一个。这样可以在结果出来时立即查看,而不必等待整个批次完成。


纯 CPU 模式(无 GPU)

WhisperJAV 没有 GPU 也能工作,只是速度较慢。

  1. 进入 Advanced 标签页
  2. 勾选 "Accept CPU-only mode"
  3. 使用 Faster 模式以获得无 GPU 时的最佳速度
  4. 点击 Start

警告

CPU 模式比 GPU 模式慢 5-10 倍。2 小时的视频可能需要 30-60 分钟。


WebVTT 输出

生成用于 HTML5 视频播放器的 VTT 字幕。

  1. 进入 Advanced 标签页
  2. Output Format 设为 VTTBoth(SRT + VTT)
  3. 按正常流程运行转录

.vtt 文件保存在 .srt 文件旁边。