buzz

Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.

open-sourcevoice-agents
Visit WebsiteView on GitHub
18.4k
Stars
+1536
Stars/month
6
Releases (6m)

Overview

Buzz 是一款基于 OpenAI Whisper 技术的本地音频转录和翻译工具,支持离线处理以保护隐私。该工具可以转录音频和视频文件、YouTube 链接,还提供实时麦克风转录功能。Buzz 支持语音分离技术以提高噪音环境下的转录准确性,具备说话人识别功能,并支持多种 Whisper 后端(包括 CUDA、Apple Silicon 和 Vulkan 加速)。工具提供高级转录查看器,具备搜索、播放控制和速度调整功能,支持导出为 TXT、SRT 和 VTT 格式。监视文件夹功能可自动转录新文件,命令行接口支持脚本化和自动化操作。作为一款跨平台工具,Buzz 在 GitHub 上获得了 18,429 个星标,证明了其在音频转录领域的受欢迎程度。

Pros

  • + 完全离线处理,保护用户隐私,无需将音频数据上传到云端
  • + 支持多平台和多种 GPU 加速(CUDA、Apple Silicon、Vulkan),提供优化的性能
  • + 功能全面,包括实时转录、说话人识别、语音分离和多种导出格式

Cons

  • - Windows 版本未签名,安装时会出现安全警告
  • - PyPI 安装需要特定的 Python 3.12 环境和 ffmpeg 依赖
  • - 高质量转录可能需要较强的硬件配置以支持 GPU 加速

Use Cases

Getting Started

1. 从 SourceForge 下载对应平台的安装包(macOS 下载 .dmg,Windows 下载安装文件,Linux 使用 Flatpak 或 Snap)并完成安装;2. 启动 Buzz 应用程序,首次使用时可能需要下载 Whisper 模型;3. 选择音频或视频文件进行转录,或点击麦克风按钮开始实时转录,转录完成后可导出为所需格式