buzz
Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.
open-sourcevoice-agents
18.4k
Stars
+1536
Stars/month
6
Releases (6m)
Overview
Buzz 是一款基于 OpenAI Whisper 技术的本地音频转录和翻译工具,支持离线处理以保护隐私。该工具可以转录音频和视频文件、YouTube 链接,还提供实时麦克风转录功能。Buzz 支持语音分离技术以提高噪音环境下的转录准确性,具备说话人识别功能,并支持多种 Whisper 后端(包括 CUDA、Apple Silicon 和 Vulkan 加速)。工具提供高级转录查看器,具备搜索、播放控制和速度调整功能,支持导出为 TXT、SRT 和 VTT 格式。监视文件夹功能可自动转录新文件,命令行接口支持脚本化和自动化操作。作为一款跨平台工具,Buzz 在 GitHub 上获得了 18,429 个星标,证明了其在音频转录领域的受欢迎程度。
Pros
- + 完全离线处理,保护用户隐私,无需将音频数据上传到云端
- + 支持多平台和多种 GPU 加速(CUDA、Apple Silicon、Vulkan),提供优化的性能
- + 功能全面,包括实时转录、说话人识别、语音分离和多种导出格式
Cons
- - Windows 版本未签名,安装时会出现安全警告
- - PyPI 安装需要特定的 Python 3.12 环境和 ffmpeg 依赖
- - 高质量转录可能需要较强的硬件配置以支持 GPU 加速
Use Cases
- • 转录采访、会议或播客内容,生成可搜索的文本记录
- • 为视频内容创建字幕文件(SRT、VTT 格式),提高内容可访问性
- • 在演示、讲座或会议期间提供实时字幕,支持无障碍访问
Getting Started
1. 从 SourceForge 下载对应平台的安装包(macOS 下载 .dmg,Windows 下载安装文件,Linux 使用 Flatpak 或 Snap)并完成安装;2. 启动 Buzz 应用程序,首次使用时可能需要下载 Whisper 模型;3. 选择音频或视频文件进行转录,或点击麦克风按钮开始实时转录,转录完成后可导出为所需格式