buzz

Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper.

open-sourcevoice-agents
18.5k
Stars
+300
Stars/month
6
Releases (6m)

Star Growth

+56 (0.3%)
18.1k18.5k18.9kMar 27Apr 1

Overview

Buzz 是一款基于 OpenAI Whisper 技术的本地音频转录和翻译工具,支持离线处理以保护隐私。该工具可以转录音频和视频文件、YouTube 链接,还提供实时麦克风转录功能。Buzz 支持语音分离技术以提高噪音环境下的转录准确性,具备说话人识别功能,并支持多种 Whisper 后端(包括 CUDA、Apple Silicon 和 Vulkan 加速)。工具提供高级转录查看器,具备搜索、播放控制和速度调整功能,支持导出为 TXT、SRT 和 VTT 格式。监视文件夹功能可自动转录新文件,命令行接口支持脚本化和自动化操作。作为一款跨平台工具,Buzz 在 GitHub 上获得了 18,429 个星标,证明了其在音频转录领域的受欢迎程度。

Deep Analysis

Key Differentiator

vs Whisper CLI: full GUI with live transcription, speaker ID, and watch folders; vs cloud transcription (AssemblyAI/Deepgram): completely offline with zero data leaving the device

Capabilities

  • Offline audio transcription with Whisper
  • Live real-time microphone transcription
  • Video and YouTube link transcription
  • Speaker identification (diarization)
  • Speech separation for noisy audio
  • Multiple Whisper backend support
  • Export to TXT/SRT/VTT formats
  • Watch folder for automatic transcription

🔗 Integrations

OpenAI WhisperWhisper.cppCUDA (Nvidia GPU)Apple SiliconVulkan GPU acceleration

Best For

  • Offline audio/video transcription with privacy
  • Live presentation captioning
  • Batch transcription of media files

Not Ideal For

  • Cloud-scale transcription services
  • Real-time low-latency streaming transcription APIs

Languages

Python

Deployment

macOS DMGWindows installerLinux Flatpak/Snappip install (PyPI)

Pricing Detail

Free: Fully open-source MIT license
Paid: N/A - free

Known Limitations

  • Transcription speed depends on hardware
  • Large models require significant RAM/VRAM
  • Speaker identification accuracy varies
  • No cloud API - desktop application only

Pros

  • + 完全离线处理,保护用户隐私,无需将音频数据上传到云端
  • + 支持多平台和多种 GPU 加速(CUDA、Apple Silicon、Vulkan),提供优化的性能
  • + 功能全面,包括实时转录、说话人识别、语音分离和多种导出格式

Cons

  • - Windows 版本未签名,安装时会出现安全警告
  • - PyPI 安装需要特定的 Python 3.12 环境和 ffmpeg 依赖
  • - 高质量转录可能需要较强的硬件配置以支持 GPU 加速

Use Cases

  • 转录采访、会议或播客内容,生成可搜索的文本记录
  • 为视频内容创建字幕文件(SRT、VTT 格式),提高内容可访问性
  • 在演示、讲座或会议期间提供实时字幕,支持无障碍访问

Getting Started

1. 从 SourceForge 下载对应平台的安装包(macOS 下载 .dmg,Windows 下载安装文件,Linux 使用 Flatpak 或 Snap)并完成安装;2. 启动 Buzz 应用程序,首次使用时可能需要下载 Whisper 模型;3. 选择音频或视频文件进行转录,或点击麦克风按钮开始实时转录,转录完成后可导出为所需格式

Compare buzz