VocoType 是一款专为注重隐私和效率的专业人士打造的、完全免费的桌面端语音输入法。所有识别均在本地完成,无惧断网,不上传任何数据。
这个 GitHub 项目是 VocoType 核心引擎的 CLI (命令行) 开源版本,主要面向开发者。
开箱即用,功能更完整,无需任何技术背景。
VocoType 是一款智能语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持 AI 优化文本、自定义替换词典等功能,让语音输入更高效、更准确。
| OS | Download |
|---|---|
| Windows | |
| macOS |
| 特性 | ✅ VocoType | 传统云端输入法 | 操作系统自带 |
|---|---|---|---|
| 隐私安全 | 本地离线,绝不上传 | ❌ 数据需上传云端 | |
| 网络依赖 | 完全无需联网 | ❌ 必须联网使用 | ❌ 强依赖网络 |
| 响应速度 | 0.1 秒级 | 慢,受网速影响 | 慢,受网速影响 |
| 定制化能力 | 强大的自定义词表 | 弱或无 | 基本没有 |
- 完整的图形用户界面:开箱即用,所有操作清晰直观。
- 系统级全局输入:在任何软件、任何文本框内都能直接语音输入。
- 自定义词典:支持添加 20 个常用术语、人名,提升识别准确率。
- 100% 离线运行:绝对的隐私和数据安全。
- 旗舰级识别引擎:精准识别中英混合内容。
- AI 智能优化:支持选择多种 AI 模型,通过可定制的 Prompt 模板自动修正语音转录中的错别字、同音字和自我修正,智能识别口语中的修正指令(如"不对"、"改成"等),让输出文本更准确流畅。
(对于有更高需求的专业用户,应用内提供了升级到 Pro 版的选项,以解锁无限词典等高级功能。)
无论是文字工作者、律师、学者、游戏玩家,还是日常办公,VocoType 都能成为您值得信赖的效率伙伴。
| 用户 | 场景 |
|---|---|
| 作家与创作者 | 撰写文章、小说,整理会议纪要,让思绪通过语音即时转化为文字,心无旁骛,专注于创作本身。 |
| 法律 & 医疗人士 | 处理高度敏感的客户信息或病历时,100%离线确保数据安全。自定义词表更能轻松驾驭行业术语。 |
| 学生与学者 | 快速记录课堂笔记、整理访谈录音、撰写学术论文。告别繁琐的打字,将更多精力投入到思考与研究之中。 |
| 开发者 & 程序员 | 无论是与 AI 结对编程,还是撰写技术文档,都能精准识别 function、Kubernetes pod 等专业术语。 |
| 游戏玩家 | 在激烈的游戏对战中,通过语音快速打字与队友交流,无需停下操作,保持游戏节奏,提升团队协作效率。 |
所有 VocoType 版本共享同一个强大的核心引擎。
- 🛡️ 100% 离线,隐私无忧:所有语音识别在您的电脑本地完成。
- ⚡️ 旗舰级识别引擎:中英混合输入同样精准,告别反复修改。
- ⚙️ 高度可定制:独创的替换词表功能,让人名、地名、行业术语一次就对。
- 💻 轻量化设计:仅需 700MB 内存,纯 CPU 推理,无需昂贵显卡。
- 🚀 0.1 秒级响应:感受所言即所得的畅快,让您的灵感不再因等待而中断。
请注意: 此版本面向有一定技术背景的开发者。如果您不熟悉命令行,我们强烈建议您访问官网,下载简单易用的 VocoType 免费桌面版。
- Python 3.12
- 我们强烈建议使用
uv或venv创建虚拟环境。
# 1. 克隆仓库
git clone https://github.com/233stone/vocotype-cli.git
cd vocotype-cli
# 2. (推荐) 创建并激活虚拟环境
pip install uv
uv venv --python 3.12
source .venv/bin/activate # macOS/Linux
# 或者 .\.venv\Scripts\activate (Windows)
# 3. 安装依赖
uv pip install -r requirements.txt
# 4. 运行
python main.py
# 保存数据集运行
python main.py --save-dataset模型下载:首次运行时,程序会自动下载约 500MB 的模型文件,请确保网络连接稳定。
Q: 我的数据安全吗?
A: 100%安全。所有语音识别均在本地离线完成,您的音频数据不会上传到任何服务器。
- Bug 与建议:请优先使用 GitHub Issues。
- 关注我们获取最新动态:https://vocotype.com
VocoType 的诞生离不开以下优秀的开源项目:
感谢这些开源社区的无私贡献!