Skip to content

233stone/vocotype-cli

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

VocoType - 精准的离线语音输入法

您的声音,绝不离开电脑

VocoType 是一款专为注重隐私和效率的专业人士打造的、完全免费的桌面端语音输入法。所有识别均在本地完成,无惧断网,不上传任何数据。

这个 GitHub 项目是 VocoType 核心引擎的 CLI (命令行) 开源版本,主要面向开发者。


➡️ 想获得最佳体验?请立即下载免费桌面版!

开箱即用,功能更完整,无需任何技术背景。

立即访问官网,下载免费、完整的 VocoType 桌面版

功能简介

VocoType 是一款智能语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持 AI 优化文本、自定义替换词典等功能,让语音输入更高效、更准确。

📹 演示视频

下载

OS Download
Windows Setup
macOS DMG DMG

🤔 VocoType 为何与众不同?

特性 VocoType 传统云端输入法 操作系统自带
隐私安全 本地离线,绝不上传 ❌ 数据需上传云端 ⚠️ 隐私政策复杂
网络依赖 完全无需联网 ❌ 必须联网使用 ❌ 强依赖网络
响应速度 0.1 秒级 慢,受网速影响 慢,受网速影响
定制化能力 强大的自定义词表 弱或无 基本没有

✅ 核心功能

  • 完整的图形用户界面:开箱即用,所有操作清晰直观。
  • 系统级全局输入:在任何软件、任何文本框内都能直接语音输入。
  • 自定义词典:支持添加 20 个常用术语、人名,提升识别准确率。
  • 100% 离线运行:绝对的隐私和数据安全。
  • 旗舰级识别引擎:精准识别中英混合内容。
  • AI 智能优化:支持选择多种 AI 模型,通过可定制的 Prompt 模板自动修正语音转录中的错别字、同音字和自我修正,智能识别口语中的修正指令(如"不对"、"改成"等),让输出文本更准确流畅。

(对于有更高需求的专业用户,应用内提供了升级到 Pro 版的选项,以解锁无限词典等高级功能。)

🎯 适用各类专业场景

无论是文字工作者、律师、学者、游戏玩家,还是日常办公,VocoType 都能成为您值得信赖的效率伙伴。

用户 场景
作家与创作者 撰写文章、小说,整理会议纪要,让思绪通过语音即时转化为文字,心无旁骛,专注于创作本身。
法律 & 医疗人士 处理高度敏感的客户信息或病历时,100%离线确保数据安全。自定义词表更能轻松驾驭行业术语。
学生与学者 快速记录课堂笔记、整理访谈录音、撰写学术论文。告别繁琐的打字,将更多精力投入到思考与研究之中。
开发者 & 程序员 无论是与 AI 结对编程,还是撰写技术文档,都能精准识别 functionKubernetes pod 等专业术语。
游戏玩家 在激烈的游戏对战中,通过语音快速打字与队友交流,无需停下操作,保持游戏节奏,提升团队协作效率。

✨ VocoType 核心引擎特性

所有 VocoType 版本共享同一个强大的核心引擎。

  • 🛡️ 100% 离线,隐私无忧:所有语音识别在您的电脑本地完成。
  • ⚡️ 旗舰级识别引擎:中英混合输入同样精准,告别反复修改。
  • ⚙️ 高度可定制:独创的替换词表功能,让人名、地名、行业术语一次就对。
  • 💻 轻量化设计:仅需 700MB 内存,纯 CPU 推理,无需昂贵显卡。
  • 🚀 0.1 秒级响应:感受所言即所得的畅快,让您的灵感不再因等待而中断。

🛠️ 【开发者专属】CLI 版安装指南

请注意: 此版本面向有一定技术背景的开发者。如果您不熟悉命令行,我们强烈建议您访问官网,下载简单易用的 VocoType 免费桌面版

1. 环境依赖

  • Python 3.12
  • 我们强烈建议使用 uvvenv 创建虚拟环境。

2. 克隆与安装

# 1. 克隆仓库
git clone https://github.com/233stone/vocotype-cli.git
cd vocotype-cli

# 2. (推荐) 创建并激活虚拟环境
pip install uv
uv venv --python 3.12
source .venv/bin/activate  # macOS/Linux
# 或者 .\.venv\Scripts\activate  (Windows)

# 3. 安装依赖
uv pip install -r requirements.txt

# 4. 运行
python main.py

# 保存数据集运行
python main.py --save-dataset

模型下载:首次运行时,程序会自动下载约 500MB 的模型文件,请确保网络连接稳定。

常见问题 (FAQ)

Q: 我的数据安全吗?

A: 100%安全。所有语音识别均在本地离线完成,您的音频数据不会上传到任何服务器。

📞 联系我们

  • Bug 与建议:请优先使用 GitHub Issues。
  • 关注我们获取最新动态https://vocotype.com

🙏 致谢

VocoType 的诞生离不开以下优秀的开源项目:

  • FunASR - 阿里巴巴达摩院开源的语音识别框架,为 VocoType 提供了强大的离线语音识别能力。
  • QuQu - 优秀的开源项目,为 VocoType 提供了重要的技术参考和灵感。

感谢这些开源社区的无私贡献!

About

一个语音输入法cli

Topics

Resources

License

Stars

Watchers

Forks

Languages