loading…
Search for a command to run...
loading…
VocoType 是一款运行在本地端侧的隐私安全语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持语音转文字MCP、AI 优化文本、自定义替换词典、录音视频转文字等功能,让语音输入更高效、更安全。
VocoType 是一款运行在本地端侧的隐私安全语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持语音转文字MCP、AI 优化文本、自定义替换词典、录音视频转文字等功能,让语音输入更高效、更安全。
VocoType 是一款专为注重隐私和效率的专业人士打造的、完全免费的桌面端语音输入法。所有识别均在本地完成,无惧断网,不上传任何数据。
这个 GitHub 项目是 VocoType 核心引擎的 CLI (命令行) 开源版本,主要面向开发者。
开箱即用,功能更完整,无需任何技术背景。
VocoType 是一款智能语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持MCP语音转文字、 AI 优化文本、自定义替换词典等功能,让语音输入更高效、更准确。
| OS | Download |
|---|---|
| Windows | Setup |
| macOS | DMG DMG |
| 特性 | ✅ VocoType | 传统云端输入法 | 操作系统自带 |
|---|---|---|---|
| 隐私安全 | 本地离线,绝不上传 | ❌ 数据需上传云端 | ⚠️ 隐私政策复杂 |
| 网络依赖 | 完全无需联网 | ❌ 必须联网使用 | ❌ 强依赖网络 |
| 响应速度 | 0.1 秒级 | 慢,受网速影响 | 慢,受网速影响 |
| 定制化能力 | 强大的自定义词表 | 弱或无 | 基本没有 |
(对于有更高需求的专业用户,应用内提供了升级到 Pro 版的选项,以解锁无限词典等高级功能。)
无论是文字工作者、律师、学者、游戏玩家,还是日常办公,VocoType 都能成为您值得信赖的效率伙伴。
| 用户 | 场景 |
|---|---|
| 作家与创作者 | 撰写文章、小说,整理会议纪要,让思绪通过语音即时转化为文字,心无旁骛,专注于创作本身。 |
| 法律 & 医疗人士 | 处理高度敏感的客户信息或病历时,100%离线确保数据安全。自定义词表更能轻松驾驭行业术语。 |
| 学生与学者 | 快速记录课堂笔记、整理访谈录音、撰写学术论文。告别繁琐的打字,将更多精力投入到思考与研究之中。 |
| 开发者 & 程序员 | 无论是与 AI 结对编程,还是撰写技术文档,都能精准识别 function、Kubernetes pod 等专业术语。 |
| 游戏玩家 | 在激烈的游戏对战中,通过语音快速打字与队友交流,无需停下操作,保持游戏节奏,提升团队协作效率。 |
所有 VocoType 版本共享同一个强大的核心引擎。
请注意: 此版本面向有一定技术背景的开发者。如果您不熟悉命令行,我们强烈建议您访问官网,下载简单易用的 VocoType 免费桌面版。
uv 或 venv 创建虚拟环境。# 1. 克隆仓库
git clone https://github.com/233stone/vocotype-cli.git
cd vocotype-cli
# 2. (推荐) 创建并激活虚拟环境
pip install uv
uv venv --python 3.12
source .venv/bin/activate # macOS/Linux
# 或者 .\.venv\Scripts\activate (Windows)
# 3. 安装依赖
uv pip install -r requirements.txt
# 4. 运行
python main.py
# 保存数据集运行
python main.py --save-dataset
模型下载:首次运行时,程序会自动下载约 500MB 的模型文件,请确保网络连接稳定。
除了默认的本地 FunASR 离线引擎,VocoType CLI 还支持接入火山引擎豆包大模型流式语音识别作为云端识别后端。
| 特性 | 本地 FunASR | Volcengine BigASR |
|---|---|---|
| 网络要求 | 无 | 需要联网 |
| 模型下载 | ~500 MB | 无需下载 |
| 响应延迟 | 本地推理 | 云端极低延迟 |
| 识别质量 | 高 | 旗舰级大模型 |
| 数据隐私 | 完全离线 | 音频发送至火山引擎 |
登录火山引擎控制台,创建一个语音应用,获取 App Key 和 Access Key。
在项目目录创建 config.json:
{
"backend": "volcengine",
"volcengine": {
"app_key": "YOUR_APP_KEY",
"access_key": "YOUR_ACCESS_KEY",
"resource_id": "volc.bigasr.sauc.duration",
"enable_punc": true,
"enable_itn": true
}
}
--config 参数启动:python main.py --config config.json
注意:使用 Volcengine 后端时,录音数据会发送到火山引擎服务器进行识别,不再完全离线。如对隐私有严格要求,请继续使用默认的本地 FunASR 后端。
Q: 我的数据安全吗?
A: 100%安全。所有语音识别均在本地离线完成,您的音频数据不会上传到任何服务器。
VocoType 的诞生离不开以下优秀的开源项目:
感谢这些开源社区的无私贡献!
Добавь это в claude_desktop_config.json и перезапусти Claude Desktop.
{
"mcpServers": {
"vocotype": {
"command": "npx",
"args": []
}
}
}Web content fetching and conversion for efficient LLM usage.
Retrieval from AWS Knowledge Base using Bedrock Agent Runtime.
Provides auto-configuration for setting up an MCP server in Spring Boot applications.
A very streamlined mcp client that supports calling and monitoring stdio/sse/streamableHttp, and can also view request responses through the /logs page. It also