从想法到文字,
说出来就好。

EasyType 是一个 macOS 菜单栏工具。按一下快捷键开始录音,说完再按一下结束,AI 自动把语音转成文字并注入到光标所在位置——无论你在用什么 App。

语音识别 + AI 润色,两步搞定。

语音先经过 ASR 模型转写为原始文本,再由大语言模型做后处理:去掉口语化的填充词、修正标点、润色表达。你还可以配置术语表,让专有名词转写更准确。整个过程在几秒内完成,结果直接出现在你正在编辑的位置。

快速开始
三步,两分钟。
1
填入 API Key
OpenAI、通义千问
或 DeepSeek
2
设置快捷键
默认 ⌘ ⇧ E
3
开口说话
文字自动出现在光标处

无需注册账号。你的 Key,你的数据,你的电脑。

为什么选择 EasyType
不只是语音转文字
🔑

免费,自带 Key

无需订阅,填入自己的 API Key 即可使用,用多少付多少,成本完全可控。

🌐

境内境外通用

境外用 OpenAI,境内用千问 + DeepSeek,无需特殊网络环境。后续持续接入更多 API。

⌨️

不是输入法,胜似输入法

无需安装或切换输入法,在任何 App 的光标位置直接注入文字,与现有输入法完全共存。

两阶段 AI 处理

ASR 转写 + LLM 润色,输出可以直接用的文字,而不是粗糙的语音识别原文。

📖

术语表提升准确度

添加专业术语、人名、产品名,解决同音字问题,适合专业场景。

🔒

数据本地存储

录音和转写数据存在本地,不经过第三方中转,隐私可控。

功能一览
常驻菜单栏,按需调用,用完即走

设置面板

配置你自己的 API Key,选择语音识别引擎(OpenAI Whisper / 通义千问)和后处理模型(GPT / DeepSeek),调整录音分段时长、自定义后处理提示词。支持中英双语界面。

设置界面

录音历史

每次语音输入自动保存录音和转写结果。支持查看原始文本与润色后文本、重试失败的转写、重新生成,以及一键清除。数据存储在本地。

录音记录

术语表

添加专业术语或常用短语,AI 后处理时会参考这些词汇,显著提升专有名词的转写准确度。

术语表

悬浮状态条

可选的悬浮面板,实时显示当前状态。就绪 → 录音中 → 转写中 → 完成,全程可视。转写完成后可直接在面板上注入文字或复制到剪贴板。

录音中
录音中
转写中
转写中
试试看。

只需要一个 API Key,就能开始用语音输入文字。

下载 macOS 版本
需要 macOS 14 Sonoma 或更高版本 · 安装包仅约 3 MB

作者一直认为,我们应该花更多时间思考,而不是打字。灵感来源:Typeless,以及知名博主 01Coder 的 AirType 项目(视频介绍)。感谢他们的开创性工作。

使用说明

1 安装与启动

  • 下载 DMG,将 EasyType 拖入 Applications 文件夹
  • 首次启动时,系统会要求授予麦克风辅助功能权限
  • 启动后 EasyType 常驻菜单栏,右键图标可打开设置或退出

2 配置 API Key

EasyType 需要调用云端 AI 进行语音转写和文本后处理。根据你的网络环境,推荐以下方案:

境外用户 推荐

语音识别:gpt-4o-mini-transcribe

后处理:gpt-4o-mini / gpt-4o

只需填写一个 OpenAI API Key 即可。

境内用户 免翻墙

语音识别:qwen3-asr通义千问

后处理:deepseek-chat

分别填写 DashScopeDeepSeek 的 API Key,无需科学上网。

提示:填写 Key 后,可以点击「API 连通性测试」按钮来验证 Key 是否可用。
设置界面

填写完 API Key 后,点击「全部测试」按钮,EasyType 会逐一检测所有已配置的 API 是否可用,通过的项目会显示绿色对勾。

API 连通性测试

3 基本使用流程

  • 将光标放在任意输入框中(编辑器、微信、邮件...)
  • 按下快捷键 ⌘ ⇧ E(可自定义),开始录音
  • 自然地说话,说完后再次按下快捷键,或点击悬浮条的 Done
  • EasyType 自动完成:语音转文字 → AI 润色 → 注入到光标处
就绪
① 就绪 — 等待快捷键触发
录音中
② 录音中 — 可暂停或完成
转写中
③ 转写中 — 自动完成后注入文字
插入到光标处
④ 完成 — 点击注入到光标处

4 术语表

在「术语表」页面添加专业词汇或常见名词(如人名、产品名、技术术语),AI 后处理时会优先使用这些词汇,避免同音错别字。

术语表

5 录音管理

所有录音记录可在「录音」页面查看。支持:

  • 查看每条录音的转写结果和时长
  • 一键复制转写文本
  • 重新转写(更换模型后可重跑)
  • 一键清除全部录音
录音记录

6 进阶技巧

  • 自定义后处理提示词:在设置页面底部编辑系统提示词,可以让 AI 按你的风格来润色文本
  • 分段时长:长时间录音会按设定的秒数自动分段上传,默认 60 秒,可调整为 15-300 秒
  • 多语言自动识别:无需手动选择语言,ASR 模型会自动识别你说的语言
  • 中英双语界面:系统自动检测语言偏好,也可手动切换