v3.1.5

2026-05-06
🎉 品牌里程碑
  • 声墨完成新一轮品牌视觉升级:VoiceInk 字标、官网导航 LOGO 与产品展示图统一更新,整体视觉更清晰、更一致。
  • App 图标从原有 2D 风格升级为新的立体品牌图标,覆盖应用入口、浏览器 favicon、文档站与后续客户端展示场景。
  • “小墨”作为声墨形象代言人正式亮相,与 VoiceInk 字标、App 图标共同组成声墨的新品牌三件套。

v3.1.4

2026-05-05
✨ 新功能
  • 新增「按住说话」录音模式(Windows):在设置中开启后,按住 Ctrl / Alt / Shift 任一边即开始录音,松手立即停止;启用期间会暂时停用 F11 双击录音以避免相互干扰,关闭开关即可恢复。
  • 录音提示音新增「竹林木鱼」与「水晶铃」两个风格,配合原有风格更易挑到适合自己的声音反馈。
  • 设置页声音风格改为卡片网格,每张卡片可独立试听开始音与结束音,对比挑选更直观。

v3.1.3

2026-05-05
🚀 体验优化
  • 升级品牌视觉:应用图标与启动页更换为新的“声墨导航员”形象。
  • 同步更新 Windows、macOS 等平台打包图标,安装包、任务栏、托盘等场景显示更统一。
  • 如果重新安装后仍看到旧图标,可优先刷新快捷方式或系统图标缓存。

v3.1.2

2026-04-26
🔧 小修复
  • 修复 VPN 全局代理环境下本地 ASR 无法正常连接的问题。

v3.1.1

2026-04-21
🔧 小修复
  • 修复录音结束后浏览器的声音偶尔自己不会恢复到录音前的状态。

v3.1.0

2026-03-29
🔌 开发者接入更新
  • 完善本地 HTTP 接入文档:新增接入流程、能力边界、接口示例,方便开发者和 AI 智能体集成。
  • 统一端口说明:默认端口 9532,可通过环境变量 VOICEINK_ASR_PORT 修改。

v3.0.0

2026-03-26
🎉 里程碑版本

里程碑更新:本地离线模式正式发布 × Windows & macOS 全平台支持。

新功能

  • 神经网络降噪:内置 GTCRN 轻量降噪引擎,自动过滤键盘声、空调声、环境白噪声,提升嘈杂环境下的转写准确率,模型随应用打包,无需额外下载。
  • 智能剪贴板恢复:开启「自动粘贴」时,粘贴完成后自动恢复剪贴板原有内容,不影响正在复制的其他内容。
  • 系统托盘驻留:应用最小化后在系统托盘驻留,随时单击唤起,不占用任务栏空间。
  • 文件转写支持压缩格式:新增 MP3、AAC、M4A、OGG 等主流格式支持,内置 FFmpeg 自动解码,无需手动转换。

功能增强

  • 文本后处理升级:结构化换行、长段落自动分行、中文数字规范化、重复词压缩与语气词自动清理。
  • macOS 热键修复:修复热键双触发导致录音仅持续 1~2 秒后自动停止的问题。

平台支持

平台状态包大小
Windows(x64)✅ 正式支持约 300 MB
macOS(Apple Silicon / Intel)✅ 正式发布约 800 MB
v2.x 版本历史

v2.9.5

2026-03-17
  • 中文数字转换优化:更精准识别数字语境,如「三秒」→「3 秒」。
  • 前后端转写规则对齐:Python 后端补齐语气词清理、标点规范化等规则。
  • 修复 SenseVoice 在中文系统路径下安装名冲突导致无法加载的问题。

v2.9.4

2026-03-16
  • CPU 版本正式可用:本地离线模式无需 GPU 即可运行。

v2.9.3

2026-03-09
  • 本地 ASR 全链路打通:前端与本地 Python 服务端到端联调,支持实时录音转写。
  • 文件转写支持本地引擎。

v2.9.2

2026-03-05
  • Python ASR 服务:全新本地后端,支持多种 ASR 引擎(Paraformer、SenseVoice、faster-whisper)。
  • Tauri 后端新增本地语音识别服务的启动、监控与停止管理。

v2.9.1

2026-03-02
  • 修复下载链接失效问题;下载链接改为固定文件名。

v2.9.0

2026-02-06
  • 品牌名称统一为 VoiceInk / 声墨;开始准备支持 macOS 端界面。

v2.8.1

2026-02-06
  • 添加会话超时状态持久显示功能;优化服务器连接检测与节点管理。

v2.8.0

2026-02-01
  • 双语翻译展示:AI 翻译结果同时显示原文和译文。
  • 支持 55 种常用语言选择,另支持自定义方言、古语、小语种。

v2.7.0

2026-01-19
  • 支持录音语言选择,提升多语言识别准确率。

v2.5.0 – v2.6.0

2026-01-15 / 17
  • 全新界面优化;左下角状态管理区域升级。
  • 增加使用帮助入口;导入官方网站链接;创建 QQ / 微信群社群。

v2.4.0

2026-01-13
  • 支持文件转录功能:导入音频或视频文件,一键生成 SRT 字幕或 TXT 文本。
  • 录音优先模式;导入 WAV 音频裁剪功能。

v2.3.0

2026-01-11
  • 支持行业词汇选择与自定义,提升专业领域识别准确率。

v2.0.0

2026-01-05
  • 轻量化纯云端版本,安装包约 21MB。
  • 全局热键语音转写、耳语模式、AI 智能润色与纠错、多语言翻译、转录历史本地存储。
v1.x 及更早版本

v1.9

2025-12
  • 支持服务节点选择,为更多节点扩展做准备。

v1.8

2025-11
  • 支持界面语言切换(简体中文 / 英文)。

v1.7

2025-11
  • 增加主题管理;支持全局字体设置。

v1.4 – v1.6

2025-09 / 10
  • 增加提示词补充说明。
  • 支持数据一键清除;增加本地服务存储统计。
  • 增加自动清理历史记录功能。

v1.3

2025-08
  • 录音时自动静音系统扬声器,录音结束后自动恢复。

v1.0.0

2025-06
  • 支持云端模式:无需本地显卡,通过云端服务器完成语音识别。
  • 云端 / 本地双模式切换。

v0.1

2025-05
  • 项目雏形版本,支持本地模型 ASR 语音识别。
👤 个人开发说明

后续开发清单

这个项目目前还是由我个人在持续维护。大家在群里提到的问题、修复建议和功能想法,我都会认真看,也会尽量整理进公开清单里,后面按优先级一点点往前推进。

💬 想提前说明的一点

因为我是个人开发者,没办法把所有精力长期都放在这一个应用上,所以这里不会对每一项功能或修复给出明确的时间承诺。只要已经记录进清单,我都会尽量逐步完成,但先后顺序和更新时间会受实际时间安排影响。

如果某个问题或需求暂时没有第一时间上线,不代表不会继续做,也不代表被忽略。后续进展我会尽量通过官网公告和更新日志同步,也感谢大家一直以来的反馈、耐心和理解。

📌 开发清单

下面这个区域用于持续维护完整的后续开发清单。你后面可以像更新日志一样,按模块、优先级或阶段逐条补充。

🧾 待补充完整清单内容。