更新日志 - 声墨

v3.1.5

2026-05-06

🎉 品牌里程碑

声墨完成新一轮品牌视觉升级：VoiceInk 字标、官网导航 LOGO 与产品展示图统一更新，整体视觉更清晰、更一致。
App 图标从原有 2D 风格升级为新的立体品牌图标，覆盖应用入口、浏览器 favicon、文档站与后续客户端展示场景。
“小墨”作为声墨形象代言人正式亮相，与 VoiceInk 字标、App 图标共同组成声墨的新品牌三件套。

v3.1.4

2026-05-05

✨ 新功能

新增「按住说话」录音模式（Windows）：在设置中开启后，按住 Ctrl / Alt / Shift 任一边即开始录音，松手立即停止；启用期间会暂时停用 F11 双击录音以避免相互干扰，关闭开关即可恢复。
录音提示音新增「竹林木鱼」与「水晶铃」两个风格，配合原有风格更易挑到适合自己的声音反馈。
设置页声音风格改为卡片网格，每张卡片可独立试听开始音与结束音，对比挑选更直观。

v3.1.3

2026-05-05

🚀 体验优化

升级品牌视觉：应用图标与启动页更换为新的“声墨导航员”形象。
同步更新 Windows、macOS 等平台打包图标，安装包、任务栏、托盘等场景显示更统一。
如果重新安装后仍看到旧图标，可优先刷新快捷方式或系统图标缓存。

v3.1.2

2026-04-26

🔧 小修复

修复 VPN 全局代理环境下本地 ASR 无法正常连接的问题。

v3.1.1

2026-04-21

🔧 小修复

修复录音结束后浏览器的声音偶尔自己不会恢复到录音前的状态。

v3.1.0

2026-03-29

🔌 开发者接入更新

完善本地 HTTP 接入文档：新增接入流程、能力边界、接口示例，方便开发者和 AI 智能体集成。
统一端口说明：默认端口 9532，可通过环境变量 VOICEINK_ASR_PORT 修改。

v3.0.0

2026-03-26

🎉 里程碑版本

里程碑更新：本地离线模式正式发布 × Windows & macOS 全平台支持。

新功能

神经网络降噪：内置 GTCRN 轻量降噪引擎，自动过滤键盘声、空调声、环境白噪声，提升嘈杂环境下的转写准确率，模型随应用打包，无需额外下载。
智能剪贴板恢复：开启「自动粘贴」时，粘贴完成后自动恢复剪贴板原有内容，不影响正在复制的其他内容。
系统托盘驻留：应用最小化后在系统托盘驻留，随时单击唤起，不占用任务栏空间。
文件转写支持压缩格式：新增 MP3、AAC、M4A、OGG 等主流格式支持，内置 FFmpeg 自动解码，无需手动转换。

功能增强

文本后处理升级：结构化换行、长段落自动分行、中文数字规范化、重复词压缩与语气词自动清理。
macOS 热键修复：修复热键双触发导致录音仅持续 1～2 秒后自动停止的问题。

平台支持

平台	状态	包大小
Windows（x64）	✅ 正式支持	约 300 MB
macOS（Apple Silicon / Intel）	✅ 正式发布	约 800 MB

v2.x 版本历史

v2.9.5

2026-03-17

中文数字转换优化：更精准识别数字语境，如「三秒」→「3 秒」。
前后端转写规则对齐：Python 后端补齐语气词清理、标点规范化等规则。
修复 SenseVoice 在中文系统路径下安装名冲突导致无法加载的问题。

v2.9.4

2026-03-16

CPU 版本正式可用：本地离线模式无需 GPU 即可运行。

v2.9.3

2026-03-09

本地 ASR 全链路打通：前端与本地 Python 服务端到端联调，支持实时录音转写。
文件转写支持本地引擎。

v2.9.2

2026-03-05

Python ASR 服务：全新本地后端，支持多种 ASR 引擎（Paraformer、SenseVoice、faster-whisper）。
Tauri 后端新增本地语音识别服务的启动、监控与停止管理。

v2.9.1

2026-03-02

修复下载链接失效问题；下载链接改为固定文件名。

v2.9.0

2026-02-06

品牌名称统一为 VoiceInk / 声墨；开始准备支持 macOS 端界面。

v2.8.1

2026-02-06

添加会话超时状态持久显示功能；优化服务器连接检测与节点管理。

v2.8.0

2026-02-01

双语翻译展示：AI 翻译结果同时显示原文和译文。
支持 55 种常用语言选择，另支持自定义方言、古语、小语种。

v2.7.0

2026-01-19

支持录音语言选择，提升多语言识别准确率。

v2.5.0 – v2.6.0

2026-01-15 / 17

全新界面优化；左下角状态管理区域升级。
增加使用帮助入口；导入官方网站链接；创建 QQ / 微信群社群。

v2.4.0

2026-01-13

支持文件转录功能：导入音频或视频文件，一键生成 SRT 字幕或 TXT 文本。
录音优先模式；导入 WAV 音频裁剪功能。

v2.3.0

2026-01-11

支持行业词汇选择与自定义，提升专业领域识别准确率。

v2.0.0

2026-01-05

轻量化纯云端版本，安装包约 21MB。
全局热键语音转写、耳语模式、AI 智能润色与纠错、多语言翻译、转录历史本地存储。

v1.x 及更早版本

v1.9

2025-12

支持服务节点选择，为更多节点扩展做准备。

v1.8

2025-11

支持界面语言切换（简体中文 / 英文）。

v1.7

2025-11

增加主题管理；支持全局字体设置。

v1.4 – v1.6

2025-09 / 10

增加提示词补充说明。
支持数据一键清除；增加本地服务存储统计。
增加自动清理历史记录功能。

v1.3

2025-08

录音时自动静音系统扬声器，录音结束后自动恢复。

v1.0.0

2025-06

支持云端模式：无需本地显卡，通过云端服务器完成语音识别。
云端 / 本地双模式切换。

v0.1

2025-05

项目雏形版本，支持本地模型 ASR 语音识别。

👤 个人开发说明

后续开发清单

这个项目目前还是由我个人在持续维护。大家在群里提到的问题、修复建议和功能想法，我都会认真看，也会尽量整理进公开清单里，后面按优先级一点点往前推进。

💬 想提前说明的一点

因为我是个人开发者，没办法把所有精力长期都放在这一个应用上，所以这里不会对每一项功能或修复给出明确的时间承诺。只要已经记录进清单，我都会尽量逐步完成，但先后顺序和更新时间会受实际时间安排影响。

如果某个问题或需求暂时没有第一时间上线，不代表不会继续做，也不代表被忽略。后续进展我会尽量通过官网公告和更新日志同步，也感谢大家一直以来的反馈、耐心和理解。

📌 开发清单

下面这个区域用于持续维护完整的后续开发清单。你后面可以像更新日志一样，按模块、优先级或阶段逐条补充。

🧾 待补充完整清单内容。