v3.0.0 是声墨 自发布以来最重要的一次里程碑更新,主要带来三件事:本地离线模式正式可用、macOS 全平台支持、以及内置神经网络降噪引擎。
为什么做本地离线
云端版本发布以来,用户反馈两个核心问题:
- 数据隐私:语音要上传到服务器,对隐私敏感场景不适用
- 依赖网络:断网或服务器高峰期会影响使用
本地离线模式解决这两个问题——模型直接在你的设备上运行,语音数据不出本地,无需联网。
本次更新亮点
神经网络降噪
内置 GTCRN 轻量降噪引擎,随应用打包,无需额外下载,针对键盘声、空调声、环境噪声效果显著。
智能剪贴板恢复
开启「自动粘贴」时,粘贴完成后自动恢复剪贴板原有内容,不影响正在复制的其他内容。
系统托盘驻留
应用最小化后在系统托盘驻留,随时单击唤起,不占用任务栏空间。
文件转写压缩格式
新增 MP3、AAC、M4A、OGG 支持,内置 FFmpeg 自动解码,无需手动转换。
神经网络降噪:GTCRN 引擎
以前在嘈杂环境下(键盘声、空调白噪声、人声背景),识别准确率明显下降。v3.0.0 内置了 GTCRN 轻量降噪引擎,在送入 ASR 模型之前先对音频做一次神经网络降噪处理。
- 模型随应用打包,无需额外下载
- 针对键盘声、空调声、环境白噪声效果显著
- 对正常人声几乎无损
macOS 正式支持
此前 macOS 版本一直处于测试阶段,v3.0.0 正式发布双平台支持:
| 平台 | 状态 | 安装包大小 |
|---|---|---|
| Windows(x64) | ✅ 正式支持 | 约 300 MB |
| macOS(Apple Silicon / Intel) | ✅ 正式发布 | 约 800 MB |
macOS 热键双触发问题(录音仅持续 1~2 秒后自动停止)已在本版本修复。
文本后处理升级
转写结果的文字质量在本版本做了全面提升:
- 结构化换行:长段落自动分行,阅读更清晰
- 中文数字规范化:「百分之五十」→「50%」
- 重复词压缩:「那个那个」→「那个」
- 语气词自动清理:嗯 / 呃 / 额 等自动过滤