Featured image of post Whisper 使用指南

Whisper 使用指南

讯飞一类的工具要价太高,被迫找免费版本,属实是不得已而为之。Whisper 是一款免费、本地的语音转文字工具。

基本条件

  1. 独显
  2. Whisper 本体:下载 WhisperDesktop.zip
  3. ggml 语音模型:模型有大小之分,模型越大,占用的硬盘和内存就越多。中等的是 1.5 GB 硬盘,2.6 GB 内存的占用,更多的信息可以看 Available models 表格

用法

  1. 解压 WhisperDesktop.zip
  2. 将下载好的模型文件放到你觉得合适的路径;
  3. 启动 WhisperDesktop.exe
  4. 在 Whisper 中指定模型的加载路径:指定模型路径
  5. 然后在「Advanced…」(高级)中配置显卡设定:指定显卡
  6. 「OK」进入下一步;
  7. 「Language」选择「Chinese」,并去掉「Translate」的勾选,而后,指定待转换文件的路径,在「Output Format」中选择是需要纯文本还是字幕或别的什么类型的文件,输出路径可以选择和输入文件相同(勾选「Place that file to the input folder」),也可以任意指定,一切都设置好以后,点击「Transcribe」:导出设置
  8. 然后它就会调用显卡开始劳动:转录中
  9. 完成!完成
  10. 查看结果:结果

这个结果有点怪,因为这首歌完全是 ChiliChill 的原创,但是一大堆「刘亦凡」不知道是怎么转录出来的,也许是特定的旋律鼓点让我们的模型认为它像是「刘亦凡」罢。

总的来说准确率还是挺高的,有时候会出现莫名其妙的繁体结果,如果是这样,就丢到 Word 里做一下简繁转换即可。

Written by ZexWoo. All rights reserved.
主题 StackJimmy 设计 | 使用 Hugo 搭建