本地语音转文字STT Powered by Faster Whisper
软件介绍
最近接到一个需求,需要把录音转换为文字,一看网上几款常用的工具,想不到都是收费的;找了找,发现基本上都需要云端api,仅有的几个本地的都需要使用GPU中的cuda计算。因此,开发了这么一款语言转文字的小工具,基于Faster Whisper模型,在cpu上也能达到不错的效果。
软件截图
![]()
使用方法
双击文件打开,在左上角选择模型,左下角选择推理方式与精度(cpu推荐int8,速度更快)。
若没有支持cuda的GPU请不要选择GPU,否则会崩溃(原本想导入pytorch库判断cuda_is_available的,但是这样打出来的包会把一整个pytorch一起打包进去,太大了,后来就没这么处理)
首次使用需要下载模型,进度在console中可见,请耐心等待。
下载地址:
https://www.123pan.com/s/1f5rVv-FEHnH.html
https://pan.baidu.com/s/10WWSUF8TXpHWvaJbp-R33w?pwd=nmga
https://www.alipan.com/s/SGAu6v9m2F4
https://cloud.189.cn/t/67bUBvj63Q7f (访问码:zxr7)
https://pan.quark.cn/s/e61d902be35f
https://pan.xunlei.com/s/VO4cWgOqi99Dg-DqEmPCcz_wA1?pwd=yezd#
https://drive.uc.cn/s/a68808bfc1474?public=1
原文链接:https://www.wawazy.com/09137341.html,转载请注明出处。


评论0