批量语音转文字小工具(不限时长)是一款万能君的批量文字转语音小工具,用Python编写过几款小工具,解决了一些刚需,比如音频转文字这种大多数都需要收费的场景。仅支持Windows 64位系统。
软件说明
软件主要实现批量上传音频文件(当前版本仅支持mp3,后续版本可能添加多种格式,可用格式工厂进行mp3格式转换)进行语音转文字的功能,依托于百度AI,语音识别正确率还是相当不错的。
使用教程
严格按照如下步骤来进行操作:
1、KEY的申请
软件上方的APIKEY和SECRETKEY需要去百度AI网页的语音识别板块上申请,完全免费的申请。
如下,打开短语音识别网页:https://ai.baidu.com/tech/speech/asr,点击立即使用。
百度账号登录,进入如下界面,按照箭头先都领取了。
然后创建应用,按照箭头指示随便写即可:
然后查看应用详情里,就能看到APIKEY和SECRETKEY了,复制到软件中即可。
2、选择识别语种
软件一共可选:极速版普通话、免费版普通话、免费版英文、免费版粤语、免费版四川话这几种,其中第一个极速版普通话正确率最高。
3、选择音频转换
点击按钮可批量选择多个mp3音频,然后自动进行转换,识别完成后自动保存识别结果到软件目录的音频转换结果文件夹中
如下测试转换20多分钟的岳云鹏相声,正确率确实不错了。
更新日志
修复部分mp3文件闪退bug。
支持更多音频格式转换,目前支持音频格式:*.mp3;*.wav;*.m4a;*.aac;*.wma;*.flac