5良好的开源语音识别/语音到文本系统20开源语音识别
它可能是历史上最古老的语音识别软件之一。它的发展始于1991年的京都大学,然后在2005年所有权转移给了一个独立的项目团队。
Julius的主要功能包括执行实时STT的能力、低内存占用(20,000个单词小于64 MB)、输出最佳单词N-最佳单词和单词图的能力以及作为服务器单元运行的能力。这个软件主要是为学术和研究机构设计的。用c语言编写,可以在Linux、Windows、macOS甚至Android(智能手机上)上运行。
目前只支持英语和日语。软件应该很容易从Linux发行仓库安装。在包裹管理器里搜索朱利叶斯。最新版本大概是这篇文章发表前的一个半月。
Wav2Letter++
5良好的开源语音识别/语音到文本系统22开源语音识别
如果你正在寻找一个更时尚的,那么这个一定会适合你。Wav2Letter++是两个月前Facebook的AI研究团队发布的开源语言识别软件。代码在BSD许可下发布。
Facebook将其图书馆描述为“最快、最先进的语音识别系统”。它的构建理念是默认情况下针对性能进行优化。Facebook最新的机器学习库手电筒(手电筒)也被用作Wav2Letter++的底层核心。
Wav2Letter++需要你为描述的语言建立一个模型来训练算法。没有任何语言(包括英语)的预培训模式。它只是一个用C++编写的机器学习驱动的文语转换工具,所以取名Wav2Letter++。
项目主页
深度速度2
5良好的开源语音识别/语音到文本系统24开源语音识别
中国软件巨头百度的研究人员也在开发他们自己的语音到文本转换引擎“深度语音2”。它是一个端到端的开源引擎,使用“PaddlePaddle”深度学习框架来转换英文或中文字符。代码在BSD许可下发布。
引擎可以在你想要的任何模型和任何语言上训练。模型没有随代码一起发布。你必须像其他软件一样建立自己的模型。DeepSpeech2的源代码是用Python写的,用过的话会很好用。
项目主页
总结
语音识别领域仍由专有软件巨头主导,如Google和IBM(为此提供闭源商业服务),但开源类似软件大有可为。这五个开源语音识别引擎应该能够帮助你构建应用,并且随着时间的推移会不断发展。几年后,我们希望开源能像其他行业一样,成为这些技术的规范。
如果您对列表有其他建议或意见,我们很乐意在下面听到。
本文由原创编辑,荣誉推出
1.《speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guoji/1067547.html