当前位置:首页 > 民俗文化

speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国

5良好的开源语音识别/语音到文本系统20开源语音识别

它可能是历史上最古老的语音识别软件之一。它的发展始于1991年的京都大学,然后在2005年所有权转移给了一个独立的项目团队。

Julius的主要功能包括执行实时STT的能力、低内存占用(20,000个单词小于64 MB)、输出最佳单词N-最佳单词和单词图的能力以及作为服务器单元运行的能力。这个软件主要是为学术和研究机构设计的。用c语言编写,可以在Linux、Windows、macOS甚至Android(智能手机上)上运行。

目前只支持英语和日语。软件应该很容易从Linux发行仓库安装。在包裹管理器里搜索朱利叶斯。最新版本大概是这篇文章发表前的一个半月。

Wav2Letter++

5良好的开源语音识别/语音到文本系统22开源语音识别

如果你正在寻找一个更时尚的,那么这个一定会适合你。Wav2Letter++是两个月前Facebook的AI研究团队发布的开源语言识别软件。代码在BSD许可下发布。

Facebook将其图书馆描述为“最快、最先进的语音识别系统”。它的构建理念是默认情况下针对性能进行优化。Facebook最新的机器学习库手电筒(手电筒)也被用作Wav2Letter++的底层核心。

Wav2Letter++需要你为描述的语言建立一个模型来训练算法。没有任何语言(包括英语)的预培训模式。它只是一个用C++编写的机器学习驱动的文语转换工具,所以取名Wav2Letter++。

项目主页

深度速度2

5良好的开源语音识别/语音到文本系统24开源语音识别

中国软件巨头百度的研究人员也在开发他们自己的语音到文本转换引擎“深度语音2”。它是一个端到端的开源引擎,使用“PaddlePaddle”深度学习框架来转换英文或中文字符。代码在BSD许可下发布。

引擎可以在你想要的任何模型和任何语言上训练。模型没有随代码一起发布。你必须像其他软件一样建立自己的模型。DeepSpeech2的源代码是用Python写的,用过的话会很好用。

项目主页

总结

语音识别领域仍由专有软件巨头主导,如Google和IBM(为此提供闭源商业服务),但开源类似软件大有可为。这五个开源语音识别引擎应该能够帮助你构建应用,并且随着时间的推移会不断发展。几年后,我们希望开源能像其他行业一样,成为这些技术的规范。

如果您对列表有其他建议或意见,我们很乐意在下面听到。

本文由原创编辑,荣誉推出

1.《speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《speech 5 款不错的开源语音识别/语音文字转换系统 | Linux 中国》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guoji/1067547.html

上一篇

高登 高登商业美食展(Goldenfood expo)全球起航

下一篇

2020双十一成绩单 真相到底是怎样的?

至上励合2012 23支组合,带你见证华语音乐组合发展简史

  • 至上励合2012 23支组合,带你见证华语音乐组合发展简史
  • 至上励合2012 23支组合,带你见证华语音乐组合发展简史
  • 至上励合2012 23支组合,带你见证华语音乐组合发展简史

哇唧唧哇开会语音 具体是啥情况?

  • 哇唧唧哇开会语音 具体是啥情况?
  • 哇唧唧哇开会语音 具体是啥情况?
  • 哇唧唧哇开会语音 具体是啥情况?
虽有至道 第1987季【青春课堂】大道至简,回归原点  ——《虽有嘉肴》拓展型文本教学实录

虽有至道 第1987季【青春课堂】大道至简,回归原点 ——《虽有嘉肴》拓展型文本教学实录

第一语言:面对陌生的先秦文字和各种解释,如何把握准确的教学内容,让学生理解那些文字背后的奥秘?这几乎是我们所有老师的通病。特别是儿童对文言文的天然疏离和恐惧,增加了先秦文学教学的难度。即使在高中课堂上,我们也倾向于翻译文本本身,并浅浅地谈论我们认为自己理解的思想。文言文教学中,“言”往往大于...

python读取txt文件 Python 读取各类文件格式的文本信息 | doc,excel,html,mht

  • python读取txt文件 Python 读取各类文件格式的文本信息 | doc,excel,html,mht
  • python读取txt文件 Python 读取各类文件格式的文本信息 | doc,excel,html,mht
  • python读取txt文件 Python 读取各类文件格式的文本信息 | doc,excel,html,mht

三大电信提速降费 移动下调国家语音和流量漫游资费

2007年3月7日,三大电信公司提高了速度,降低了语音和流量的全国漫游费用。在今年两会上,政府工作报告提到“网络提速降费,取消国内长途和手机漫游费”引起广泛关注。在3月6日国务院新闻办政策吹风会上,中国移动、中国联通、中国...

楼月语音聊天录音软件 QQ录音软件如何实时录制保存QQ语音聊天内容

  • 楼月语音聊天录音软件 QQ录音软件如何实时录制保存QQ语音聊天内容
  • 楼月语音聊天录音软件 QQ录音软件如何实时录制保存QQ语音聊天内容
  • 楼月语音聊天录音软件 QQ录音软件如何实时录制保存QQ语音聊天内容
挣断读音 语音是人类发音器官所发出的代表一定意义的声音

挣断读音 语音是人类发音器官所发出的代表一定意义的声音

语音学是来自人类发音器官的代表某种意义的声音。孩子正常的听力是学习一门语言的前提。每个新生儿出生后48-72小时都应该进行听力筛查,并对他的听力进行快速初步测试。 如果有听力损失,最好尽快做出听力诊断。当局建议所有有听力障碍的婴儿应在3个月内确诊,并在6个月内进行干预。3岁之前,这个时期是孩...

声控男喘文本吸水 古风男声控:沦陷吧,沉醉于柔情的嗓音,快快收纳歌曲!

  • 声控男喘文本吸水 古风男声控:沦陷吧,沉醉于柔情的嗓音,快快收纳歌曲!
  • 声控男喘文本吸水 古风男声控:沦陷吧,沉醉于柔情的嗓音,快快收纳歌曲!
  • 声控男喘文本吸水 古风男声控:沦陷吧,沉醉于柔情的嗓音,快快收纳歌曲!