重要通知
《科学技术创新》版面紧张,请大家踊跃投稿。投稿邮箱 :kxjscx@kxjscxzzs.com
科学技术创新期刊信息

主管单位:黑龙江省科学技术协会

主办单位:黑龙江省科普事业中心

编辑出版:《科学技术创新》杂志社

国际标准刊号:ISSN:2096-4390

国内统一刊号:CN:23-1600/N

期刊级别:省级刊物

周   期: 旬刊

出 版 地:黑龙江省哈尔滨市

语  种: 中文;

开  本: 大16开

邮发代号 :14-269

投稿邮箱 :kxjscx@kxjscxzzs.com

在线编辑QQ :959914545

人工智能之语音智能控制的实现

时间:2019-11-03  点击:624


       

叶圣

摘  要:该文将基于百度API实现对电脑的语音智能控制,不需要任何硬件上的支持,仅仅依靠一台电脑即可实现。并且经过测试,效果不错,同时可以依据笔者所给出的代码进行修改加入自己需要的功能,而所有代码的实现都是依靠Python编程实现。试想,通过语音实现对电脑的控制,而电脑又可以对其他硬件进行控制,那么即可实现语音对其他硬件的控制,达到智能家具的效果。

关键词:人工智能  语音识别  智能控制

中图分类号:TN912.3                             文献标识码:A                          文章编号:1672-3791(2019)03(a)-0019-03

在人工智能的发展越来越火热的今天,其中智能应用也在伴随着我们的生活,其中最为典型的便是语音识别,近几年来,语音识别技术取得显著进步,同时语音识别技术也慢慢渗入了工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别最基本的思想包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等,而这里笔者将对语音识别进行生活中的很好应用,让机器能聽懂人类讲话,并做出操作控制。

首先我们选用的编程语言是Python,要用到的模块有jieba模块,用以实现对中文语句进行分段;os、win32con和sys模块用来实现对电脑的控制;time模块用来延时;wave和pyaudio模块用来录音;pygame模块用来播放声音;pynput模块用来控制键盘;random模块随机选取;其中导入模块这一段代码为:

然后在百度API申请账号可以得到密码和用户名,申请语音识别项目,至于为什么不用电脑自带的微软语音识别,是考虑到其识别效果的不准确。其中这一段代码为:

APP_ID = '15118279'#百度分配的APP_ID注册时可以看到,这里是我的

API_KEY = 'xUx0Gm2AG2YMtA3FnGfwoKdP'#百度分配的API_KEY注册时可以看到,这里是我的

SECRET_KEY = 'hdxyMvABhUD4xnacGtDdeHbEOUGmdjNx'#百度分配的SECRET_KEY注册时可以看到,这里是我的

然后用代码client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)实现对百度语音识别的调用;result = client.synthesis('语音控制开始', 'zh', 1, {'vol': 5,})用以标志语音控制的开始语句,同时接上下面的判断语句判断模块调用是否成功:

至此,语音控制功能基本实现,其中包括的功能有语音播放音乐、语音打开浏览器并搜索你所的话、语音打开优酷、语音打开酷狗、语音实现自动关机,并且进过测试,其中语音识别效果甚好,即使你的声音很沧桑,很小也可以识别得很准确,所以说这一项应用的实现是真正有价值的,并且其中如果要加入其他的功能的话,可以依据我的思维进行填补实现,比如语音锁屏、语音换壁纸等。

总结一下程序的总体思维为:

让电脑说“语音控制开始”,用来判断模块是否完整,同时也是标志着你可以进行对电脑控制了;然后对周围环境录音,对录音文件语音识别成文字,如果你说的话有一些定义的关键词的话,就执行对应的操作。例如“我想听首歌”这句话有“歌”这个关键字,就会执行播放歌曲的功能,至此智能控制功能完美实现。

参考文献

[1] 赵国求.人工智能应用[J].江汉论坛,2017(6).

[2] 江之勇.普通物理学[M].北京:高等教育出版社,2016.

[3] 叶伟国.大学物理[M].北京:清华大学出版社,2017.


本文由: 科学技术创新杂志社编辑部整理发布,如需转载,请注明来源。

科学技术创新杂志社

2019-11-03

上一篇:大摆臂分流器在行李处理系统中的应用设计
下一篇:校园网主要安全问题的分析与对策