关键词:智能语音
中投顾问:2019-2023年中国智能语音行业影响因素
一、有利因素
(一)政策支持
2017年11月15日,科技部召开《新一代人工智能发展规划》暨重大科技项目启动会,会上宣布了首批四家国家新一代人工智能开放创新平台名单,明确依托科大讯飞建设智能语音国家新一代人工智能开放创新平台。
2018年3月5日,国务院总理李克强在十三届全国人大一次会议作政府工作报告时表示,要加强新一代人工智能研发应用,在医疗、养老、教育、文化、体育等多领域推进“互联网+”,这是继2017年之后,“人工智能”再次被写入政府工作报告。
(二)众多互联网巨头纷纷开发智能语音市场
在语音生态系统方面,百度宣布语音识别技术及能力全面开放。腾讯、搜狗语音开放平台相继上线。
在语音技术应用方面,各大厂商对家居、车载、可穿戴等环节的关注明显升温。智能家居领域,百度发布了Baiduihome,阿里联合智能家电厂商推出天猫魔盒,搜狗联手魅族发布了魅族电视盒子。
智能车载领域,百度分别推出了手机车机智能互联的产品Carlife,车的私有云服务平台MyCar,和智能语音人机交互方式的智能行车助手CoDriver。阿里云和上汽合作推出车载操作系统,腾讯发布了路宝APP+路宝盒子,可与腾讯云连接,以实现车辆诊断、油耗分析、车友社交等功能。搜狗则和四维图新合作,推出飞歌导航。
可穿戴领域,百度采取扶持外部产品,内置百度服务,形成开放生态思路:分别推出了Inside智能硬件平台,基于健康云的Dulife智能健康平台,以及百度手表应用,以吸引硬件厂商加入。
(三)智能语音技术成熟,商业化应用成为可能
深度学习、高性能运算平台和大数据是人工智能技术取得突破的核心助推力。深度学习端到端解决了特征表示与序列影射的问题,使得人工智能的性能得到了快速提升;而互联网时代海量的数据又不断为算法模型提供了训练材料,同时,云计算的兴起和高性能的运算平台为智能化提供了强大的运算能力和服务能力。
在语音识别率方面,百度、谷歌,科大讯飞等主流平台识别准确率均在96%以上,稳定的识别能力为语音技术的落地提供了可能。
(四)智能语音交互的便利性
首先,语音交互能够创造全新的“伴随式”场景。试想一下以后早晨起床后你无需再大动干戈,又是开电视又是烧开水又是洗漱刷牙的,把自己搞得一团糟,只需要动动嘴皮子就能“隔空”操作,让自己不再慌乱。因此,语音交互能极大提高人们在某些不方便使用手和眼睛的场景中的效率。
其次,随着智能设备影响的扩大,人工智能语音交互能普及到更广泛的人群,比如视力不好,手脚不灵活的老年人,不识字的低龄儿童、盲人等生活难以自理的群体,让他们的生活更方便。
最后,通过语音交互,人工智能可以实现自主学习,变得更像人类,在此基础上,人工智能将更顺利地融入到用户家庭生活中,扮演陪伴者或教育者的角色,满足用户现实需求的同时,满足用户的心理需求,这是人工智能未来发展的一大方向。
二、不利因素
(一)人才稀缺
随着智能语音及人工智能技术产业化趋势明显,国外知名IT企业纷纷对智能语音业务加大投入,势必造成语音技术国际竞争的加剧和社会对语音技术人才需求的增大,在风险投资的追捧下,人工智能领域高端人才离职创业数量大大增加,微软、百度、阿里、腾讯、IBM、英特尔中国等近年都出现了研究院院长等核心人才离职创业的现象。同时由于国内智能语音及人工智能行业的特殊性、高水平科研人才的稀缺性以及人才培养的滞后性,智能语音及人工智能技术人才将面临持续短缺,能否吸引和培养高水平的人才队伍是行业今后发展的潜在风险。
(二)低数据资源与多语言
目前大部分语音识别的研究和应用,主要是基于一些大语种,比如说英语、汉语、阿拉伯语和法语等等,我们知道世界上一共有6900多种语言,如何快速的实现一套基于任何语言的语言识别系统是非常困难的,它也具有重大的战略意义。包括美国IARPA这几年的Babel计划,以及之前DARPA的GALE计划,考虑到中国的国情我们有56个民族,所以构建一套多语言低数据资源下的语音识别系统是非常关键和具有实际价值的。