2018年电子元器件行业智能音箱研究报告(3)DOC

上传人:陈** 文档编号:102267703 上传时间:2022-06-06 格式:DOCX 页数:53 大小:968.28KB
收藏 版权申诉 举报 下载
2018年电子元器件行业智能音箱研究报告(3)DOC_第1页
第1页 / 共53页
2018年电子元器件行业智能音箱研究报告(3)DOC_第2页
第2页 / 共53页
2018年电子元器件行业智能音箱研究报告(3)DOC_第3页
第3页 / 共53页
资源描述:

《2018年电子元器件行业智能音箱研究报告(3)DOC》由会员分享,可在线阅读,更多相关《2018年电子元器件行业智能音箱研究报告(3)DOC(53页珍藏版)》请在装配图网上搜索。

1、2018年电子元器件行业智能音箱研究报告2018年3月出版内容目录一、核心投资逻辑5(一)行业投资逻辑:需求、技术、产品条件均驱成熟5(二)投资建议:供应链中短期看好,技术品牌长期布局5二、现状:智能音箱迎风口,产业巨头忙逐鹿7(一)海外市场巨头抢滩布局,亚马逊强势领跑71、亚马逊 Echo:产业先行探索成就先发优势82、谷歌 Google Home:优秀算法厂商的探索之路103、苹果 HomePod:音质突出,生态并进,“硬件+环境”厂商不甘人后104、Invoke:软硬件巨头的天作之合11(二)国内市场方兴未艾,本土优势迎发展机遇111、京东叮咚132、天猫精灵 X1143、小米 AI 音

2、箱14三、前承交互入口革新之便,后启人工智能落地之利16(一)技术角度看智能音箱:语义理解是瓶颈16(二)技术升级:人工智能产业落地,语义理解加速提升20(三)场景升级:承载物联网新交互入口21四、语音生态延伸应用,智能音箱成长潜力可观24(一)智能音箱市场高速发展,2021 年全球预计出货 1 亿台24(二)家居、车载将是重要场景,智能音箱市场潜力巨大241、家庭依然是智能音箱的首要市场空间242、高端酒店市场成为智能音箱的拓展领地273、远场语音交互在车载市场大有可为29五、智能音箱产业链拆解及推荐标的31(一)智能音箱产业链分析311、智能音箱结构拆解312、软硬件技术国内企业均有涉足3

3、2(二)核心投资标的推荐331、歌尔股份(002241)332、全志科技(300458)34六、风险提示35图表目录图 1:全球智能音箱产品发布时间线7图 2:亚马逊 Echo 智能音箱发展8图 3:Alexa 平台技能数量快速增长(2015.9-2017.9)9图 4:Alexa 平台技能分类9图 5:Echo 智能音箱通过 Alexa 平台控制家庭环境内的其他智能产品9图 6:Google Home 系列产品10图 7:Google Home 支持的服务10图 8:苹果 HomePod 在智能家居的应用10图 9:苹果 HomePod 内部构造10图 10:微软智能音箱 Invoke11图

4、 11:Invoke 构成图11图 12:国内智能音箱市场零售量快速增长(2016.01 2017.08)12图 13:国内智能音箱市场价格段分析(2016.01 2017.08)12图 14:京东叮咚智能音箱发展13图 15:阿里智能音箱天猫精灵 X114图 16:天猫精灵 X1 功能14图 17:小米智能音箱14图 18:小米智能音箱在家庭场景中的应用14图 19:小米智能音箱使用场景15图 20:小米智能音箱技能举例15图 21:小米 AI 音箱目前可控制的智能设备15图 22:小米智能家居产品举例15图 23:智能语音交互过程16图 24:家庭复杂的声音环境17图 25:麦克风阵列解决

5、远场语音拾音难点17图 26:Amazon Echo 6+1 麦克风阵列17图 27:远场拾音和近场拾音17图 28:语言识别过程18图 29:语音识别正确率18图 30:以英语为代表的语音合成过程19图 31:全球声纹识别收入情况(2016 20201E)19图 32:全球声纹识别市场规模分布(2016 20201E)19图 33:2017 年人工智能技术成熟度曲线20图 34:语音识别准确率不断提高20图 35:语音设备的核心价值和核心场景21图 36:人机交互的演进历程21图 37:家电智能化的演进历程23图 38:全球智能音箱出货量(2014 2022E)24图 39:全球智能音箱市场

6、规模(2014 2022E)24图 40:全球家电市场规模及增长率(2015 2020E)25图 41:全球智能家电市场规模及增长率(2015 2020E)25图 42:全球智能家居互联市场(2016 2021E)25图 43:全球智能家庭数(2016 2021E)25图 44:美国智能家居市场(2015 2022E)25图 45:中国智能家居市场(2015 2022E)25图 46:智能音箱进入杭州西轩酒店智能客房27图 47:智能门锁27图 48:2016 年中国客房数结构28图 49:2016 年美国客房数结构28图 50:采用思必驰语音方案的智能后视镜29图 51:驾驶场景下智能后视镜

7、的使用29图 52:Google Home 所有零部件拆解31图 53:Echo 所有零部件拆解31图 54:智能音箱产业链33表 1:推荐标的估值汇总6表 2:海外市场主流智能音箱产品出货对比(单位:百万台)7表 3:国外 4 大智能音箱对比8表 4:国外智能音箱厂商难以进入中国的原因12表 5:国内市场智能音箱产品13表 6:智能音箱 v.s. Wifi 音箱 v.s.蓝牙音箱16表 7:语音与触摸作为输入方式的对比:22表 8:2021 年家庭场景下智能音箱保有量测算26表 9:2021 年中国视力残疾市场的智能音箱保有量测算27表 10:智能酒店改装股本估算28表 11:2021 年智

8、能音箱在酒店市场的空间测算29表 12:未来五年智能后视镜后装市场出货量及渗透率测算30表 13:Amazon Echo 拆解32表 14:Google Home 拆解32一、核心投资逻辑智能音箱作为消费电子市场的新产品,从亚马逊在 2014 年低调推出以来,持续收获理想的 市场认可度和关注度,无论是海外市场还是国内市场的主要终端产品商、互联网厂商、软件公司、 创业企业纷纷加入了产业的布局,努力将智能音箱打造成为智能手机之后必备的单品。作为消费 电子产业具有引导意义的 CES 展会上,智能音箱相关产业也获得了来自芯片到终端厂商额青睐。 我们认为,从消费需求、产品技术以及品牌建设方面看,智能音箱

9、作为新品有望迎来产业快速成 长期。(一)行业投资逻辑:需求、技术、产品条件均驱成熟市场需求是产业发展的根本动力,核心逻辑是语音交互将会成为入口:我们认为语音交互凭 借其在便捷性、安全性、符合人们生活习惯等特质,有望成为在智能化生活中取代或者结合图形 界面成为人机交互入口选择,其市场需求来源于预计将会有三个主要方面:1)智慧家居入口是 智能音箱需求的核心动力;2)以高端酒店为代表的商业地产也会是智能音箱的潜在需求领域;3) 以语音控制的智能后视镜为代表的车载泛智能语音产品也是产业市场发展的重要方向。人工智能助力语音处理能力,语义识别期待加速:要实现在上述场景中的有效应用,智能音 箱的核心对于音频

10、信号的处理,整个过程包含了 7 个步骤,其中语音识别和语义理解是核心的技 术,随着人工智能技术应用显著提升大数据处理能力,无论是依赖云端服务还是在终端处理,未 来智能音箱的音频处理能力将会有显著提升,其作为交互入口的定位又会成为重要的数据来源, 进而形成有效的正向反馈,使得智能音箱类产品成为了各大厂商争相推动的产品。各大厂商纷纷入局,产品市场群雄逐鹿:为了能够在智能化场景入口中占据重要位置,亚马 逊低调发布智能音箱 Echo 后的超预期反响催生了市场热情,谷歌、苹果、微软等全球的一线互 联网、智能终端厂商等纷纷跟进。同样,国内厂商的嗅觉也异常敏锐,京东、阿里、小米等巨头 和各类创业型企业也不断

11、发布相关的产品,尤其是在人工智能技术的渗透影响下,音频处理如虎 添翼,行业从导入期有望过渡到成长期的前期,迎来广阔的发展空间。(二)投资建议:供应链中短期看好,技术品牌长期布局从目前产业链的格局看,作为新产品,国内企业在产业链的各个环节布局较为完善,硬件领 域从核心芯片、各类原件、加工组装方面均深度涉足,因此对于行业出货量预期将会从导入期向 成长期推进的过程中,中短期我们看好元器件及组件供应商,重点推荐关注声学部件供应商歌尔 股份(002241)和芯片供应商全志科技(300458),建议关注北京君正(300223)、奋达科技(002681)、 国光电器(002045)等。中长期看,随着语音作为

12、日程生活助理的入口将会持续渗透,不管产品 形态将会以何种形式出现,因此能够在语音识别、处理、应用方面拥有竞争力的公司将会具备长 期发展空间,因此建议关注中文语音识别市场的龙头企业科大讯飞(002230)等标的。表 1:推荐标的估值汇总股价市值EPSPE代码名称元亿元20162017E2018E20172018PB002241.SZ歌尔股份15.144910.540.680.9522163.28300458.SZ全志科技*22.21740.540.510.5044443.65300223.SZ北京君正*28.42470.780.150.261921114.22002045.SZ国光电器*13.2

13、8550.190.340.7639173.84002681.SZ奋达科技*10.451550.180.370.5529192.51002230.SZ科大讯飞*57.628000.280.370.5115711310.31资料来源:Wind,(截至 2018 年 3 月 7 日收盘价,*采用 Wind 市场一致预期平均值)二、现状:智能音箱迎风口,产业巨头忙逐鹿自 2014 年亚马逊 Echo 横空出世,智能音箱开始进入人们视野,包括亚马逊在内都不甚看好 的产品却快速成为市场主流,随之而来的大量科技企业前仆后继。争相进入这个新兴市场,努力 将智能音箱包装成智能手机之后的新一代“必买”产品。图 1

14、:全球智能音箱产品发布时间线资料来源:智东西,国内厂商方面,尽管之前都有产品发布,但是在 2018 年 CES 上,百度、阿里、京东等龙头 企业不约而同的针对智能音箱都有新的技术和产品发布,市场竞争日趋激烈。近期,苹果正式开 启了 HomePod 的预定和发售,也引起了消费市场的持续关注。(一)海外市场巨头抢滩布局,亚马逊强势领跑海外智能音箱市场已经被消费市场有效接受,美国国家公共广播电台(NPR)和爱迪生研究 公司(Edison Research)联合发布的调查报告显示目前美国智能音箱用户约 3,900 万,智能音箱 普及率高达 16%,可以看到智能音箱已经覆盖近六分之一的美国人口,并已成为

15、美国家庭生活不 可或缺的一部份,调查中有 65%受访用户反应不想回到没有智能音箱的生活。从 2017 年 Q3 最 新的出货量来看,整个智能音箱市场持续保持高增速,2017 年全年出货量有望突破 3,000 万台; 从区域和市场来看,北美为当前全球最大智能音箱市场,三季度市占率达约 75。表 2:海外市场主流智能音箱产品出货对比(单位:百万台)厂商17Q3 出货量17Q3 市场份额16Q3 出货量16Q3 市场份额同比增长率亚马逊5.066.9%0.993.5%478%Google1.925.3%0.00.0%京东0.11.6%0.00.0%小米0.11.3%0.00.0%阿里巴巴0.10.9

16、%0.00.0%其他0.33.9%0.16.5%383%合计7.4100%0.9100%708%资料来源:Strategy Analytics,从产品来看,海外典型智能音箱产品以软件互联网巨头发布为主导,包括亚马逊的 Echo 系 列、Google 的 Home、苹果的 HomePod 以及微软的 Invoke;四组产品均搭载独立研发的语音助 手,产品间功能相差不大,但各有优势。表 3:国外 4 大智能音箱对比项目EchoGoogle HomeHomePodInvoke制造厂商Amazon谷歌苹果微软和三星主控芯片TIMarvell(美满)苹果/价格$179.99$129$349$199麦克风

17、阵列方案6、7 个麦克风环形阵列双麦克风线性阵列6 麦克风阵列7 麦克风环形阵列语音助手AlexaGoogle AssistantsiriCortana技能数1 万个1000 个/智能家居平台云平台 AWS/HomeKit/市场优势先行者、市场语音交互HomeKit 和高音质硬件生态资料来源:亚马逊官网、苹果官网,搜狐科技,亚马逊,Google 的智能音箱产品合计占据了全球 90%以上的市场,两者的发展可以说是代 表了智能音箱市场发展的两种典型模式:亚马逊依靠多年构建平台的生态协同,通过尽量多的场 景增加用户黏性;Google 借助其智能助手以及搭载其系统的智能硬件,通过海量的设备扩散, 采集

18、数据,使 AI 不断迭代进化。1、亚马逊 Echo:产业先行探索成就先发优势亚马逊 2011 年就开始在实验室进行智能音箱研发,2014 年 11 月推出首款智能音箱 Echo, 除播放音乐外也是家庭设备(兼容 Nest/IFTTT 等产品)控制枢纽,可连接第三方服务(如叫车, 定外卖等),系列产品至今各型号已累计销售破千万台,分析其发展主要有两点:1)不断丰富家族产品。2017 年 9 月,亚马逊推出了 6 款围绕 Alexa 的新品,包括 5 款 Echo 系列新品第二代 Echo、Echo Plus、Echo Spot、Echo Connect,Echo buttons;在降低价格的 同

19、时,新品针对每个家庭,每个人,每个房间的每一个差异化的需求提供全方位服务。其中的 Echo Spot 可以作算作 Echo Show 的升级版,是亚马逊又一传统品类升级的新尝试,选取了用户 需求量较大的传统品类闹钟作为切入点,开拓语音、图像融合的新人机交互模式。图 2:亚马逊 Echo 智能音箱发展资料来源:GFK 报告,2)搭建生态,深挖服务需求。Alexa 平台是随 Echo 一起在 2014 年问世,作为 Echo 产品的 核心技术,是一个基于云端计算的服务体系,通过云端以及机器学习,取代使用程序繁琐的 APP 解决用户的各类问题,包括购物、家电控制、播放音乐、新闻、设置闹钟等。自 20

20、15 年第三方 开发平台开放以来,Alexa 的技能数快速增长,2017 年 9 月已经突破 20,000 项大关。从技能分 类来看,排名最靠前的五类技能分别是:新闻、游戏/杂物/附件、教育/参考、生活方式、小说/ 笑话。图 3:Alexa 平台技能数量快速增长(2015.9-2017.9)图 4:Alexa 平台技能分类资料来源:Alexa 网站,Bi intelligence,资料来源:Voice Labs,智能家居领域是 Alexa 平台的重要布局,目前已经有 LG 的冰箱、GE 的灯具、海信 4K 电视 等内置 Alexa 的电子产品,随着主流家居设备逐步接入,不断扩大的用户群将会持续

21、带来流量红 利。Echo 产品最初让人眼前一亮的就是可以通过 Alexa 平台控制家庭环境内的其他智能产品, 比如通过指令使 Alexa 开灯或关灯。图 5:Echo 智能音箱通过 Alexa 平台控制家庭环境内的其他智能产品资料来源:亚马逊网站,亚马逊定义了一套家居互联协议,使得 Echo 拥有更大的话语权要求其他的家居产品搭载 Alexa 智能语音交互平台,对于家电的控制,使得亚马逊有资本将语音交互做大做强;不仅于此, 亚马逊还为用户提供了通过智能音箱语音下达购物指令的频繁场景,不断地为帮助用户养成新的 交互习惯和提升黏性添砖加瓦;可以说 Echo 的成功是恰到好处的先发优势+场景的胜利。

22、2、谷歌 Google Home:优秀算法厂商的探索之路谷歌在 2016 年 5 月 19 日的 Google I/O 发布会上,推出了一款硬件产品:类似亚马逊 Echo 的 语音助理设备 Google Home;在 2017 年的谷歌秋季新品发布会上,新增推出了两款换代产品: Home Mini 和 Home Max,售价分别为 49 美元和 399 美元。图 6:Google Home 系列产品图 7:Google Home 支持的服务资料来源:搜狐科技,资料来源:雷锋网,谷歌的优势在于以成熟的云计算优势让硬件配置不高的 Google Home 能够胜任语音识别的 应用,而谷歌音箱是根据它

23、在房间所处的位置自己调整声音。在功能上,Google Home 可以成为 家庭设备的控制中心,注重于音乐娱乐和语音搜索。例如通过语音控制音响,连接到灯光、恒温 器等设备。具体来说,它能帮助用户设置任务清单、购物清单、闹钟等等,甚至可以通过它来预 定车辆(比如 Uber)。目前谷歌音箱能搭配超过 1,000 种智能产品协同工作,但与亚马逊 Echo 不同的是,谷歌还没有将 Home 平台开放给第三方开发者。3、苹果 HomePod:音质突出,生态并进,“硬件+环境”厂商不甘人后苹果在 2017 年 6 月 5 日发布了智能音箱 HomePod,价格为 349 美元。HomePod 是一个 7 英

24、 寸稿的圆形音箱,采用了苹果自家的 A8 处理芯片,内部集成了 7 组定向喇叭,能够智能感知周 围环境,并根据相应的空间探测来调整发出的声音。图 8:苹果 HomePod 在智能家居的应用图 9:苹果 HomePod 内部构造资料来源:苹果官网,资料来源:苹果官网,HomePod 在外观上有太空灰和白色两个版本,HomePod 实际上并不是一款对标亚马逊 Echo、 谷歌 Home 的智能音箱产品,虽然 HomePod 也是一个智能入口,能够集成广播、天气、提醒、通知等功能,还能连接和控制家中的智能家居设备,但是 HomePod 更多关注音乐音质的, HomePod 内部整合了 Apple M

25、usic,用户可以通过 Siri 来发出相关的指令(比如让音箱放歌),音 箱就能够通过 Siri 来识别和收集用户的偏好,并根据用户的兴趣来调整和推荐音乐。而且 HomePod 非常容易连接 iphone 等设备,只要将苹果手机靠近 HomePod 智能音箱,那么几秒钟后 两个设备就会自动通过感知而相互连接。4、Invoke:软硬件巨头的天作之合微软与三星合作的新品 Invoke,是由三星电子的 Harman Kardon 子公司制造,使用微软的 Cortana 语音助手来处理指令。同时借助了微软的语音识别技术来实现命令和音乐控制,集成的 Office365 生产力服务可以帮你安排管理事务、检

26、查日历、设置闹钟等。用户还可以尝试其它智 能家居功能,如语音控制开灯等。Harman 强调这款设备集成了微软的 Skype 互联网电话服务。 Invoke 售价 199 美元,将提供石墨黑以及珍珠白两种颜色。图 10:微软智能音箱 Invoke图 11:Invoke 构成图资料来源:IT 资讯,资料来源:IT 资讯,Invoke 配备了 3 个有向型低音、3 个定向高音、以及 2 个被动式音频单元,内置的 7 个麦克 风还支持哈曼都独有的“远场”语音识别技术。Invoke 在音质上颇费了一番功夫,采用 360环 绕式音响设置、三个高音扬声器和 Dalek 式设计。除了 Cortana,Invo

27、ke 还支持 Spotity Premium、 iHeart Radio、Tuneln、Pandora 等服务的语音控制。(二)国内市场方兴未艾,本土优势迎发展机遇Echo 产品的持续火爆也点燃了国内市场,国内的智能音箱的产品越来越多,叮咚音箱、天 猫精灵 X1、小米 AI 音箱等;从市场整体来看,还处于一个培养用户使用习惯的增量阶段。GFK 数据显示,自京东 2015 年 5 月率先推出首款叮咚 A1 抢占智能音箱国内市场后,整体智能音箱 零售量一直呈稳定增长;随着 2017 年下半年几大厂家新品的陆续推出,零售量有了明显的飞跃,8 月份月零售量已接近 3 万台,伴随双十一的促销热潮,预计全

28、年累计零售量将达到 35 万台;同时我们看到国内智能音箱产品市场价格逐渐走高,低价产品占比降低,300-600 元逐渐成为主 流价格段。图 12:国内智能音箱市场零售量快速增长(2016.01 2017.08)图 13:国内智能音箱市场价格段分析(2016.01 2017.08)资料来源:GFK 报告,资料来源:GFK 报告,虽然国外市场各巨头发展迅速,但是国内市场仍然以天猫、京东等国内厂商为主,这是由技 术、使用场景和资源拥有权所决定的。类似于搜索市场,就像谷歌难以做好中文搜索一样,中文 语音识别方面,以科大讯飞为国内技术公司更有本土优势。此外,国内厂商更了解本土用户使用 智能音箱的习惯,能

29、够满足消费者的使用要求。另外在资源整合方面,音乐、有声读物等内容被 国内厂商所掌握,电商、快递、地图信息、百科知识等各种技能资源掌握在国内服务商手中。表 4:国外智能音箱厂商难以进入中国的原因国外厂商国内厂商中文语音识别技术不占优占优对中国用户的使用场景的把握不占优占优音乐、有声读物等各种内容资源不占优占优地图信息、百科知识等各种技能资源不占优占优资料来源:2017 年美国智能音箱覆盖率已经达到近六分之一,国内市场虽然起步,但是还没有迎来想 象中的蓝海市场。对比中美智能音箱市场,我们分析有以下几点:1)使用场景方面。西方国家消费者使用开放式的厨房与客厅,而国内的厨房烹饪环境嘈杂、 油烟重,厨房

30、客厅相对封闭,家庭使用音箱频次并不高。国内尚未建立完全的智能家居生态体系, 使用场景碎片化、硬件操作复杂等问题为解决,消费者无法体会智能家居的智慧和便捷;2)语音技术方面。国内的智能音箱语音技术比 Echo 要难得多,Echo 是全英文识别,而汉 语本身要难的多,方言、语速、说话习惯等问题,并且国内受众对英文歌曲的喜好,导致对中、 英文混合识别技术也有要求;3)行业标准方面。国内的智能语音交互的平台并没有成熟和完善,智能家居缺乏配套法规 和统一标准,产品良莠不齐,消费者体验较差;4)产品内容方面。国内的内容/应用厂商分散,如三大音乐集团 QQ 音乐、海洋音乐和阿里 音乐带来国内的音乐版权分裂而

31、不互通;O2O 点餐领域的美团、饿了么信息不互通;造成智能 音箱的使用不便。表 5:国内市场智能音箱产品公司产品发布时间卖点售价(元)自定义唤醒词/拨打电话/屏幕语音双交互亲见H1 智能音箱2016.5/1980酷狗酷狗潘多拉2016.11/1990RokidPebble2016.11独特外型/多轮对话技术1399联想Smart Assistant2017.1899多轮深度对话Tic home2017.4Tic watch/ Tic mirror/多方互联649小鱼在家,百度分身鱼*2017.4/3299喜马拉雅小雅音箱2017.6喜马拉雅 FM 海量音频999问之科技麦宝2017.6/阿里巴

32、巴天猫 X12017.7“声纹支付”购物方便499小米小爱音箱2017.7控制小米生态链产品299百度raven H2017.11/1699DOSS,百度DOSS 小度智能音箱2017.11/399腾讯小 Q 机器人二代*2017.12/2680京东、科大讯飞叮咚音箱2015.5798出门问问资料来源:GFK,亿欧,从目前国内智能音箱布局厂商看,可以分为五类:1)互联网公司:拥有庞大的业务布局, 希望建立以语音为入口的智能生态,为既有的内容和服务寻找新的入口。如 BAT、京东、小米; 2)技术厂商:依托语音技术方面的积累,专注于做技术开放平台或提供语音技术方案。如科大 讯飞、思必驰、出门问问;

33、3)内容厂商:占有独特的 IP 资源,倾向于将智能音箱打造成音乐、 有声读物等流媒体内容载体。如喜马拉雅、酷狗;4)创业公司:多关注与具体应用场景的结合, 如主打智能家居的 Rokid;5)传统音箱厂家:在传统音箱硬件研发上已有积淀,倾向于与技术 及内容厂商合作。如漫步者、Doss。1、京东叮咚京东与科大讯飞合作的智能音箱叮咚在 2014 年 11 月发布,主要针对中国市场,该设备可以 理解普通话,粤语和基本英语。图 14:京东叮咚智能音箱发展资料来源:GFK 报告,叮咚音箱主要用于播放音乐,设置闹钟,在线购物,并获得天气报告等。分析来看,叮咚音 箱整体产品线与 Echo 最像,发展遵循着抢占

34、入口、布局智能生态布局、定位本土化三方面布局; 从 2015 年 5 月的 A1 开始,至今已经发售了一系列新品。本土化方面,叮咚的横向设计更符合 中国消费者习惯,A1X 儿童口语机器人拓展应用到儿童早教市场。2、天猫精灵 X1天猫精灵 X1 是阿里人工智能实验室在 2017 年 7 月 5 日发布,有黑白两色款;在硬件配置 方面,采用 360 度全向 5 米拾音麦克风矩阵。定制业内第一颗 Smart Audio 专属优化芯片,可使 面积减小 25%,功耗降低 32%,效率提升 25%,在解码、降噪、声音处理和多声道协同方面进 行了针对性的优化处理。图 15:阿里智能音箱天猫精灵 X1图 16

35、:天猫精灵 X1 功能资料来源:天猫官网,资料来源:天猫官网,在功能方面,天猫精灵 X1 内置阿里第一代中文人机交流系统 AliGenie,除自然语言理解外, 引入了“决策引擎” 机制,能够理解上下文语境,支持多轮对话。目前可实现智能家居语音购 物、手机充值、叫外卖、音频音乐播放等功能。此外,采用声纹识别系统,同一款设备最多识别 6 人的声音,针对不同声音判断不同内容进行回答,用户还可通过自己的声音完成购物支付验证 环节。通过声纹识别,有针对性的语音助手和网上购物的安全性大大增加了天猫精灵的使用场景。3、小米 AI 音箱小米 AI 音箱是小米公司在 2017 年 7 月 26 日发布的一款智能

36、音箱,是由小米电视、小米大 脑、小米探索实验室联合开发。小米把“小爱同学”作为 AI 音箱的唤醒词。图 17:小米智能音箱图 18:小米智能音箱在家庭场景中的应用资料来源:小米官网,资料来源:小米官网,小米 AI 音箱采用长方柱形设计,搭配 1600 万种颜色的彩色环,被动扬声器加上 360声场, 号称任何角度都好听;音箱内置 6 个数字麦克风,可 360 度收音,支持远场语音操控功能。小米 AI 音箱支持人工智能回复用户指令,支持在线音乐、小说相声、儿童故事、广播电台等海量互 联网内容,还支持天气查询、路况查询、亲戚称呼查询、查找手机等功能。图 19:小米智能音箱使用场景图 20:小米智能音

37、箱技能举例资料来源:小米官网,资料来源:小米官网,近几年小米在国内智能家居中布局相对完善,米家依附与小米生态链,汇聚了几十家生态链 公司最为用心的产品,是如今国内体验较好的智能家居生态之一。图 21:小米 AI 音箱目前可控制的智能设备图 22:小米智能家居产品举例资料来源:小米官网,资料来源:小米官网,智能家居的产品也拓展了十几个品类之多,联动各种智能开关和万能遥控,包括小米 AI 音 箱还可以控制扫地机器人、空调、空气净化器、电视、电风扇、智能灯、盒子、电饭煲八大类设 备。三、前承交互入口革新之便,后启人工智能落地之利对比传统音箱,智能音箱不仅是音响产品,同时是涵盖了内容服务、互联网服务及

38、语音交互 功能的智能化产品,不仅具备 WiFi 连接功能,提供音乐、有声读物等内容服务及信息查询、网 购等互联网服务,还能与智能家居连接,实现场景化智能家居控制。表 6:智能音箱 v.s. Wifi 音箱 v.s.蓝牙音箱智能音箱Wifi 音箱蓝牙音箱运行方式独立运行辅助手机等电子产品运行辅助手机等电子产品运行成本一般比 WiFi 音箱稍高高低传输方式一对多一对多点对点可控制家居可以不可以不可以学习能力可通过云端学习可通过云端学习无语音助手有无无开放接口有无无资料来源:从技术本质来看,智能音箱是语音交互的一个落点;从硬件形态来看,智能音箱是音箱的进 化;从功能/场景来看,智能音箱的卖点在于内容

39、和互联网服务。(一)技术角度看智能音箱:语义理解是瓶颈智能音箱在使用过程中,主要包括 7 个过程。第一步通过麦克风矩阵远距离拾取声音,第二 步特定的声音指令激活智能音箱,之后上传云端进入下一步,第三步将输入的语音转为文字的过 程,即语音识别,第四步理解了用户输入的语义之后输入对话管理模块中,即自然语言理解,第 五步协调各个模块的调用以及维护当前对话状态,并将特定的回复方式交由自然语言生成模块进 行处理,即对话管理。第六步生成特定回复文本,即自然语言合成。第七步将文字转变为语音并 通过喇叭输出,即语音合成。图 23:智能语音交互过程资料来源:雷锋网,接下来我们会对语音交互中的语音识别、语音合成、

40、语音理解部分进行简单的介绍,并且随 着安全性的需求持续增加,在智能音箱的使用过程中声纹识别技术被用于进行安全性的比对。麦克风阵列拾音: 如图所示,由于家庭环境中声源距离可能较远,并且存在噪声、多径反射和混响等复杂的声音环境,我们可以采用麦克风阵列来解决上述问题。图 24:家庭复杂的声音环境图 25:麦克风阵列解决远场语音拾音难点资料来源:雷锋网,资料来源:搜狐,麦克风阵列是声学传声器阵列中的一个狭义概念,特指应用于语音处理按一定规则排列多个 麦克风组合。麦克风能灵活布局,采用线性阵列、平面阵列、立体阵列三种方式,能适应各种远 距离应用场合,识别整个房间内各个位置的声音,保证准确稳定对采集的不同

41、空间方向的声音信 号进行空时处理,实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等 功能,以提高真实环境下的语音识别率。Amazon Echo 采用的是环形 6+1 麦克风阵列,能迅速 360全方位识别实现环形拾音,准确进行声源定位,并能够有效地在家居环境下进行抗噪处理。图 26:Amazon Echo 6+1 麦克风阵列图 27:远场拾音和近场拾音资料来源:雷锋网,资料来源:雷锋网,与以手机为代表的近场语音拾取技术不同,近场语音拾取通过按住麦克风,在声源接近的情 况下获得语音信号,这种声源信号的噪声低且基本无混响。单在家庭应用环境中,需要通过麦克 风阵列拾音可以解决降噪和

42、去混响的问题,智能音箱就显得必要。使用唤醒词唤醒智能音箱:唤醒智能音箱一般包括两个步骤,即语音激活检测(VAD)和语音唤醒(VT)。语音激活检测 (VAD)指的是通过算法判断什么时候有语音,并将有效语音片段截取出来之后再处理,这样可以 极大减少计算量。在使用 VAD 截取出来有效语音片段之后,那么涉及语音唤醒(VT)技术。VT 技术是智能硬件在休眠状态下通过个性化唤醒词被唤醒,比如亚马逊 Echo 音箱的唤醒词为“Echo” 或“Alexa”,当判断到用户说了激活词之后,智能音箱将会继续进行后续的语音识别并处理,否 则对后续的语音不进行处理,一般而言 VT 基本是在本地设备上处理,不会用到云端

43、计算。语音识别技术: 语音技术即是将用户输入的语音转化为文字的技术。一个完整的语音识别大致分为两个步骤:首先是在语音输入之后的语音特征提取,其目的是从语音波形中提取出随时间变化的语音特征序 列。然后是声学模型与模式匹配过程,过程中将输入语音的特征矢量依次与训练阶段简历的模板 库中的每个模板进行相似度比较,将相似度最高者作为识别结果输出。图 28:语言识别过程图 29:语音识别正确率资料来源:百度百科,资料来源:易观智库,从目前的识别率来看,语音识别的识别率已经大大提升,google 等厂商从 2010 年不到 70% 的正确率提升到 90%,谷歌和 IBM 为例也能够实现安静环境下 95%以上

44、的识别率,基本与人类 速记员(约 94%)的正确率相当,而国内厂商百度和搜狗等已经能够实现安静环境下 97%以上 正确率。目前语音识别技术相对成熟,随着机器学习和深度学习的发展,人机语音交互的准确率 即将突破量变到质变的临界点(99%)。自然语言理解:自然语言理解是指人工智能的分支学科。自然语言理解研究用电子计算机模拟人的语言交际 过程,使计算机能理解和运用人类社会的自然语言如汉语、英语等,实现人机之间的自然语言通 信,以代替人的部分脑力劳动,包括查询资料、解答问题、摘录文献、汇编资料以及一切有关自 然语言信息的加工处理。自然语言理解目前尚处于浅层语义分析阶段, 大致包含词法分析、句 法分析、

45、语义分析这三个既递进又相互包含的层面。 目前机器对句子的理解还只能做到语义角 色标注层面,即标出句中的句子成分和主被动关系等,属于浅层语义分析技术。自然语言理解技 术发展相对不成熟,仍需完善。语音合成技术:语音合成,又称文语转换(Text to Speech)技术,涉及声学、语言学、数字信号处理、计算 机科学等多个学科技术,将任意文字信息实时转化为标准流畅的语音朗读出来。与传统的声音回放设备(系统)如磁带录音机只能播放特定的语音不同,通过计算机语音合成则可以将任意文本 转换成具有高自然度的语音,从而真正实现让机器“像人一样开口说话”。图 30:以英语为代表的语音合成过程资料来源:雷锋网,如图所

46、示,语音合成包括以下几个步骤:第一步将语素(文本)转换为音素。一般我们发出 来的声音由不同音素单位组成,将不同音素组合在一起,我们几乎可以重复发出任何单词的发音。 因而利用一个简单的音素字典,可以把每个句子直接转换为对应的音素。第二步预测持续时间和 基频。有了音素后就需要估计音素发音的持续时间。由于相同的声音读出不同的音调和重音具有 完全不同的含义,为了保证发音尽可能地接近人声,需要预测出每个音素的音调和语调。生成语 音的最后一步是合并音素、持续时间和频率,并输出声音。目前语音合成技术已经相对成熟,以 百度为代表的机器语音合成可以将文字转化为用接近人类的发音的方式说话。声纹识别技术: 声纹识别

47、使用客户的声纹进行身份认证,之后将与声纹库中的声纹匹配。声纹识别主要根据语音波形反馈的说话人生理和行为特征,自动识别说话人身份,在安全性上可与指纹、掌形和虹 膜等生物识别技术相媲美,目前已经用于公安和司法系统证据鉴定中的身份鉴别,以及银行支付 过程的身份认证。目前声纹识别技术已经相对成熟,但是都需要事先建立声纹库。图 31:全球声纹识别收入情况(2016 20201E)图 32:全球声纹识别市场规模分布(2016 20201E)资料来源:Technavio,资料来源:Technavio,由于黑客难以模仿一个人的声纹,声纹识别技术能够保障一定的安全性。此外,涉及声纹识 别的步骤较少,较安全而且方

48、便,可以有效节约时间和成本。另外,声纹识别是移动友好的,可以轻松地集成到任何一个移动设备迎合移动化的趋势。上述原因有利于声纹市场高速稳定发展。 从 Technavio 的数据看,全球声纹识别市场预计到 2021 年市场规模有 26.4 亿美元,我们预计 2016 年到 2021 年 CAGR 将达到 20%,总体发展较为稳定。(二)技术升级:人工智能产业落地,语义理解加速提升语音识别性能快速提升,智能语音市场处于大幅增长前期。语音识别的性能在近几年得到了 快速提高,深度学习、高性能计算和大数据的迅速发展,尤其是卷积神经网络(CNN)、循环神经 网络(RNNs)以及使用连接时序分类(CTC)Lo

49、ss(由百度支持)等端到端神经体系结构的应用,大大 提升了语音识别技术的水平和准确性,并减少了模型训练的时间,使得智能语音的商业化落地成 为可能。从 Gartner 在今年 7 月份发布的人工智能技术成熟的曲线图来看,随着 IBM、微软、谷歌、 亚马逊和百度这样的科技巨头在智能语音方面不断取得进展,语音识别技术将在 2 年内达到成熟 期。随着基于语音交互的垂直场景如智能车载,智能家居,智能可穿戴等日益成熟,智能语音市 场有望率先迎来快速增长。图 33:2017 年人工智能技术成熟度曲线图 34:语音识别准确率不断提高资料来源:Gartner,资料来源:KPCB 互联网报告,智能音箱热潮的实质是

50、 AI 之争,归根结底是未来人工智能的入口和焦点。按照产业周期来 划分,整个 AI 可以分为基础层、技术层和应用层。而应用层又可以按照商业目标的不同,分为 行业应用和消费产品应用,而目前消费级产品上的局面开拓是众多科技企业面临的难题。我们认 为在 AI 产业化进程中,硬件将是 AI 落地重要场景。智能硬件背后,AI 战略的目的在于争夺用户时间,是用户使用 AI 的习惯,是适应 AI 消费 的心智,是愿意与 AI 形成数据交互的冲动。对消费者而言,用户时间可以划分为家庭场景、汽 车场景、随身场景和办公场景。图 35:语音设备的核心价值和核心场景资料来源:KPCB 互联网报告,KPCB 2016

51、互联网报告中指出,在美国主要语音助手的使用场景是家庭(43%)、汽车(36%)、 随身路途(19%)和办公(3%)。不仅是语音助手设备,整个消费端的 AI 产品,都能按此进行 推演。AI 真正要抢夺的,是语音交互方式的变革,孕育了语音设备的巨大市场,其中语音属相 强、家庭覆盖广,让智能音箱率先成为语音设备的突破口。(三)场景升级:承载物联网新交互入口语音交互时代开启。在计算机诞生后,人机交互的形式也在持续发生着变化,我们认为考虑 到便捷和效率的角度看,语音交互作为最符合人类习惯的交互模式,有望在未来物联网时代入口 争夺中获得优势。图 36:人机交互的演进历程资料来源:KPCB 报告,整理目前人

52、机交互方式正在发生新一轮的变革,在最早的计算机诞生的时代,以 DOS 命令形式 输出为主,输入方式主要为键盘。随着美国计算机科学家艾伦 凯创立了计算图形界面和美国发 明家恩格尔巴特发明鼠标,以苹果为代表的公司将图形界面商用化普及,人机交互方式变革为图 形输出,键盘和鼠标的方式输入。2007 年苹果 iPhone 初代的诞生标志着人机交互方式进一步改变,此时以触摸方式输入,图形界面输出。相对于传统的基于图形界面的操作,语音交互更加效 率和简单。我们认为语音输出入有望成为下一个人机交互的新范式。表 7:语音与触摸作为输入方式的对比:使用场景智能音箱手机输入方式语音交互触摸每分钟平均输入单词数200

53、40操作方式简单一系列指令沐浴、做菜等特定场景可使用双手解放使用不便使用范围基本覆盖整个室内人脸在移动设备前资料来源:语音输入相对于基于触摸进行输入的操作,有以下的优势:1、相对于打字输入形式而言,说话的效率更高,人每分钟平均可以说 200 个单词, 打字只 能打 40 个。2、语音输入更加简单。呼叫智能音箱远比拿手机方便,拿手机需要用户的大脑进行一系列 操作指令,首先要回忆手机在哪里,然后要起身找到手机,拿起手机解锁,之后点开相应 app, 才能进行人机交互,智能音箱只需开口就能使用。3、语音解决了特定场景痛点。在家里人们很多时候不会拿着手机,比如在家庭场景中做饭、 做家务和沐浴等,汽车场景

54、中双手使用方向盘无法抽身等。特定场景下就给智能语音操控带来了 需求,智能语音可以解放人的双手和眼睛,给人们带来更大的自由。4、语音解决了覆盖范围的问题。语音的覆盖范围更广,从几米到几十米,在整个家里都可 以用语音操控,而操作手机需要人脸保持在移动设备前,在使用上限制更大。物联网重要入口。在目前的市场认知当中,大家会认为语音将会成为物联网的一个入口。智 能音箱代表了第一个能够正式用语音交互的产品,谁最先做成功了这个产品就意味着谁就在语音 交互上有主动权。随着国家 5G 技术研发试验第三阶段工作逐步开展,5G 时代日益临近,物联 网入口的争夺将愈发激烈。各巨头们发力智能音箱,更多的是寄望智能音箱能

55、成为下一个“智能 手机”,从语音智能的维度打开一个全新的网络形态。一个重要的方面就是流量入口的争夺,无 论亚马逊、谷歌、苹果、三星、BAT 等,这些巨头们赖以成为科技时代的绝对霸主,分别把持战 略级流量入口是关键基础。智能音箱作为一个全新的,以语音交互为主要形式的连接网络的终端, 只要用户习惯养成,将成为 PC、移动智能终端之外的第三端。以家居市场为例,家电产品智能化升级的方向基本沿着“自动化 - 物物互联 - 自主学习” 的方向演进:1)自动化:可通过人为单次触发或控制,自动完成一系列操作/不通过人为控制,自动完成 任务。例如,在人们都睡下后自动关闭所有灯光并拉上窗帘,早上按时拉开窗帘叫醒家

56、人等。2)物物互联:即物联网 IoT(Internet of Things),每个入网的设备都可能对其他设备发出指 令。 例如,智能指纹锁检测到家人回家,智能锁发出指令开灯,开空调,放音乐,烧水;当有 人撬锁) 频繁输错密码,智能锁命令报警器发出警报声并通知到手机等。3)自主学习:能够学习主人的生活习惯,当不同家庭成员发出相同指令可以完成不同操作。 例如,夜晚在多次接受主人下指令要求调暗灯光后,自动在夜间调暗灯光。图 37:家电智能化的演进历程资料来源:KPCB 报告,语音交互作为家庭智能化控制的入口具备良好的发展前景,也是产业发展的合适方向。智能 电视曾被认为是家庭控制的核心选项之一,但是简

57、单的复制手机的功能以及在便捷性方面的劣势, 使得最终没有能够成为有效的应用。智能音箱在传统音箱上增加了多种功能,通过智能音箱可以 实现更加便捷控制以及复杂的指令,以“语音+音箱”为入口,成为目前最优的切入智能家居的 方式。因此我们看到无论哪家的智能音箱产品,都对智能家居抛出橄榄枝。以 Echo 为例,主要分 为三大功能模块。首先是通过语音控制实现闹铃、音乐播放控制、天气查询、网络搜索以及新闻 查询等多项功能;其次与蓝牙和 WiFi 与 Fire Phone 连接,或通过浏览器与 iOS、安卓及 PC 设备 连接,以实现多媒体播放功能;最后一个重要的模块,就是智能家居设备的连接。在 Echo 试

58、水 成功后,亚马逊又推出全新的 Echo Show,亚马逊为其加装了屏幕,功能较 Echo 有很大的升级, 唯一的解释就是在初期阶段,结合用户屏幕使用的熟悉,更速度的将智能家居等衍生功能同智能 音箱匹配,直至用户完全习惯了智能语音操作,或会再回归其纯语音交互的模式。四、语音生态延伸应用,智能音箱成长潜力可观尽管智能音箱市场的起步时间较晚,但是在消费市场的获得了良好口碑换来了快速的成长, 更为重要的是,如我们之前分析的那样,国内外的各大硬件、软件、互联网厂商纷纷视其为智能 手机之后的重要产业风口,未来在家庭、商业地产、车载等多个市场有着可观的应用前景。(一)智能音箱市场高速发展,2021 年全球

59、预计出货 1 亿台根据 Beige Analysis 预计,2022 年全球智能音箱的出货量大概有 1 亿台,20162022 CAGR将达到 43.7%,智能音箱市场将持续高速发展。图 38:全球智能音箱出货量(2014 2022E)图 39:全球智能音箱市场规模(2014 2022E)资料来源:Beige Analysis,资料来源:Beige Analysis,从 Beige 的分析中我们可以看到,智能音箱的普及来源于人们对于生活品质需求的提升,以 及收入上升驱动的消费能力的增加。因此,消费市场的前期扩张是来源于较高收入水平家庭,而 随着智能音箱产品的互联网特性,价格下降的预期将会带来消

60、费市场基数的日趋庞大。(二)家居、车载将是重要场景,智能音箱市场潜力巨大本质上,智能音箱是通过自然语言进行人机交互的智能终端,对比更常见的智能终端手机, 智能音箱的特点有:1、完全通过自然语言进行人机交互(需要比手机的语音识别率高,播放声 音大);2、成本低;3、具备一定的移动便携性。基于以上的三个特点,我们认为智能音箱未来 的市场方向可以集中在以下几个方向:1、提供家庭场景服务通过自然语言进行交互的个人智能 助手,亚马逊的 Echo 就是这种产品思路;2、公共场景使用通过自然语言交互的公共智能终端。 对比现有的通过触屏交互的智能终端,智能音箱能够进一步降低用户的学习成本,提升交互体验; 3、车载交互。汽车是家居外另一大用户消耗大量时间的场景,语音设备的核心价值其中之一就 是为了更大程度的解放用户双手,显然车载场景有可能是最为迫切需要集成语音助手/智能音箱 的使用场景。1、家庭依然是智能音箱的首要市

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

相关资源

更多
正为您匹配相似的精品文档
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!