Amazon Echo拆解，引以为豪的语音控制都有啥猫腻？-电子产品世界手机版

Amazon Echo拆解，引以为豪的语音控制都有啥猫腻？

时间：2018-04-03来源：电子产品世界

　　亚马逊(Amazon) Echo可说是目前最热销的物联网(IoT)装置，无论你称它为智慧麦克风、虚拟数位助理、家用机器人、语音控制或R2-D2，这一类以语音为基础的产品正迅速崛起...

　　相较于Echo，最新的第二代Echo Dot的价格从89.99美元调整为49.99美元，并将于本月在美国上市销售。

　　Amazon Echo(及其随后推出的Dot)开辟了一个新的市场，让装置供应商能够在语音撷取、提高麦克风音讯解析度、更先进的背景杂讯过滤、更好的音场侦测与稳定连线能力等方面展开竞争，以提供更佳音讯品质。

　　Amazon Echo (左)及其第二代产品Dot

　　而像XMOS等公司虽然自家晶片并未用于Echo中，但也瞄准了这个新的语音介面市场。XMOS行销与业务发展副总裁Paul Neil表示，“物联网目前正是一场快速移动的盛宴。为了控制IoT装置，语音是最自然的使用者介面。”

　　Neil说，由于融合了“传统的微控制器(MCU)性能、嵌入式DSP以及灵活的I/O组合，使得我们的技术成为语音介面的理想选择。”

　　然而，硬体装置之间的战争只是构成整个智慧麦克风/扬声器市场的一部份。IHS Markit连网家庭资深分析师Paul Erickson强调，“真正的竞争变数来自云端。”

　　为了追求更“聪明”的智慧麦克风(能够处理复杂的查询和随机问题)，云端服务领域的竞争越来越激烈。 Google预计将于今年年底推出Google Home与Google Assistant (Google Now的新版本)，并借此进入这个市场。Erickson表示，“而且市场上盛传苹果(Apple)很可能将在2017年挟其Siri进入这个领域。”

　　Amazon Echo——这款IoT装置如此热门的另一个原因在于它极具潜力，可实现IoT的重要优点：经得起时间考验(Future-proofing)。

　　芯科科技(Silicon Labs)软体副总裁Skip Ashton解释，Future-proofing的意思是“确保装置可随时间进展持续添加更多功能特性。”例如，Alexa为Echo提供的语音服务功能一开始有70种，如今已经增加到超过1,700种了。

　　Echo可以回答问题、阅读新闻、为运动评分、控制灯光、从Amazon网站订购产品以及设定闹铃等。使用者还可以利用该装置向Uber叫车或订购披萨外送等。

　　“目前Echo大约每两周透过云端更新一次，”Ashton说，“Amazon会在星期五时发送电子邮件给Echo用户发布新功能， ”而Echo用户“也对于产品的功能持续增加怀抱着期待。”

　　本地智慧

　　IHS Markit嵌入式处理器首席分析师Tom Hackenberg剖析Amazon Echo对于电子产业带来重大影响的原因：智慧麦克风/智慧扬声器应用“对于处理器供应商来说极具价值。”

　　因为这种装置关键之处并不只是提供了“本地智慧”。语音介面正普遍应用在广大的市场领域。不只是数位助理市场出现，成为智慧型手机App的消费电子装置版本，还有扬声器，也不是它唯一的外形应用。

　　例如，他解释说，“家庭自动化中心和数位助理可以内建于电视、机上盒(STB)、HVAC/环境控制中枢等等。此外，在车载资讯娱乐方面也存在大量的应用，特别是着眼于其免手持的优点。”

　　拆解Echo与Echo Dot

　　透过拆解Echo与Echo Dot并进一步比较后，Hackenberg说，“除了记忆体供应商，我发现Echo和Echo Dot的处理元件并没有明显的不同。”

　　拆解Echo与Echo Dot

　　根据iFixit所进行的拆解，Amazon Echo采用：

　　三星(Samsung) K4X2G323PD-8GD8 256MB LPDDR1 RAM (挥发性记忆体)

　　SanDisk SDIN7DP2-4G 4GB iNAND Ultra Flash (非挥发性储存)

　　而到了新版的Dot则改用：

　　美光(Micron) MT46H64M32LFBQ 256MB (16Meg x 32 x 4Banks) LPDDR SDRAM (挥发性记忆体)

　　三星KLM4G1FEPD 4GB高性能eMMC NAND Flash (非挥发性储存)

　　两款产品使用的处理器则是相同的。在Echo与Dot的核心采用的是“德州仪器(Texas Instruments;TI)的媒体处理器DM3725”，此外，高通(Qualcomm) Atheros QCA6234应用专用标准处理器则用于提供“连接性”。

　　Hackenberg解释说，虽然记忆体可能稍微影响性能，但记忆体定价是波动的。因此，对于Echo系列的所有产品而言，在其整个生命周期中改变所使用的元件也很平常。

　　相形之下，“连线模组，尤其是媒体处理器更加复杂，如果不是重大的产品更新，一般并不会改变，”他说。

　　Hackenberg指出，Atheros处理器专用于作为连接应用标准产品。其设计是以Tensilica客制化XTensa核心为基础，而且“它只做一件事——协调与网路的通讯，以利作业进行。”

　　Erickson补充说，“连接能力至关重要，因为它涉及哪些资料可被撷取、传送与接收云端资料的速度与可靠度等。由于速度/响应的可用性因素，它直接影响到与扬声器之间的互动有多么“即时”。因此，Wi-Fi的吞吐量、服务品质(QoS)与范围的改善，都将有所帮助。”

　　所有的“本地”(local)智慧功能是由TI DM3725进行处理。Hackenberg指出，“这是一款专为STB、TV、显示器、视讯游戏系统等各种多媒体应用而设计的系统单晶片(SoC)。”

　　DM3725是一款以ARM Cortex A8为基础打造的元件，并整合TI的C64x+DSP与3D绘图加速引擎。“Cortex A8是一款成熟且经济型的应用处理器，但又完全足够用于本地执行简单的任务，”Hackenberg表示。

　　然而，“如果应用变得复杂，而不只是一款扬声器这么单纯，可能就会有所变化。”

　　Amazon Echo Dot主板

　　整合DSP

　　根据Hackenberg，这颗SoC的关键就在于整合了DSP，甚至可能是GPU。

　　“在一个典型的设计中，存在多个输入感测器(主要是麦克风)。整个音讯输入首先经DSP高度滤波，使系统快速地理解用户的语音和环境杂讯之间的差异，”他说。

　　“它甚至能够解读相对于该装置的位置或甚至发话者是谁;它还建立了一种模式，能够经过处理以匹配该模式(通常发送至云端)，”他补充说。

　　但是，GPU做什么呢?

　　Hackenberg认为，“对于本地智慧，GPU可以用于更简单、但快速且高效的本地模式匹配。”

　　这可以让装置仍然回应所储存的控制模式，例如“降低音量”、“切换频道”或其他简单的控制，而无需网路连接，他解释说。 “接着，应用核心根据所需提供的回应、启动/关闭所需的输入或控制以及必须显示的内容等条件来执行应用程式。”

　　麦克风阵列

　　Amazon Echo和Dot之所以吸引人之处在于它使用了7麦克风阵列。Amazon声称，Echo和Dot由于使用了多支麦克风和波束成型技术，因而“能在整个室内都听到你的声音——即使是正在播放音乐的环境下。”该公司还表示，Echo是一款专业级的调音扬声器，能以360°沉浸式音效充满在整个房间中。

　　根据IHS Markit负责MEMS和感测器的资深分析师Marwan Boustany表示，Echo采用了楼氏电子(Knowles)的MEMS麦克风。

　　Dot采用7支麦克风阵列

　　Boustany指出，为声音频率提升其讯号杂讯比(SNR)、匹配和性能，将有助于远场音讯撷取，同时改善语音辨识。

　　但最终，“演算法才是实现更优质语音辨识的真正关键，”他说，“所谓的『智慧』就在于云端可能持续作为关键应用，而本地处理则可以提高对于简单/预定义片语(如Hey Siri等)的辨识能力。”

　　他以Cypheras为例表示，“这一类的软体供应商将有利于智慧家庭系统(如Alexa)中的语音辨识功能。”

　　Amazon Echo Dot

　　竞争日益加剧

　　以供应商来看，目前有几家提供微控制器(MCU)和连接用ASSP的供应商可能在此领域展开竞争，包括Apple、博通(Broadcom)、赛普拉斯(Cypress)、微芯科技(Microchip)、恩智浦(NXP)、瑞萨(Renesas)、意法半导体(STMicroelectronics)以及芯科科技(Silicon Labs)等。Boustany表示，”802.11n与BT 4.0的组合并不常见，但有些设计针对较低成本的解决方案或许将会只用蓝牙。

　　媒体处理器较为棘手。虽然多家行动装置应用处理器供应商都可提供，但对于简单的应用来说成本太高。根据Hackenberg的观察，供应商们可能会选择不提供性能相当的DSP或模式匹配功能。

　　“我可能会考虑采用Apple Ax、Broadcom BCM7xxxx、海思(Hisilicon) Hi3xxx、NXP i.MX、联发科MT8xxx、意法STiHxxx、高通(Qualcomm)Snapdragon等。当然，TI或许在成本方面具有最佳DSP支援(对于语音辨识至关重要)的优势，但其他的这几家供应商也在不断地缩小差距中。”

　　XMOS相信该公司将在这个市场上获得动能。对于诸如Echo这一类的语音助理产品，提高性能的关键在于远场语音撷取能力、波束成型与处理速度等。Neil认为，“凭藉着大量的处理能力和嵌入式DSP，我们的XMOS单晶片元件提供了可扩展和差异化的解决方案。”

　　XMOS xCore语音介面案例

关键词： Amazon Echo

加入微信
获取电子行业最新资讯
搜索微信公众号：EEPW
或用微信扫描左侧二维码

Amazon Echo拆解，引以为豪的语音控制都有啥猫腻？

相关文章