咪咕和科大讯飞又搞了个大新闻-王云辉的专栏

咪咕和科大讯飞又搞了个大新闻

2018-01-10 19:55:42栏目：默认栏目 IP属地：北京市

一年一度的CES又来了，不少让人惊艳的设备亮相。

比如下面这个，很有希望引领人工智能设备风潮的"小家伙"：

1月9日上午，拉斯维加斯，2018 CES展现场，咪咕与科大讯飞联合发布的全球首款全语音人工智能耳机莫比斯（Mobius）。

它以咪咕内容与科大讯飞技术为核心，聚合了语音操控，中英翻译，心率监测，健身指导，日程管理，出行导航，路线规划、音乐听书等完整的一站式生活服务体系。

本次CES是莫比斯的第一次正式亮相。但事实上，它去年12月中旬就已经开始在京东众筹，而且非常受欢迎——上线仅10小时就完成了众筹目标，第一天就突破了10万大关……

我为什么这么看好它？

自从2015年以来，伴随人工智能技术逐渐成熟，很多公司都在不断尝试，希望用新的技术重新定义人机交互方式，让我们不需要动手，就能操控电脑、手机和各种设备。

其中，被寄予最大希望的方式，是语音。

在深度学习和大数据的发展带动下，人工智能语音技术近两年来一路突飞猛进，无论语音识别还是语义识别，准确率都是水涨船高，实用性能与日俱增。

但是，还有一个最大的门槛：硬件。

此前，科大讯飞、小米、百度等很多公司都已经推出人工智能音箱，希望将它打造成固定环境中的用户新入口。

这些产品颇受好评。然而，它们不能随身携带。就像传统PC相比于笔记本电脑，固定电话相比于手机，宽带相比于WiFi，这个难以逾越的限制，已经锁死了智能音箱发展的天花板。

此外，也有一些应用在手机上流行，相比智能音箱，它的方便性大大提升，但即使如此，手机的拾音与扩音能力，依然限制了实际的使用体验，难以真正解放双手，人机交互的私密性体验也不够好。

其他的智能穿戴设备，也大多同样面临类似问题。

而现在，人工智能耳机这个设备的出现，让人工智能语音识别的交互方式，终于看到了真正的颠覆希望。

那么，人工智能耳机到底有哪些神奇之处呢？

（1）它让我们不需要动手，只用语音命令，就能使用手机上的大多数功能，比如听音乐、打电话、给朋友发微信、让人工智能给你讲笑话……

这样的功能，以前的很多手机都有，比如Siri。但在人工智能耳机上，它听得懂的命令，能实现的功能，更加复杂得多，更加准确得多——最重要的是，也方便得多。

设想一下：

在一个大雨天，你一只手拎着包，一只手打着伞走在路上，突然手机响了，而且是你特设的振铃——这代表它是老板/老婆/老公/老妈来的电话，十秒钟不接就会完蛋的那种……

你想呼唤Siri，但风声雨声振铃声，声声都响，手机还在兜里，喊破了嗓子它也不见得会回应你……

你不得不把伞和包挪到一只手上，另一只手拉开衣链，用来不及擦干净的，微沾着雨丝的手掏出手机，结果手指是湿的，指纹不识别，只能手忙脚乱地输密码/划手势解锁……

忙乱中手一滑，手机啪叽一声，摔在了脚下的泥水坑里……

何不如，像《一代宗师》里的梁朝伟，身子都不颤一下，撑着伞稳稳走着，嘴角上淡淡笑着，轻轻说一句："接听。"就一切都就妥了。

你想要哪个？

或者：老人突然疾病发作倒地，手脚无力，或独居家中，或路人皆不敢扶，此时何如？能否一个电话及时求救，或许就是生死之别。

（2）实时翻译。这一条无须解释，真正的大杀器，王胖子这种外语渣的出国旅游必备。

（3）内置传感器，配合人工智能算法，实时监测你的运动轨迹和心率，甚至像专业教练一样，给你实时的运动指导，或是健康保护。它甚至能感知你的情绪，来给你播放不同的音乐。

（4）它甚至能给我们提供更多的服务：比如你听着音乐晨跑，快到红灯口时音乐就会自动降低声音，甚至提醒你注意观察有没有汽车；比如两个朋友要见面，相互找不到，可以根据耳机的提示相互走近……

这些功能，有的已经实现了，有的还在路上，但也不远了。总之，可以想象的场景太多，太多。

最关键的是，这个设备方便，随身，私密。所以，以前困扰人工智能语音落地的很多问题，全都迎刃而解。

也正是因为这个原因，我认为，人工智能耳机有望成为今年可穿戴设备领域最大的风口。

或许有人会说，这些功能好不好并不重要，只有市场认可了，有了销量，才是实锤。

所以，有必要列一点数据了。

比如苹果的AirPods，一个亮点功能就是整合了语音助手Siri，能通过语音对话进行指令操作。虽然目前还没有准确数据，但据第三方预测，在刚过去的2017年，AirPods的销量将达到1300万副，独占无线耳机市场85% 的市场份额。

对于人工智能耳机来说，这个数字或许只是开始。

要知道，AirPods刚推出时可是饱受质疑，跟Siri的功能协作乏善可陈，续航也只有5个小时！

而根据调研机构 Statista 估计，2017年全球的耳机出货数量是3.68 亿对。毫无疑问，未来这个市场将会迅速被人工智能耳机取代。

事实上，在人工智能耳机这个方向上，从巨头到创业公司，已经有非常多的人抢入布局。

比如谷歌。它在新推出的无线耳机PixelBuds里面，整合了谷歌语音助理，用户可以通过，用户通过特定手势激活它，甚至在与Pixel配对后还能实时翻译。

比如创业公司Vinci的智能头机，也可以通过通过语音交互来进行耳机和音乐操作，根据外部环境改变音量，甚至可以根据心率、历史偏好、场景、用户状态等条件差异，提供个性化的音乐推荐。

比如，耳机品牌Bragi也准备和Audio Analytic合作，通过人工智能技术进行识别环境，让它为它的Dash Pro等产品能从环境中收集信息后，再对声音进行处理。

甚至有消息说，日本一支研究团队正在开发了一种人工智能耳机，能够通过脑电波跟踪听众的情感状态，创造出为听众量身定制的音乐，从而改善听众情绪。

……

相信在2018年，人工智能耳机这个新兴的行业，很快会百花齐放。

当然，就目前而言，我最看好的，还是咪咕和科大讯飞做的莫比斯。

除了它之外，市场上已经推出产品的设备中，大多都还算不得真正的"人工智能耳机"，比如AirPods，除了Siri以外就只能呵呵了；而在人工智能功能上相对成熟的Vinci，产品也是头机不是耳机，技术难度和易用性的差别都仿若天渊。

那么，莫比斯的细节，有怎么强大呢？

（1）它是TWS（TureWireless，真无线）耳机，单耳重量仅有7.5克！

多年来，从有线到无线，从一体到分体，耳机的种类可谓五花八门，但从2016年以来，TWS耳机已经成为绝对的大势所趋。

它的特点是：两个耳机都独立存在，不再需要电线连接，从而彻底摆脱了电线束缚。耳机的设计也可以更加贴合耳部的结构设计，就像一颗豆子一样戴在耳朵里。

当然，这就需要每个耳机都要拥有独立的电源、处理器、射频和传感器，技术难度大大提升。

在此基础上，莫比斯在7.5克的耳机里，嵌入各种传感器和人工智能功能，还要确保续航时间，这背后的技术实力可以说相当过硬。

更何况，莫比斯还是全球首次将智能手机天线应用于耳机，并首次在TWS耳机中使用了Alongo双麦降噪技术。

（2）莫比斯的蓝牙标准是4.2。对耳机的性能来说，蓝牙的关键无须多说，而4.2的优势，相信也不用我再啰嗦了。

（3）防尘防水，莫比斯做到IP65，不算拨尖，但已经在标准线以上。

（4）心率算法用的是lifebeam。

这些年智能设备大热，号称能统计步数、在骑行、健身时监测心率和卡路里的设备，可以说遍地都是。但大多数设备监测的数据准确率，就只能呵呵了。而莫比斯用的lifebeam算法，是目前全球最准确的随身心率追踪测量算法。

它的准确有多高呢？航空级——这个词可不是说着玩的，它是真的用来给宇航员测心率时用的。

（5）全双工人工智能交互。

嗯，这个词有点拗口。

简单解释下，什么叫全双工呢？简单来说，就是你和我可以同时说话，大家一边说，一边听。

这样，在人机交互的时候，不但可以随时打断和补充命令，而且能够拒识和过滤无效的语音。

看上去简单，但它实际上需要非常强大的语音识别和分析能力，是科大讯飞压箱底的技术优势之一。

（6）识别和翻译的准确率达90%以上。这一条无须解释，往上每一个百分点都是大不同啊。

（7）上下文对话场景智能识别技术，集成智能语义断句解决方案。可以结合交互的上下文，进行语义理解，并具有长时间的用户交互历史记忆，甚至可以同时管理多个对话场景，跨场景信息共享长时记忆。

这也是深度学习带来的技术实力，它的实际体验值得期待。

至少，各种助手"记忆只有一句话"的这个老大难问题，已经被它扫进垃圾堆了。

（8）实时语言翻译。内置听译、同声传译和同声对译3种中英翻译场景。以后出国旅游轻松了！

（9）多种生活服务功能集成。通过莫比斯，打电话、天气预报、闹钟提醒、时间查询、地图导航等等手机上的大多数功能，都可以用语音直接搞定。

（10）海量娱乐资源。

作为咪咕公司的首个智能硬件产品、首个众筹项目，莫比斯也得到了咪咕全力的资源加持。

它依托的咪咕系海量正版有声内容，有多少呢？至少包括：

超过1700万首歌曲……

84个分类，70万集、20万小时高清有声内容，从有声小说到资讯新闻，从名家专栏到网络电台，想听什么都有……

真正说起来，这可能也是我们使用频率最高，使用时间最长的领域。

而据咪咕透露，如果配合人工智能应用"咪咕灵犀"，莫比斯还会有更多惊喜表现。不过，由于没有体验，暂时就没办法介绍了。

这个以德国数学家命名的耳机，或许真的能像它的莫比乌斯环的科技感设计一样，为我们带来无穷的未来想象。