咪咕和科大讯飞又搞了个大新闻
2018-01-10 19:55:42
  • 0
  • 0
  • 0
  • 0

一年一度的CES又来了,不少让人惊艳的设备亮相。

比如下面这个,很有希望引领人工智能设备风潮的"小家伙":

1月9日上午,拉斯维加斯,2018 CES展现场,咪咕与科大讯飞联合发布的全球首款全语音人工智能耳机莫比斯(Mobius)。

它以咪咕内容与科大讯飞技术为核心,聚合了语音操控,中英翻译,心率监测,健身指导,日程管理,出行导航,路线规划、音乐听书等完整的一站式生活服务体系。

本次CES是莫比斯的第一次正式亮相。但事实上,它去年12月中旬就已经开始在京东众筹,而且非常受欢迎——上线仅10小时就完成了众筹目标,第一天就突破了10万大关……

1

我为什么这么看好它?

自从2015年以来,伴随人工智能技术逐渐成熟,很多公司都在不断尝试,希望用新的技术重新定义人机交互方式,让我们不需要动手,就能操控电脑、手机和各种设备。

其中,被寄予最大希望的方式,是语音。

在深度学习和大数据的发展带动下,人工智能语音技术近两年来一路突飞猛进,无论语音识别还是语义识别,准确率都是水涨船高,实用性能与日俱增。

但是,还有一个最大的门槛:硬件。

此前,科大讯飞、小米、百度等很多公司都已经推出人工智能音箱,希望将它打造成固定环境中的用户新入口。

这些产品颇受好评。然而,它们不能随身携带。就像传统PC相比于笔记本电脑,固定电话相比于手机,宽带相比于WiFi,这个难以逾越的限制,已经锁死了智能音箱发展的天花板。

此外,也有一些应用在手机上流行,相比智能音箱,它的方便性大大提升,但即使如此,手机的拾音与扩音能力,依然限制了实际的使用体验,难以真正解放双手,人机交互的私密性体验也不够好。

其他的智能穿戴设备,也大多同样面临类似问题。

而现在,人工智能耳机这个设备的出现,让人工智能语音识别的交互方式,终于看到了真正的颠覆希望。

2

那么,人工智能耳机到底有哪些神奇之处呢?

(1)它让我们不需要动手,只用语音命令,就能使用手机上的大多数功能,比如听音乐、打电话、给朋友发微信、让人工智能给你讲笑话……

这样的功能,以前的很多手机都有,比如Siri。但在人工智能耳机上,它听得懂的命令,能实现的功能,更加复杂得多,更加准确得多——最重要的是,也方便得多。

设想一下:

在一个大雨天,你一只手拎着包,一只手打着伞走在路上,突然手机响了,而且是你特设的振铃——这代表它是老板/老婆/老公/老妈来的电话,十秒钟不接就会完蛋的那种……

你想呼唤Siri,但风声雨声振铃声,声声都响,手机还在兜里,喊破了嗓子它也不见得会回应你……

你不得不把伞和包挪到一只手上,另一只手拉开衣链,用来不及擦干净的,微沾着雨丝的手掏出手机,结果手指是湿的,指纹不识别,只能手忙脚乱地输密码/划手势解锁……

忙乱中手一滑,手机啪叽一声,摔在了脚下的泥水坑里……

何不如,像《一代宗师》里的梁朝伟,身子都不颤一下,撑着伞稳稳走着,嘴角上淡淡笑着,轻轻说一句:"接听。"就一切都就妥了。

你想要哪个?

或者:老人突然疾病发作倒地,手脚无力,或独居家中,或路人皆不敢扶,此时何如?能否一个电话及时求救,或许就是生死之别。

(2)实时翻译。这一条无须解释,真正的大杀器,王胖子这种外语渣的出国旅游必备。

(3)内置传感器,配合人工智能算法,实时监测你的运动轨迹和心率,甚至像专业教练一样,给你实时的运动指导,或是健康保护。它甚至能感知你的情绪,来给你播放不同的音乐。

(4)它甚至能给我们提供更多的服务:比如你听着音乐晨跑,快到红灯口时音乐就会自动降低声音,甚至提醒你注意观察有没有汽车;比如两个朋友要见面,相互找不到,可以根据耳机的提示相互走近……

这些功能,有的已经实现了,有的还在路上,但也不远了。总之,可以想象的场景太多,太多。

最关键的是,这个设备方便,随身,私密。所以,以前困扰人工智能语音落地的很多问题,全都迎刃而解。

也正是因为这个原因,我认为,人工智能耳机有望成为今年可穿戴设备领域最大的风口。

3

或许有人会说,这些功能好不好并不重要,只有市场认可了,有了销量,才是实锤。

所以,有必要列一点数据了。

比如苹果的AirPods,一个亮点功能就是整合了语音助手Siri,能通过语音对话进行指令操作。虽然目前还没有准确数据,但据第三方预测,在刚过去的2017年,AirPods的销量将达到1300万副,独占无线耳机市场85% 的市场份额。

对于人工智能耳机来说,这个数字或许只是开始。

要知道,AirPods刚推出时可是饱受质疑,跟Siri的功能协作乏善可陈,续航也只有5个小时!

而根据调研机构 Statista 估计,2017年全球的耳机出货数量是3.68 亿对。毫无疑问,未来这个市场将会迅速被人工智能耳机取代。

事实上,在人工智能耳机这个方向上,从巨头到创业公司,已经有非常多的人抢入布局。

比如谷歌。它在新推出的无线耳机PixelBuds里面,整合了谷歌语音助理,用户可以通过,用户通过特定手势激活它,甚至在与Pixel配对后还能实时翻译。

比如创业公司Vinci的智能头机,也可以通过通过语音交互来进行耳机和音乐操作,根据外部环境改变音量,甚至可以根据心率、历史偏好、场景、用户状态等条件差异,提供个性化的音乐推荐。

比如,耳机品牌Bragi也准备和Audio Analytic合作,通过人工智能技术进行识别环境,让它为它的Dash Pro等产品能从环境中收集信息后,再对声音进行处理。

甚至有消息说,日本一支研究团队正在开发了一种人工智能耳机,能够通过脑电波跟踪听众的情感状态,创造出为听众量身定制的音乐,从而改善听众情绪。

……

相信在2018年,人工智能耳机这个新兴的行业,很快会百花齐放。

4

当然,就目前而言,我最看好的,还是咪咕和科大讯飞做的莫比斯。

除了它之外,市场上已经推出产品的设备中,大多都还算不得真正的"人工智能耳机",比如AirPods,除了Siri以外就只能呵呵了;而在人工智能功能上相对成熟的Vinci,产品也是头机不是耳机,技术难度和易用性的差别都仿若天渊。

那么,莫比斯的细节,有怎么强大呢?

(1)它是TWS(TureWireless,真无线)耳机,单耳重量仅有7.5克!

多年来,从有线到无线,从一体到分体,耳机的种类可谓五花八门,但从2016年以来,TWS耳机已经成为绝对的大势所趋。

它的特点是:两个耳机都独立存在,不再需要电线连接,从而彻底摆脱了电线束缚。耳机的设计也可以更加贴合耳部的结构设计,就像一颗豆子一样戴在耳朵里。

当然,这就需要每个耳机都要拥有独立的电源、处理器、射频和传感器,技术难度大大提升。

在此基础上,莫比斯在7.5克的耳机里,嵌入各种传感器和人工智能功能,还要确保续航时间,这背后的技术实力可以说相当过硬。

更何况,莫比斯还是全球首次将智能手机天线应用于耳机,并首次在TWS耳机中使用了Alongo双麦降噪技术。

(2)莫比斯的蓝牙标准是4.2。对耳机的性能来说,蓝牙的关键无须多说,而4.2的优势,相信也不用我再啰嗦了。

(3)防尘防水,莫比斯做到IP65,不算拨尖,但已经在标准线以上。

(4)心率算法用的是lifebeam。

这些年智能设备大热,号称能统计步数、在骑行、健身时监测心率和卡路里的设备,可以说遍地都是。但大多数设备监测的数据准确率,就只能呵呵了。而莫比斯用的lifebeam算法,是目前全球最准确的随身心率追踪测量算法。

它的准确有多高呢?航空级——这个词可不是说着玩的,它是真的用来给宇航员测心率时用的。

(5)全双工人工智能交互。

嗯,这个词有点拗口。

简单解释下,什么叫全双工呢?简单来说,就是你和我可以同时说话,大家一边说,一边听。

这样,在人机交互的时候,不但可以随时打断和补充命令,而且能够拒识和过滤无效的语音。

看上去简单,但它实际上需要非常强大的语音识别和分析能力,是科大讯飞压箱底的技术优势之一。

(6)识别和翻译的准确率达90%以上。这一条无须解释,往上每一个百分点都是大不同啊。

(7)上下文对话场景智能识别技术,集成智能语义断句解决方案。可以结合交互的上下文,进行语义理解,并具有长时间的用户交互历史记忆,甚至可以同时管理多个对话场景,跨场景信息共享长时记忆。

这也是深度学习带来的技术实力,它的实际体验值得期待。

至少,各种助手"记忆只有一句话"的这个老大难问题,已经被它扫进垃圾堆了。

(8)实时语言翻译。内置听译、同声传译和同声对译3种中英翻译场景。以后出国旅游轻松了!

(9)多种生活服务功能集成。通过莫比斯,打电话、天气预报、闹钟提醒、时间查询、地图导航等等手机上的大多数功能,都可以用语音直接搞定。

(10)海量娱乐资源。

作为咪咕公司的首个智能硬件产品、首个众筹项目,莫比斯也得到了咪咕全力的资源加持。

它依托的咪咕系海量正版有声内容,有多少呢?至少包括:

超过1700万首歌曲……

84个分类,70万集、20万小时高清有声内容,从有声小说到资讯新闻,从名家专栏到网络电台,想听什么都有……

真正说起来,这可能也是我们使用频率最高,使用时间最长的领域。

而据咪咕透露,如果配合人工智能应用"咪咕灵犀",莫比斯还会有更多惊喜表现。不过,由于没有体验,暂时就没办法介绍了。

这个以德国数学家命名的耳机,或许真的能像它的莫比乌斯环的科技感设计一样,为我们带来无穷的未来想象。

 
最新文章
相关阅读