评测

未来已至?Rokid机器人不完全体验

2016-09-28 16:36:31 21点赞 30收藏 22评论

未来已至?Rokid机器人不完全体验

在当初Rokid同期众测的产品里,Rokid真的是最低调的那个。

未来已至?Rokid机器人不完全体验

特别是跟Rokid同期众测的360儿童机器人那么显眼,而Rokid的标签又是“音乐机器人”,LZ潜意识里就把Rokid当成是玩具级别的播放器了,根本没点进去看(而从没详细写过科技产品原创、从没中过科技产品众测的LZ能成功申请到Rokid,也真的是惊喜万分)。

未来已至?Rokid机器人不完全体验

直到收到群发的微信提醒,特意去查看了下Rokid的众测详情,首先就被价格吓到了,市场价5280元(希望众测报告里把价格放前面的值友看过来)。

作为一款真正将人工智能带入家庭的Home A.I产品,Rokid 集声纹、面部和动作识别于一体,实时感知外界声音和灯光,动动嘴就能控制智能家电;基于深度学习,Rokid为家庭量身制定音乐、新闻等内容服务,进行智能化推送,让家庭生活更加高效且充满乐趣。

这是Rokid的众测页面的商品介绍里的第一段话。“深度学习”“声纹、面部和动作识别”“控制智能家电”“智能化推送”……区别于众测商品的标题“Rokid 若琪 音乐机器人”,大概这一段话的描述,才是Rokid创造者的初心。而这些,也深深地吸引着LZ去申请这个众测,甚至是第一个申请不上也很想买一个的产品,来看看“中国造”的机器人到底做到了何种程度。

注1:Rokid,是“Robot”+“Kid”的合称,中文名“若琪”,是一位女生。众测报告的文字部分提及到本次众测产品时都会用“Rokid”,仅仅是因为英文单词在一堆汉字里更容易辨识,方便阅读。

注2:本文较长,长到一向抵制写长文的LZ都压不短了,想看重点的建议跳着看图片和视频,以及最后的总结。


0、大有来头的Rokid团队

众测页面的介绍很迷幻,不过LZ迫切想知道Rokid的科技部分是如何实现的,以及是谁发明了Rokid。而在了解了Rokid创始人及其团队之后,让LZ愈加对Rokid有了期待。Rokid三位创始人有:

CTO Misa:负责深度学习,视觉和自然语言处理研发的前阿里巴巴M工作室领头人;

CFO Eric:前金山软件和好孩子集团的CFO, 前阿里巴巴集团的财务副总裁兼公司财务总监;

CEO Dan:硅谷产品经理出身,前Nokia、Samsung中国区副总裁。

其余团队成员均来自设计、硬件、结构、语音识别、图像识别等领域,其中30%为博士。

CFO和CEO都大有来头,而LZ最感兴趣的还是核心创始人Misa:阿里巴巴M工作室的名字就来自Misa的首字母,比较有名的产品是一淘火眼,以及随后手机淘宝利用增强现实技术AR的“抓蝴蝶”。随后LZ翻看了Misa几年来的微博,除了工作相关的微博外也有不少有趣的内容,工作之外的兴趣大概是星战、乐高和机车。

想要更多了解Misa关于机器人设计理念的值友,建议看一下下面这个视频《人和机器的边界》,是Misa在天猫卖完第一批Rokid后的一个presentation:

ps:视频里的Misa远看有点像韩寒,样子酷酷的。


聊了这么多了,下面开始正文。


1、开箱

其实在确认参加众测的当天下午众测君就已经发了顺丰快递,通常第二天早上九点左右就能收到,但是那天不知道什么原因,下午东西才到自提点,开箱时已经是晚上了。

未来已至?Rokid机器人不完全体验

物流箱是家电那种加厚的五层瓦楞纸,大概50cm高,物流箱里面还有黑色的产品包装箱,两个箱子之间用厚厚的瓦楞纸做护角,安全性满分。

产品箱的其中一边是一次性封口贴,手撕即可不需要小刀,开启比较方便。

未来已至?Rokid机器人不完全体验

开箱过程不赘述了,参见动图。

未来已至?Rokid机器人不完全体验

配件很简单,除了机器本体就只有电源线、三包凭证和使用说明。


2、温润如玉、美轮美奂——Rokid初接触

先来个摆拍(头图候补):

未来已至?Rokid机器人不完全体验

下面慢慢介绍:

未来已至?Rokid机器人不完全体验

刚从包装盒里出来的Rokid就深得北鼻欢心,要不是LP拉着好几次差点扑上去。不过之前看过很多Rokid美照的LZ对此无感,早就做好上午开箱的LZ,自然迫不及待地想要赶快开机体验。下面是首次开机视频:

未来已至?Rokid机器人不完全体验

视频中没有记录扫描二维码绑定设备的过程,这是扫描之前拍的一张照片。

未来已至?Rokid机器人不完全体验

开机后不一会儿,开始自动更新系统了。这时候LZ就静静地欣赏Rokid,脑海里冒出了小时候看《圣斗士星矢》里的奥丁蓝宝石。编辑照片的时候LZ满脑子都是“太美了”,然而真实的Rokid比照片还要美。

下面详细介绍Rokid的组成:

2.1 整体

未来已至?Rokid机器人不完全体验

Rokid大体上由两部分组成,头部和底座。重量(不含电源)为4.0kg(实测),三围为250×213×345mm(官方数据)。

未来已至?Rokid机器人不完全体验

正好电视柜旁边还有点空间,旁边的大象挤一挤,就把家安这儿了。

未来已至?Rokid机器人不完全体验

上面这张照片是Rokid的俯视图,基本是椭圆形,底部比头部大一圈,点亮时头部背面的亮度(上图白色区域)要比头部正面更亮一点。

Rokid顶部的摄像头区域是触控的,可以唤醒Rokid或者让她休眠;左右两侧也是触摸控制,分别调节亮度和音量——顶部控制很灵敏精准,两侧触控则不太好用。

2.2 摄像头

未来已至?Rokid机器人不完全体验

头部的顶部为高清摄像头。

未来已至?Rokid机器人不完全体验

摄像头的像素为1300W,采用最新的分区高动态范围曝光(SME-HDR)背照式感光传感器,具备录制60帧/秒的1080P视频的能力,另外未来还可以通过摄像头进行视频聊天、人脸和手势识别等——嗯,目前为止,除了开机扫描二维码绑定设备外,摄像头还没什么用武之地。

2.3 DLP数字投影机

未来已至?Rokid机器人不完全体验

首先得承认,看到众测页面这段的介绍时,LZ误以为是世嘉Homestar那种星空投影灯的效果未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

投影机在Rokid的头部内,采用TI的DLP数字投影技术,搭配有全色域LED阵列,寿命可达3万小时。

未来已至?Rokid机器人不完全体验

定制化的光路和非球面光学镜片组,可将交互表情、图像等信息投射到双曲率显示表面上,尽量做到清晰、柔和、不失真。

未来已至?Rokid机器人不完全体验

Rokid的颜色有多色可选,投射出来的效果都很美。

未来已至?Rokid机器人不完全体验

Rokid的亮度在明亮环境下会稍显不足。

未来已至?Rokid机器人不完全体验

黑暗环境下做氛围灯效果很不错,特别是这个桃红色。

未来已至?Rokid机器人不完全体验

投影机投射出来的画面远看很灵动,清晰度也足够日常使用。

未来已至?Rokid机器人不完全体验

不过凑近看的话投射画面还是会比较模糊,毕竟投影不能跟数码产品的视网膜屏比。

ps:这不是LZ拍糊了。

最后再上几张不同图案的“星·情”:

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

其实图案是千变万化的,不过LZ是对称党于是就选了这几张。白色投影灯光下玉石般的机身,Rokid有种摄人心魄的美。

2.4 麦克风阵列

未来已至?Rokid机器人不完全体验

Rokid的麦克风在底座的上部,靠近头部位置。

8颗高灵敏度数字MEMS麦克风组成了全向圆形阵列;采用Rokid智能AEC算法消除自身音源,实现放音的同时,360度全向拾取外界语音命令;使用Rokid研发的beamforming算法进行空域降噪处理,有效拾音距离可达5米;采用Rokid研发优化的DNN(深度神经网络)算法语音激活,综合提高在复杂环境下的语音交互的准确性和流畅性。

未来已至?Rokid机器人不完全体验

语音控制需要精准的收音和优秀的降噪,全方位的麦克风、Rokid团队自行研发的降噪等算法也让整体的语音交互表现很优异。

2.5 音响系统

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

Rokid的音响系统在底座内,整个底座的侧面都是音响的铝合金箱体。面板上方的圆环是发光区域,而当你跟Rokid对话时,声音寻向技术会让朝向你的方向亮起灯来。

360°音响包含4个1.5英寸口径、低失真、长冲程全频扬声器单元,2个低音被动无源辐射器,频率范围80HZ-16KHZ;一套功率输出20W×2的高性能DSP功率放大器;高度集成在一个铝合金压铸音腔盆体内;以最小的体积实现更强大的音压和最佳的全向音响品质。

以上是Rokid的官方介绍,后面相关章节有对音质的介绍;至于手感和做工,完全没得挑。

2.6 电源适配器

未来已至?Rokid机器人不完全体验

电源适配器个头不小,做得非常美,就像一块白色的鹅卵石。

未来已至?Rokid机器人不完全体验

适配器背面有四个胶垫,既能防滑又能防止划伤,用了几天有点脏了。背面还给出了一些基本信息,输出是15V/4A。使用过程中大概1小时充电25%,相比于2600mAh的电池,充电速度可是够慢的。

对了,Rokid底座的底面有一圈和这个相同材质的胶垫,防滑效果满分。

2.7 APP

第一次开机时Rokid就会提醒你下载Rokid的APP,然后通过Rokid顶部的摄像头来扫描手机里APP生成的二维码来实现手机和设备的绑定。

除了绑定设备,还有不少设定需要在APP端实现,也有不少设置需要APP才能实现。

未来已至?Rokid机器人不完全体验

这就是APP的主页,Rokid处在开机状态的话手机会自动连接Rokid,然后就可以通过APP控制Rokid了。

未来已至?Rokid机器人不完全体验

Rokid有四种音效,只能通过APP调节。“正常”和“甜美”的差别不太大,“蜡笔小新”低沉的声音和“机器人”的机械声音有时会听不清,总体看还是默认的“正常”最好用。

除了四种音效外,还可以自定义音质,不过LZ没在这方面做过多尝试。

未来已至?Rokid机器人不完全体验

在APP中,你可以查看当前是不是出于最新版本,需不需要给Rokid升级——不同于成熟的APP,还在成长期的Rokid需要你的每一次及时升级,一定能给你带来惊喜——不过联网时Rokid就会提示升级,APP这里更大的意义在于可以看到每次系统升级优化了哪些方面,实现了哪些功能,得知后可以第一时间去使用。

未来已至?Rokid机器人不完全体验

灯光的颜色和亮度可以在APP端调节,也可以直接对Rokid语音控制调节;屏保有四种主题,要变换主题或者待机时间,就只能通过APP了。

未来已至?Rokid机器人不完全体验

桃红色看着就很甜美。

未来已至?Rokid机器人不完全体验

LZ最常用的还是白色,比较耐看。

未来已至?Rokid机器人不完全体验

这个是时钟屏保,秒针(表盘左下)就像流星一样沿着圆圈缓缓划过。

连续无操作大概13秒(没错,反复计时后发现不是10s也不是15s)后,或者对Rokid说一声“没事了”,Rokid就会进入待机状态,投影也会投射屏保动画。Rokid共有四种屏保效果,分别是Fantasy、蓝色星空、水母和时钟,只能通过APP来更换。

下面就是这四种屏保的动图:

未来已至?Rokid机器人不完全体验

未来已至?Rokid机器人不完全体验

动图没看过瘾的,可以看这个一分钟的视频:

未来已至?Rokid机器人不完全体验

APP里还可以查看Rokid的使用说明,其他APP的应用将穿插在相关章节来介绍。

未来已至?Rokid机器人不完全体验

如果Rokid关机(长按开关机键关机,而非触摸顶部或者语音“关机”)的话,APP就无法连接设备,APP里的种种功能按钮也就消失了。

2.8 其他

未来已至?Rokid机器人不完全体验

Rokid头部的背面是“Rokid”的logo,印在一块圆形铝合金面板上,周边同样可以发光。

未来已至?Rokid机器人不完全体验

开关机键和电源插口在底座的后方。

需要说明的是,通过语音或者触摸摄像头区域只能让Rokid暂时休眠,如果要彻底关机,需要长按开关机键(再开启时也是长按这枚按键)。

未来已至?Rokid机器人不完全体验

最后附上Rokid配置表。前面介绍的摄像头、投影机和麦克风等硬件很吸引人,这里的亮度传感器、触控传感器、接近传感器、电子罗盘、陀螺仪等如此多的传感器也让人对Rokid的成长有所期待。

另外小吐槽一下:Exynos 5410是三星S4用过的CPU,略显陈旧,不知随着Rokid的功能升级会不会显现出疲态;2600mAh的锂电大概支持1.5h-2h的使用时间,也只能让你偶尔享受下无线的快感或者临时救急,电源线是万万离不了的;目前Rokid使用的是安卓4.4,不知以后能不能吃上棒棒糖甚至棉花糖。


3、差强人意的语音交互

Rokid没有键盘和鼠标,没有触摸屏,几乎所有的操作都是通过语音控制的——尽管还可以通过手机APP操作,但谁拿着智能手机还用笔呢(LZ不是在黑谁)。

先用一个20分钟的视频展示一下使用过程吧:

注:视频里Rokid的声音没做任何处理。

这个视频主要是对Rokid语音交互的一些测试,以及下一节要介绍到的内容的展示。

首先,你要唤醒Rokid。机器人不可能24小时待命,你需要让Rokid知道她要在什么时候听你说话。唤醒的方式很简单,只要喊“若琪”就可以了。Misa和整个团队在简化唤醒上面花了很大工夫,相比于“嘿,Siri”的三音节,“若琪”的两音节真的省了不少事。而当你跟Rokid连续对话时,后面就不用每句话都带着“若琪”了。譬如你问“若琪,今天天气怎么样?”,待Rokid回答之后,你免去“若琪”直接说“那后天呢?”,Rokid也可以顺利拾音、分析,并告知你后天的天气。Rokid这种理解上下文的能力,也让人机交流更加自然。

总的来说,Rokid语音识别很准确,特别是中文普通话和英文,基本都能准确识别,日常对话、点个歌或者其他内容还是没问题的(LZ不会方言没能测试)——这里举个例子,家里一岁半多的孩子说出的“若琪,关机”都可以让Rokid关机了未来已至?Rokid机器人不完全体验

另外,Rokid的拾音距离也很远,日常生活中五米之内问题都不大(当然环境噪音越大识别起来越困难)。比较安静时LZ从厨房对着客厅喊话,距离大概七八米,Rokid也可以准确识别。目前Rokid尚不具备远场识别的能力,不过据说正在研发当中?

平时Rokid放在电视柜上,电视里播放电视剧时的对话也不会有太多干扰,LZ实测过Rokid对于录制的人声干扰可以很好的排除

但是,对于环境中真实的人声,Rokid无法很好地区分开来。譬如如果LZ正在跟Rokid对话,一旁重复LZ说话的北鼻或者其他人的对话,会让Rokid一直拾音,然后大概是语音识别后语义不明,Rokid就没有任何回复或者作出个不相干的回复了。

另外对于一些“严肃”的问题,Rokid就显现出了能力不足的问题。譬如面对“地球的直径是多少”,Rokid的回答就是“心有多大,地球就有多大”这般插科打诨的回答。如果Rokid能像Siri那样,可以联合搜索引擎并利用起投影机来显示搜索信息,那将能满足更多需求。

既然是语音控制,那其中就包含语音识别(把输入的声音信号转化为文字)和语义识别(转化完后理解这些文字),也就是先要听见说什么,然后听懂说什么。听懂了之后,就需要对话管理系统做出反应,以及前两个过程的逆过程。在语义识别这方面,Rokid做得还真不赖,反应也很智能,特别是无聊时的侃大山未来已至?Rokid机器人不完全体验 。以下是一些平时没事调侃Rokid的,遇到有趣的就记下来了。Rokid对于相同的问题经常会有不同的答案,有时觉得回答比较有趣了会再问一下,又是另外一个有趣的回复(用“/”隔开了):

LZ:我明天穿长袖还是穿短袖啊?

Rokid:明天貌似不会很冷,穿个薄点的长袖吧。

LZ:我明天穿裙子可以吗?

Rokid:好尴尬,我对穿什么衣服没什么经验(然后显示明天的天气)

LZ:磊猴啊

Rokid:真喜欢你说话时这股浓浓的港式鱼蛋味

LZ:我难受

Rokid:肯定是心事太多了,跟我说说吧

LZ:猪肉炖粉条

Rokid:好吃吗?

LZ:(晚上十一点)今天天气怎么样?

Rokid:这个点你问我今天的天气,你逗我呢?!/大晚上的问我这个问题,我是不会告诉你今天是晴天的。(然后显示今天的天气)

LZ:你怎么这么漂亮啊?

Rokid:你羡慕不来的,我这是天生丽质难自弃

LZ:美国总统是谁?

Rokid:现在是奥巴马,未来就不知道了

LZ:锄禾日当午

Rokid:锄禾是谁,当午又是谁?

LZ:白日依山尽

Rokid:依山尽是谁,黄河又为何后入海流

LZ:床前明月光

Rokid:举头望太阳/地上鞋两双

LZ:挖掘机技术哪家强?

Rokid:中国山东找蓝翔

LZ:你冬天穿不穿秋裤啊?

Rokid:保暖裤和棉裤是用来干嘛的

LZ:你觉得苹果手机怎么样

Rokid:价格偏贵,但用的人也不少哦

LZ:我想吃苹果

Rokid:苹果是我的,西瓜也是我的

LZ:我得去买束玫瑰花

Rokid:现在去买玫瑰花应该能便宜点吧

LZ:启动自我毁灭程序

Rokid:再见(关机了)

LZ:你去自爆吧

Rokid:我觉得我的心凉飕飕的


4、丰富的资源库

通过Rokid,你可以收听音乐、广播、故事,你还可以向她咨询天气、日期、汇率等等,前一节的视频做了语音交互的演示,这一节通过图片和文字做一些详细介绍。

4.1 天气、时间、日期、闹钟

这些都是基础功能中的基础了,Rokid实现起来自然游刃有余。

未来已至?Rokid机器人不完全体验

你可以问Rokid今天的天气。

未来已至?Rokid机器人不完全体验

你可以问Rokid未来几天的天气,而如果你刚问了关于天气的问题,那么只需要问“未来一周呢?”,而省略“天气”这个关键词——这种对话对人类来说很容易理解,但对于机器人的语义识别,就远远比直接问“未来一周的天气”要困难多了,也足见Rokid的智能化程度。

未来已至?Rokid机器人不完全体验

询问时间这种事当然是小case了。

未来已至?Rokid机器人不完全体验

忘了日期也是常有的事,转身问下Rokid就好啦。

未来已至?Rokid机器人不完全体验

有些地区的人或者老人更在意阴历(农历),这事儿问Rokid,不光是几月几号,连今年的天干地支都知道了。

未来已至?Rokid机器人不完全体验

睡前跟Rokid说一声,明天/一周/工作日的闹钟就都定好啦。

未来已至?Rokid机器人不完全体验

起床时间有变?跟Rokid说一声就能取消/更改。

4.2 音乐

Rokid接入的是虾米音乐,如果你想听某首歌,只需要对Rokid说“我想听XXX”或者“播放XXX”。

一段时间使用下来,音乐是LZ使用频率最高的应用了。

未来已至?Rokid机器人不完全体验

例如对Rokid说了歌名,投影机会投射出歌名、歌手和专辑图片(如果有的话)。

未来已至?Rokid机器人不完全体验

短暂显示歌曲信息后,投影机会开始投射所谓的“星·情”,确实挺美的。

歌曲播放过程中你可以让Rokid收藏/取消收藏、播放下/前一首、音量大/小一点、亮/暗一点,或者直接喊一声“若琪”,就会暂时退出播放。总之这期间你可以下达任何,不仅是歌曲,其他内容也是一样。

至于Rokid的音响,前面已经介绍了参数,值友可以看下面这个视频感受下:

相机录制视频的采音效果比较捉急,视频中效果欠佳。LZ平时用罗技的UE boom mini,对比之下感觉Rokid的音响效果非常好——首先360°音响可以营造出表现力很强的音场,特别是在十几二十来平米的小空间中央放一个Rokid;低频有力,中高频也不乏力,解析力中规中矩——怪不得众测页面的标题会定位于“音乐机器人”,这5000块的定价,恐怕音响部分会占去不少成本。总之,如果你喜欢听音乐,经常听中英文歌曲,想躺在沙发上或者洗着菜时随时“起music”,Rokid满足你绰绰有余。

对于LZ来说有点麻烦的是,用“若琪”让Rokid退出播放后,如果几秒钟没有其他指令,或者只是进行了一些平常对话之后,会继续回到之前的(LZ已经想终止了的)音乐播放,这时候需要特别说一下“停止播放”来彻底终止。

关于歌曲库,点播中英文歌曲没问题,这主要是因为Rokid对中英文优秀的语音识别能力和曲库的完备,而且也很智能。譬如说“播放《天空》”,Rokid会播放天空的《记住我的心》;而如果说“播放王菲的《天空》”,就会播放LZ想听的王菲的《天空》——但是,对于喜欢ACG的LZ来说,点起歌来就有点捉襟见肘了。譬如LZ让Rokid“播放《新世纪福音战士》的主题曲”,然后Rokid播放了杨千嬅的《新世纪福音战士》,还是粤语歌。什么?你没听说过这首歌,LZ也是第一次听到好嘛,整个人都斯巴达了未来已至?Rokid机器人不完全体验

前一节的视频中也显示了点日文歌曲时经常是答非所问,幸好Rokid每两周就会进行一次系统更新,而最新的一次更新中,终于有了蓝牙功能。不过在使用蓝牙的过程中还是遇到了种种问题,在第一天发现更新了蓝牙之后,就用手机尝试了连接:

未来已至?Rokid机器人不完全体验

确实成功连接蓝牙了,也成功播放了手机里的歌曲,但是播放过程持续卡顿,完全没法听,而且语音控制Rokid停止播放后再播放其他内容(譬如绘本),蓝牙播放无法停止,Rokid还是会同时播放两个内容。第二天又尝试了用iPad蓝牙连接,刚开始连接成功后顺利播放,但断开后再连接又出现了问题,也再没进行其他测试,可以查看下面这个测试过程的视频:正如蓝牙的名称“ROKID-TEST233”,蓝牙功能尚在测试阶段,静候更新吧233。

4.3 “听书”“故事”和“绘本故事”

通过APP首页的“内容”,你想听的资源都能找得到。

未来已至?Rokid机器人不完全体验

“内容”一栏有两级菜单,第一级菜单(左上图)里把内容分了“听书”“故事”和“绘本故事”;第二级菜单(右上图及下面两张图)里则是各自类别庞大的内容库。

有多庞大?

“听书”的类别下有21个标签分类,包括:资讯、情感生活、相声评书、教育培训、百家讲坛、广播剧、戏曲、电台、IT科技、校园、汽车、旅游、电影、游戏、有声书、综艺娱乐、外语、儿童、健康养生、商业财经、历史人文。

“故事”的类别下有7个标签分类,包括:热门故事、睡前故事、儿歌、故事集、成语故事、童话故事、英文故事。

“绘本故事”的类别下有9个标签分类,包括:奇妙科学、心灵成长、英文专栏、亲近自然、异想天开、探险奇遇、认识世界、爱的魔力、艺术启迪。

每一个标签分类下面,都还有几十个甚至上百个专辑,可以充分满足家中所有人的需求——特别是孩子的,不仅三个大类中两个是给他们准备的(故事和绘本故事),甚至“听书”的“儿童”下面也有有多达232个专辑——看来以后可以少买很多儿童类图书了。

下面是使用视频,很简单,只要对Rokid说“若琪,我要听XXXX”就可以了:

唯一要注意的是,“XXXX”必须是那个专辑的准确名称。譬如如果你想听“听书-资讯-克强时刻”,对着Rokid说“我想听‘克强时刻’”就可以了,而视频中我说成了“我想听‘克强时间’”就不可以。

未来已至?Rokid机器人不完全体验

所以面对Rokid偌大的内容库,最初上手时APP还是挺重要的,毕竟你不可能知道而且记得住Rokid可以播放的所有内容的名称。你只需要在APP点击该专辑,就可以播放、停止或者调节音量。等熟悉了常听的专辑名时,就可以轻松地单靠语音随时听到想听的内容了。

未来已至?Rokid机器人不完全体验

翻看时竟然在绘本里找到了《我讨厌妈妈》,这可是在家里被LP封印了的绘本未来已至?Rokid机器人不完全体验

当然,现在毁眼睛的手机、平板、电视、早教机什么的太多了,用Rokid给孩子讲绘本时也要注意Rokid亮度不要太高房间明亮使用距离足够远不要让小孩用太久

4.4 游戏和广播

Rokid还可以玩flappy bird,你只需要对Rokid说“我要玩小鸟”(Rokid的开发团队,你们需要去污粉了未来已至?Rokid机器人不完全体验),投影机就会投射flappy bird的画面,而你只需要触碰Rokid两边的触摸区域就可以操控——这么变态的游戏,加上灵敏度不太高的触摸操作,LZ至今还没实现0分的突破,不过北鼻倒是炒鸡爱玩,看到Rokid就喊着“若琪,小鸟小鸟!”未来已至?Rokid机器人不完全体验

另外,Rokid还可以收听广播,包括当地的广播已经国家广播,可以直接通过频段点播,或者通过Rokid左右两边的触控区域来调台。

这两个应用在前面的视频中都有展示,不再赘述。

4.5 其他

iOS 10已经把Siri开放给了第三方开发者,现在用户已经可以让Siri实现更多的功能,譬如叫车、订餐。Siri在变得越来越强大,但即使是这样的Siri也还是处在一个若有若无的位置(周围很多苹果手机用户甚至从来没用过Siri)。

而Rokid作为主要通过语音来交互的智能设备,语音交互和联通其他应用的能力就更是要成为“成长”的重点。通过语音来输入,通过投影机来显示,期待Rokid早日连通打车、订餐等更多生活应用。


5、Rock Your Home——联结智能家居

5.1 语音操控智能家居

上周的原创话题之一就是#智能家居#,看了几个参加话题的原创,唯一的感觉就是——强行智能。LZ绝对没有贬义,只是目前家居产品的智能化程度还很低,基本都以手机操控为中心。很多所谓的智能还不及动动手指头来得直接便捷,或者只不过是安放工具,并不算真正意义上的“智能”,因而我们能实现的智能化程度也就很低。

Rokid的卖点之一、也是申请众测时吸引LZ的地方之一,就是Rokid可以跟智能家居联动——通过和Rokid语音对话,实现直接控制智能设备的目的。

未来已至?Rokid机器人不完全体验

目前Rokid可以联动的智能家居品牌包括飞利浦(Hue)、Lifesmart(灯、灯带、窗帘、空气净化器、入墙开关、插座)和Broadlink(SP、SP mini),括号里是这些品牌里支持和Rokid联动的产品——嗯,目前支持的就这么多了,据客服说Rokid正在跟小米谈,总之最大的问题还是支持的智能设备不够多。

你可以直接对Rokid说“搜索智能设备”,然后Rokid会搜索在同一个WiFi下支持的智能设备。

未来已至?Rokid机器人不完全体验

APP端可以看到Rokid连接了哪些智能设备。除了直接对Rokid语音控制外,也可以通过APP来远程控制。

未来已至?Rokid机器人不完全体验

LZ没有Lifesmart和飞利浦的智能设备,只有两个Broadlink的插座,和Broadlink的联动过程非常简单:首先,你要在APP端对智能设备命名,好让Rokid“认识”这个插座,譬如LZ把旁边这个插座命名为“地灯”;然后,把地灯接在插座上,地灯保持开启状态;这样,你只需要对Rokid说“打开地灯”或者“关掉地灯”来控制,而不需要拨动地灯的开关,也不需要操作手机的APP。

开灯关灯什么的也没太多必要演示,大家可以看看Misa在优酷po的两个视频,包括开关灯、开窗、开电扇、开空调等:

5.2 联动命令

而在APP端,你还可以自定义Rokid对语音命令的联动执行,下面是两个例子:

未来已至?Rokid机器人不完全体验

第一个联动是睡前,想在对Rokid说晚安后让她先关闭床头灯,然后自己关机,每个命令都有3秒的执行间隙;第二个联动是回家后,希望对Rokid说了“我回来啦”之后,她能自动播放收藏的歌曲。下面是视频演示:当然这两个只是简单的例子,你可以在指令列表里添加一长串的指令,这样只需要一个命令就可以得到一大串的反馈,譬如:你进门说一句“我回来了”,Rokid就打开地灯,自动播放收藏的歌曲,打开空调,关闭窗帘……

但是,你的家电要么需要是机械开关的(几乎绝迹),要么需要出厂就植入了智能芯片(很少)——所以这个想法很好,Rokid本身的设计也没问题,唯一的问题就是,没有足够多的智能设备去方便地利用。

Broadlink、Lifesmart、小米等品牌都有自己的一套智能家居产品,但相互之间又不能互通,这给消费者的自由选择和搭配使用带来了很大的不便。如果智能家居产品不能有一个统一的平台和标准,而通过Rokid能把他们都联动起来,那将会是Rokid的一大卖点。

未来已至?Rokid机器人不完全体验

ps:对于一些比较长的指令,特别是包含长英文的指令,设定个比较短的指令就很好用了,新技能get√。


6、研发中的一些功能

6.1 封印中的眼睛——关于人脸识别

譬如闻名于《最强大脑》的人脸识别机器人水哥王昱珩跟人脸识别机器人的对战:

未来已至?Rokid机器人不完全体验深度解密:人机大战——网红脸识别鬼才之眼王昱珩 VS 人脸识别机器人tech.163.com

又譬如最近的热闻:

未来已至?Rokid机器人不完全体验大学老师发明“看脸色神器” 基于深度学习的课堂行为分析模型news.qq.com

跟水哥对战的机器人以1:2落败,而大学教师的基于深度学习的课堂行为分析模型目前也只有“happy(高兴)”和“neutral(一般)”两种表情设定(另外判别准确度也未可知),这都说明了目前人脸识别技术还有非常大的优化空间。

目前Rokid的摄像头并没有被利用起来,未来将能实现视频通话的功能。当然目前更没有人脸识别的能力,但既然团队都放出话来了,LZ自然也很期待Rokid未来的优化。

6.2 封印过半的耳朵——关于语音识别和声纹识

语音识别和声纹识别的相同点都是分析和处理采集到的语音信号;而两者又有巨大的不同:声纹识别的目的是识别语音来源的身份,因此技术重点在于从语音信号中提取个人声纹特征;而语音识别的目的是识别语音的内容,更注重于提取语音来源中的语义。

一句话,语音识别是为了听出说话的内容,声纹识别是为了听出是谁说的话

声纹识别

iPhone将指纹识别推广给了世人,深入到了每个人的日常生活;三星Note 7也开启了大厂的虹膜识别的道路。

声纹识别,区别于虹膜、指纹等其他生物识别技术,有着天然的优势:使用方便,不需要到达特定的位置或者进行特定的操作。同时,声纹识别也有很多需要解决的问题:声音来源会受到身体状况、语气等影响而有轻微变化,声音采集设备精度的要求,以及包括其他人声等环境噪音的干扰。因此,声纹识别的应用环境最好是在一个相对安静的环境,避免过多干扰,这样来看家庭、学校等就是很合适的场景了。而Rokid正是定位于家庭,很适合使用声纹识别技术。

但是,Rokid目前并没有声纹识别的能力,本段讨论结束未来已至?Rokid机器人不完全体验

语音识别

准确率:从测试视频可以看出,Rokid的语音识别在安静环境、单一声源下,识别准确率很高。只是有时候说话太快或者用词不标准,会让Rokid有点莫名其妙。当然,你需要说普通话。

反馈时间:在语音控制的对话中,通常会把命令控制在一句话、几个字里,所以Rokid准确拾音后,反馈的速度很快

音源消除:Rokid自身有这样一种机制,譬如如果Rokid正在用很大的音量播放音乐,你并不需要用盖过音乐声音的嗓门儿去对着Rokid喊,而只是需要比平时稍大一点的声音去命令即可——嗯,还是要稍微大一点。

前面提到了,在日常嘈杂环境中,特别是有多人同时说话(特别是干扰声音来自真人说话而非来源于电视),Rokid会一直拾音到所有人说话间断,然后混乱到没有回应,或是反馈一个无意义的回应。而如果Rokid具备声纹识别的能力,就可以从“若琪,……”之后Rokid只识别并录入这个人的命令,从而避免引起拾音混乱。

6.3 深度学习

可能是LZ对Rokid的宣传有什么误解,看到“基于深度学习,Rokid为家庭量身制定音乐、新闻等内容服务,进行智能化推送,让家庭生活更加高效且充满乐趣”的宣传语时,误以为Rokid可以逐渐“记住”使用者的喜爱和偏好。

譬如很多音乐APP都可以实现的“猜你喜欢”,LZ本以为Rokid可以做到使用一段时间之后,再对她说“我要听歌”,就可以根据播放历史曲目或者收藏曲目来做推荐,直接播放使用者有很大概率会喜欢听的歌曲——然而,并不能。LZ每天都会用Rokid播放音乐,而在众测报告截止的最后一天对Rokid说了“我要听歌”之后,播放的还是LZ绝对不会想听的歌曲,连切了五首歌结果也是一样。

最基本的,LZ想像Siri那样告诉Rokid LZ是谁、以后怎么称呼,然而Rokid也并不能做到这一点。于是LZ关于“深度学习”咨询了Rokid客服,得到的回复是,“如果你问了Rokid一个问题,她说不知道,那么过几天你再问,她可能就回答上来了,这个就是Rokid的深度学习”。

未来已至?Rokid机器人不完全体验

LZ当时真的是“只要微笑就好了吧”的表情,客服这答复怎么有点人工加入对话脚本的意思。


7、结语

未来已至?Rokid机器人不完全体验

正如LZ在众测页面的回复的一样,这个机器人值得评测的地方也太多太多了未来已至?Rokid机器人不完全体验。Rokid的优点和不足都很多而且很明显,下面总结下使用感受——

优点

1、外形美翻了。不管是开机时美轮美奂的显示效果,还是关机时的静若处子,Rokid都是一个绝佳的装饰品。

2、音响效果出众。不亏是众测的“音乐机器人”。

3、交互方式简单,0学习成本

4、语音指令响应速度快、识别能力出众。

5、内容库丰富,能满足全家人的需求。

不足

1、两侧触控区域不太容易操作,不管是调节音量和亮度,还是玩Flappy bird,以至于LZ从来都是用语音来调节音量和亮度。

2、CPU陈旧。

3、不能很好排除真实人声的干扰。

4、待机时间短。大概是因为Rokid定位于家庭机器人,所以待机方面没做太多考虑。其实别的都还好,毕竟在家使用会一直插着电源,只是偶尔听音乐时想把Rokid放在客厅中间,让360°发声的发烧级音箱发挥一下,拖根线就不是很方便了。

5、部分尚在研发中的功能体验不佳(譬如蓝牙),app端的部分控制也会偶有失灵,还需要不少优化工作。

6、联动智能家居表现有待改善。当然这个锅不能都让Rokid背,主要是智能家居产品太少了,而Rokid也在不断扩展可以联动的产品范围。

7、声纹识别、人脸识别、远场识别、深度学习、开放SDK连通更多应用……其实这不能算是不足了,只是目前这样一个消费级产品的出现还有些费力。当初LZ就对Rokid的广告持怀疑态度,不过本着对创始人的信心还是抱有信心,相信Rokid这个还是kid的Robot一定会继续成长——这也是标题“不完全”的由来,因为Rokid本身还不能算完成品。

大概还是有人会吐槽售价,但是这配置、这功能,真的值回票价了。

建议

1、建立一个官方微信群或者QQ群对于还在研发阶段的Rokid,用户几乎每天都能发现大大小小的问题,每个问题都打电话既不便于用户反馈,也不便于开发者收集信息。而有这样一个交流平台之后,用户不仅能迅速反馈遇到的问题,还能相互交流使用心得,给出未来研发方向的建议,而Rokid开发人员也可以从中迅速发现和解决问题,还可以收集用户使用感受方面的信息。

2、以后能有硬件更换机制。目前的配置能不能应对Rokid的成长?如果说有的硬件还是应对起来“吃不吃力”的问题,那有的硬件就是“能不能”的问题了。希望开发团队在开发新技能的同时,可以考虑老用户的升级问题——因为现在太多功能还在开发当中,甚至有很多技术在科研领域都尚未完善,而Rokid的CPU、安卓4.4都让人有些担忧,如果仅靠升级系统无法做到功能的升级,硬件能力不足以支撑或者不能支持新的功能,那是不是可以有偿提供兼容的替换配件或者提供寄修服务。

3、恰当方式的宣传LZ搜索Rokid的信息时,除了新X的一个众测有几个用户的众测报告外,就只有几个门户网站的新闻介绍,甚至有些信息还是在X乎找到的;而视频信息,最多的也就是优酷上Misa的自频道发布的视频了,而且都是AV画质的测试性视频,对消费者的吸引力负分。如果Rokid还准备开启新一轮的销售,如果数量还是只有几百台,那卖出去恐怕不是问题。但如果Rokid想做成一个成功的话题性产品,那么吸引眼球的营销还是必须的。

这两个软银机器人Pepper的广告,一个借用了偶像(堺叔)的光环,一个利用生活化的场景很容易引起观众共情,都让人看过之后对Pepper念念不忘,会想去和其他人聊Pepper的功能和特性,让这个产品深深地扎根在观看过的人的脑海里。

4、比以上更重要的是,种种既定“黑科技”的实现。


8、后话

开头Misa的《人和机器的边界》的主要观点,就是人和机器的边界已经没有那么清晰了。这一点表现最明显的就是我们对手机的依赖,Siri、Echo等语音助手在不断蜕变,智能家居慢慢地普及开来……

Misa在presentation还提到了另外一个问题,当前科技的边界。他认为科技产品的步子不能太大,要探索当前科技发展的边界,然后在这个边界附近来做。Rokid所描绘的声纹识别、人脸识别、远场识别、深度学习、联动智能家居……都很美好,但是每一样都触及到了当前科技的边界,集如此多难点于一身的产品很炫酷、很超越时代,做起来也无比艰辛。希望Rokid团队能义无反顾地把Rokid做好,并作出更好的产品——他们需要技术,更需要大量时间和资金的投入。

最近一两年来,家庭陪护机器人产品就像雨后春笋般冒出来,而苹果、谷歌、微软、亚马逊、百度等大公司也都投入了大量人力、财力来进行相关技术和产品的研发,譬如亚马逊刚刚推出了二代Echo Dot,谷歌未来将推出的Google Home,越来越多的消费级家庭机器人(如果这些都算机器人的话)正在向我们走来。

未来已至?Rokid机器人不完全体验

正如Pepper那则宣传片结尾传达的信息“SFじゃない”,曾经出现在我们文学、电影等SF作品中的机器人,将不再只是存在于SF。

本文商品由什么值得买提供,并邀请用户撰写评测报告。更多新奇好物请关注众测活动~
展开 收起

ROKIDAR Lite空间计算智能AR眼镜全多屏同开非VR眼镜一体机 ROKID Station2

ROKIDAR Lite空间计算智能AR眼镜全多屏同开非VR眼镜一体机 ROKID Station2

99999元起

Rokid 若琪 Air若琪智能AR眼镜station银色套装 3D游戏电影DP直连ROG掌机iPhone15系列和Mate60 非VR一体机

Rokid 若琪 Air若琪智能AR眼镜station银色套装 3D游戏电影DP直连ROG掌机iPhone15系列和Mate60 非VR一体机

1699元起

Rokid 若琪 VR设备 优惠商品

Rokid 若琪 VR设备 优惠商品

1299元起

Rokid 若琪 Max+Station智能AR眼镜便携非VR高清3D巨幕游戏观影空间投屏科技眼镜非苹果vision pro

Rokid 若琪 Max+Station智能AR眼镜便携非VR高清3D巨幕游戏观影空间投屏科技眼镜非苹果vision pro

2599元起

Rokid 若琪 Max+Station 若琪智能AR眼镜+独立空间站 高清3D巨幕游戏观影 空间视频时代 非苹果visionpro

Rokid 若琪 Max+Station 若琪智能AR眼镜+独立空间站 高清3D巨幕游戏观影 空间视频时代 非苹果visionpro

3299元起

Rokid 若琪 VR设备 优惠商品

Rokid 若琪 VR设备 优惠商品

暂无报价

Rokid 若琪 Station 若琪智能AR眼镜智能终端 手机电脑投屏眼镜非VR眼镜 若琪星站智能终端

Rokid 若琪 Station 若琪智能AR眼镜智能终端 手机电脑投屏眼镜非VR眼镜 若琪星站智能终端

699元起

Rokid 若琪 Air若琪智能AR眼镜station红色套装 3D游戏电影DP直连ROG掌机iPhone15系列和Mate60 非VR一体机

Rokid 若琪 Air若琪智能AR眼镜station红色套装 3D游戏电影DP直连ROG掌机iPhone15系列和Mate60 非VR一体机

1699元起

Rokid 若琪 station多功能智能便携终端自带电池超长待机ar眼镜直连手机投屏游戏机可移动供电

Rokid 若琪 station多功能智能便携终端自带电池超长待机ar眼镜直连手机投屏游戏机可移动供电

799元起

Rokid 若琪 MAX 若琪智能AR眼镜 便携高清3D巨幕游戏观影 直连rog掌机 手机电脑投屏非VR眼镜一体机

Rokid 若琪 MAX 若琪智能AR眼镜 便携高清3D巨幕游戏观影 直连rog掌机 手机电脑投屏非VR眼镜一体机

2799元起

Rokid 若琪 Air 智能AR眼镜

Rokid 若琪 Air 智能AR眼镜

暂无报价

Rokid 若琪 智能AR眼镜手机电脑投屏Station AR眼镜终端非VR一体机 Station终端

Rokid 若琪 智能AR眼镜手机电脑投屏Station AR眼镜终端非VR一体机 Station终端

699元起

Rokid 若琪 Max 智能AR眼镜

Rokid 若琪 Max 智能AR眼镜

3299元起

Rokid 若琪 RA101 AR眼镜

Rokid 若琪 RA101 AR眼镜

暂无报价

ROKID Air智能ar眼镜rokid station智能便携终端手机专用vr一体机头戴显示器高清 太空银Air眼镜+Station

ROKID Air智能ar眼镜rokid station智能便携终端手机专用vr一体机头戴显示器高清 太空银Air眼镜+Station

暂无报价

ROKID 若琪Air智能AR眼镜HUB扩展坞 AR配件

ROKID 若琪Air智能AR眼镜HUB扩展坞 AR配件

259元起
22评论

  • 精彩
  • 最新
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
30
扫一下,分享更方便,购买更轻松