AI Pin打开了AI硬件的一扇窗。

又是被 AI 轰炸的一周。除了苹果「放弃造车」的大消息,这周全球科技行业的焦点还是集中在 MWC24 大会上,在巴塞罗那现场的雷科技报道团也带来了全方位一线报道,您可以在雷科技网站或微信点击“MWC·现场”回顾所有内容。


和之前预料的差不多,AI 成了这届 MWC 大会的重中之重,各式各样围绕 AI 进行设计和产品定义的硬件设备,更是现场最受关注的品类之一,甚至就连在场外,苹果放弃造车据传也是因为战略重心转向 AI。


但说回 AI 相关硬件,除了 AI 手机、AI PC,过去一年最受关注和期待的产品应该就是以 AI Pin、rabbit r1 为代表的独立 AI 终端,按照计划,它们都将在今年 3 月、4 月正式发货——在宣布放弃传统智能手机新项目All in AI时,魅族曾提到这两款AI新物种,不过魅族认为这两款AI新物种都不够完美,因此魅族要做更好的AI终端。2月29日晚魅族将新发布的魅族21 Pro定义为“AI入场券”。


那么AI Pin、rabbit r1体验到底如何?1月,雷科技CES报道团曾深入聊过 rabbit r1 这款全新形态的产品,而在本次 MWC 现场,我的同事「一位天明」就在高通展台体验了听闻已久 AI Pin,结合他的分享,我们对 AI Pin 这款产品有了新的认识。


005wwKz0gy1hn9gq98njqj31400u0jwp.jpg

图片来源:雷科技报道团现场摄制


挂在胸前的 AI 助理,还长了「眼睛」


了解过 AI Pin 的读者应该知道,AI Pin 是一款没有屏幕的独立穿戴设备,搭载了高通骁龙八核芯片,通过 eSIM 支持网络连接,不依赖于手机或者其他个人终端,将语音作为核心的交互方式,但其实还支持激光投射、手势以及触摸(机身表面)三种交互。


不过总的来说,AI Pin 最主要的使用方式还是「对话」。就像手机或者智能音箱上接入大模型的 AI 助手一样,用户可以问各种问题来获取所需信息,还支持 50 种语言的实时翻译,可以将用户的语言实时翻译成另一种语言,或是将他人的语言翻译成用户的母语。



ezgif-4-e85988b6ce.gif

图片来源:Humane


AI Pin 虽然没有屏幕,但也是有图形用户界面。当用户需要查看信息的时候,AI Pin 可以通过内置的单色激光投射到手掌上浏览,同时支持手势交互,通过手指的点按进行导航。The Verge 记者还指出,AI Pin 的手势比他想象得更加流畅和灵敏。


005wwKz0gy1hn9gmlgaa0j31400u0grk.jpg

图片来源:雷科技报道团现场摄制


这在很大程度上可能受益于 AI Pin 对视觉大模型的关注。AI Pin 搭载了一颗广角摄像头,当然不是为了拍照,核心是成为 AI Pin 的「眼睛」,并利用大模型了解摄像头捕捉的画面,比如在 MWC 现场就能「看到」这是一个人声鼎沸的会场,或者对面人的穿着打扮。


另外值得一提的是,AI Pin 的穿戴设计可能是最容易被忽略的地方之一。打造 AI Pin 的 Humane 公司之所以将其设计成挂在胸前的设备,核心还是为了让 AI Pin 拥有更接近用户第一人称视角,可以「观察」用户看到的现实世界。


PixPin_2024-02-29_19-46-02.png

图片来源:雷科技报道团现场摄制


这也是很多人对于 AI Pin 最期待的地方。


回想一下,OpenAI 去年发布 GPT-4 的时候,就特意演示过让 GPT-4 通过照片了解冰箱里的「材料」,并以此给出一份合适的菜谱。理论上,通过视频获取的信息密度远高于照片,而「看我所看」的 AI Pin,确实有潜力成为真正意义上的「AI 助理」,一个能看不能动的「具身智能」。



理想丰满现实骨感,AI Pin面临不少挑战


AI Pin也不是第一款想通过机器视觉技术来解决人机交互问题的设备,早在2012年Google就推出了Glass,后来国内的百度跟着做了一款智能眼镜百度Eye,它们当时的故事是视觉搜索,用户戴着眼镜就能“指哪打哪”,然而受限于硬件算力、深度学习算法的智能水平、续航以及网络,智能眼镜并未取得成功,成了先烈,不过,它们在这一阶段的探索也给后来的AR眼镜等相对成熟的品类奠定了基础。


image.png

图片来源:Google Glass


大模型时代AGI(通用型人工智能)有了更强的感知能力,同时也具备了理解与模拟真实世界的能力,基于此拥有真正的认知能力。在此基础上,AI硬件被寄予厚望,AI Pin也是希冀用新一代AGI技术来实现Google、百度们探索失败的智能视觉交互。


image.png

图片来源:Open AI Sora


然而,目前视觉大模型方面的技术还难以支撑识别万物,AI Pin 通过摄像头了解到的现实世界信息还很有限,视觉交互在短期内很难做到完全可用。


续航也是一个问题。AI Pin 采用了分体式的设计,由一个 AI Pin 本体和一个通过磁铁连接的无线充电宝(他们叫做 Battery Boost)组成,Humane 公司还专门设计了热更换的电池以延长续航时间,但就算是总的续航时间,也停留在「轻度负载能坚持大半天」的水平。


圖片_20240229192445.jpg

图片来源:雷科技报道团现场摄制


而这还是建立在少用或者不用激光投射的基础上,毕竟激光在这样一个小型设备上确实是非常耗电的。


还存在算力的问题。据雷科技了解,AI Pin 采用了混合模型,设备本身的算力极其有限,端侧模型只用来处理语音识别以及基本操作等需要快速响应的请求,更多的处理还是交给云端模型进行处理。但云端处理就必然涉及到连接和延迟问题,还要再加上模型生成的时间,在 MWC 现场的演示中,AI Pin 往往就需要等待好几秒才能给出回应。


对于语音交互来说,无疑是很糟糕的体验。更何况,语音交互还存在严重的局限性,网友当年对锤子 TNT 的群嘲都还历历在目。


当前,AI硬件的重点攻克方向就是端侧算力的提升,除了给终端装配更强大的AI芯片外,在MWC24上联发科甚至展示了“多设备共享算力”技术——即让A设备可将闲置算力共享给B设备来进行大模型等巨量计算,然而这样的计算模式又需要新的边缘侧网络技术的支持,有挑战,也有机会。


不可能取代手机,点燃了AI硬件的星星之火


「手机能做的,AI Pin 都能做。」Humane 的工作人员在现场讲解时提到,AI Pin 的终极目标是取代手机。


005wwKz0gy1hn9gq7k55pj31400u047g.jpg

图片来源:雷科技报道团现场摄制


但 AI Pin 真的可能取代手机成为下一代的个人计算平台吗?恐怕没有多少人相信,不管是在现场的雷科技编辑,还是 The Verge、DIgital Camera World 在内的媒体明确指出自己的质疑,包括语音交互的局限性,算力、隐私与体验之间的权衡,以及大量具体到产品体验的实际问题。


更何况,这是一款售价高达 699 美元(约合人民币 5029 元)起的设备,有网友就吐槽得好,「有这钱为什么不换个好点的手机。」


事实上也是,AI Pin 能做的,理论上都能通过手机做到,并且考虑到更强大的算力、屏幕和软件生态,手机大概率会做得更好,这也是包括 rabbit r1 在内所有独立 AI 终端所面临的挑战。


不过也要承认的是,受限于设计和形态,手机很难像 AI Pin 一样挂在胸前,很方便就能让机器「观察世界,回答一切」,这其实也是可穿戴计算设备一直备受追捧的一个重要原因,单单是从口袋拿出 → 解锁 → 呼出相应界面,这几步就能制造足够的「摩擦」,劝退用户随时随地「召唤」AI 助理。


从这个角度来看,手机相比 AI Pin 或者 Vision Pro 这类穿戴设备确实存在天然的问题。所以 AI Pin 的成功或失败其实不重要,更关键的问题可能是:


可穿戴的 AI 终端能不能在手机全面 AI 化的未来找到生存的空间,甚至在技术的进一步突破之后,成为下一代个人计算平台?


这当然还是一个没有答案的问题,但可以相信,一定会有人和厂商继续沿着这条路进行探索,而 AI Pin 正是这样的一次探索,哪怕AI Pin像Google Glass一样一败涂地,但它至少点燃了一团AI硬件的星星之火,包括荣耀、OPPO、三星、魅族、小度、Rabbit在内的越来越多厂商正在AI硬件的路上,勇往直前。


image.png