常接触智能家居、全屋智能设备的朋友,应该都发现了这么一个问题:智能家居发展到今天,已经不缺设备,也不缺控制入口。但在大多数时候,这些 AIoT 设备只不过是知道该怎么把「活」做好,真正决定让哪个 AIoT 硬件出来干活的,依旧是用户自己。
打个比方,过去几年语音开灯、App 开空调、回家自动拉窗帘,这些技能已经成了全屋智能的标配。但往深一层想,系统并不真正知道家里发生了什么。想要实现真正的全屋智能,必须先让全屋智能系统知道家里的「现况」。
针对这一痛点,6 月 24 日,小湃科技在深圳正式发布 ClawStation 系列家庭智能体终端,以及家庭看护专用终端「亲眸」KinSight,让全屋智能真正进入到 AI Agent 时代。

图片来源:雷科技
发布会后,雷科技也和深圳小湃科技有限公司总经理王晓晖博士进行了一场深度对话,讨论了 ClawStation 作为边侧 AI 算力硬件,未来将如何影响全屋智能行业的发展。

图片来源:雷科技
将视觉融入全屋智能
由于「边侧 AI 算力设备」这个说法有些过于专业,可能有人会把 ClawStation Pro 当成智能音箱那样的 AIoT 网关产品。从功能上两者确实有些类似,但 ClawStation Pro 和传统智能家居中枢最大的不同,在于它不是单纯负责连接设备、转发指令。
过去的智能家居中枢本质上是一个网关、一个适用于 IoT 硬件的「路由器」:用户发出指令,中枢转给灯、空调、窗帘、扫地机器人,设备再执行动作。这套逻辑解决的是「怎么更方便地控制家电」,但没有解决「系统能不能主动理解家庭场景」。
而 ClawStation Pro 拥有感知、判断能力,可以接入摄像头(ClawStation Pro 支持四路视频输入),利用设备内的本地模型和边侧算力分析家庭空间里的画面,分析出当前家里的「状态」和「需求」,最后通过 PicClaw、OpenClaw Skill 等能力调用其他智能家居设备执行操作。

图片来源:雷科技
举个例子:红外传感器只能知道有没有人经过,毫米波雷达可以判断人体是否存在以及移动状态,但它们看不到地上的纸屑、玩具或水渍。ClawStation Pro 可以通过视觉感知识别到这类小物件,再调用米家或其他品牌生态里的扫地机器人处理。
这里的关键不在于扫地机器人变聪明了,而在于「决策」发生在 ClawStation Pro 中:扫地机器人只需要执行清扫动作,真正判断「为什么要扫」「什么时候扫」「扫哪里」的,是 ClawStation Pro 这样的家庭智能体。
王晓晖博士在采访中提到,现在智能体能力主要体现在两个方面:「一个是大脑,一个是眼睛。」大脑更多依赖 AI 大模型,但小湃科技真正投入最多的,是「眼睛」这一部分。用他的话说,小湃主要做的工作,是「怎么样让这双眼睛能够看得清楚,看得准确」。
视觉感知带来的想象空间也远不止扫地。比如 ClawStation Pro 可以判断孩子有没有好好写作业,是否长时间、近距离看电视;也可以在保洁结束后,辅助判断房间里是否还有遗漏区域;在老人看护场景里,它还能关注跌倒、久坐、进餐、活动状态等变化。

图片来源:雷科技
传统传感器大多只能告诉系统「房间里有人」,却无法告诉系统「这个人是谁、在做什么、状态是否正常」。视觉感知的价值,就在于它把全屋智能的感知层级往上提了一层。
而这背后也离不开小湃科技过去在家庭音视频终端和安防摄像头领域的经验。视觉 AI 并不是接入摄像头这么简单:摄像头能拍到画面,不代表系统能理解画面;模型能识别物体,也不代表它能在复杂家庭场景中做出稳定判断。而小湃科技充分发挥了自己过去的技术积累,让 ClawStation Pro 「既有眼睛,也有大脑」。
打造可「进化」的 AI 大脑
如果说视觉感知让 ClawStation Pro 拥有了「看见」的能力,那么本地模型和边侧算力,则让它有机会在家里完成「思考」。
王晓晖博士在采访中提到,小湃科技目前使用的是算能的一张 30 多 TOPS 算力卡,已经可以满足基本视频处理需求。不过边侧 AI 硬件还在快速发展中,后续也会持续升级算力卡。
而这个「升级算力卡」,也是 ClawStation Pro 的另一大亮点。
不同于传统家电,AIoT 设备正处于高速迭代期。今天本地运行的是 7B 模型,明天可能会出现更小、更快、更强的多模态模型;今天的算力卡能满足基础视频分析,明天用户可能希望它支持更复杂的家庭任务。
如果整机硬件无法升级,家庭智能体很容易在几年内落后于模型和芯片的发展速度。可更换计算卡的设计,至少给 ClawStation Pro 留出了持续进化的空间。

图片来源:雷科技
但 ClawStation Pro 的「进化」,并不只是硬件升级。
王晓晖博士用了一个很形象的比喻:
(智能体)得要用,得要养,就好比家里养孩子一样,那得要教他、养他,他才会越来越聪明。
这句话放在家庭场景里非常合适——每个家庭都是非标准化的:房型不同,摄像头角度不同,家庭成员不同,生活习惯也不同。同样是「一个人坐在沙发上不动」,在年轻人家里可能只是刷剧,在老人家里就可能需要多关注一眼。
因此,家庭智能体不能只靠出厂时的模型能力,必须在真实使用中慢慢理解这个家庭:谁是老人,谁是孩子,哪些行为是正常习惯,哪些状态需要提醒。
王晓晖博士提到,小湃科技做了针对家庭场景的模型训练和二次优化。很多训练数据没有现成来源,需要团队自己采集、扩充、制作,再通过高校学生合作进行标注和训练。即使模型在实验室里的识别精度已经不错,放到不同家庭后,依旧需要继续适配。
这就是 ClawStation Pro 视觉感知模式的另一层价值:和其他传感器方案相比,视觉识别天然适合「无感学习」。用户不需要每天手动配置复杂规则,系统也能在长期观察和反馈中,逐渐提炼出更适合这个家庭的判断标准。
与传统传感器并非替代关系
不过,在王晓晖博士看来,将视觉融入全屋智能,并不意味着摄像头要替代所有传统传感器。
红外、门磁、温湿度传感器、毫米波雷达仍然有自己的价值——它们成本低、部署方便、隐私压力小,也适合很多明确、单一的判断场景。比如判断门窗是否打开、室温是否过高、某个区域是否有人经过,这些任务并不一定需要视觉参与。在传统传感器难以覆盖的复杂场景里,提供更高维度的感知能力,才是 ClawStation Pro 真正的价值。
当然,视觉方案最大的挑战,仍然是隐私。
王晓晖博士在采访中也承认,家庭场景里的安全性和隐私保护必须谨慎处理。小湃科技的技术路线,是尽量把敏感数据留在本地。ClawStation Pro 采用本地模型架构,视觉识别和场景分析主要由设备中的模型完成,视频数据不需要上传云端处理。

图片来源:雷科技
即使遇到一些复杂场景,需要调用云端算力进行增强判断,ClawStation Pro 也会提交经处理、脱敏后的信息,而不是直接上传完整视频流。对于重大异常事件,小湃还会通过云端进行二次确认,以减少误判。
在王晓晖博士看来,我们必须在「隐私保护和便利之间取得一个平衡」。对小湃科技来说,ClawStation Pro 本地视觉感知、本地决策的设计,正是现阶段的最优解。
家庭智能体拐点何时到来?
谈到家庭智能体行业什么时候会真正规模化,王晓晖博士给出了一个比较明确的判断——三年内。
首先,AI Agent 正在快速拓宽 AI 的应用场景。王晓晖博士认为,过去很多人面对大模型时,其实并不知道它能在家庭场景里做什么,更多只是聊天、问答和内容生成。但智能体的出现,让 AI 有机会真正进入具体任务和具体设备中。
用王晓晖博士的话来说:
「智能体真的是把 AI 应用的场景大大拓宽了。」
其次,AI 计算正在从云端向设备端、边缘侧转移。过去大家习惯用更大的模型、更强的云端算力解决问题,但现在模型正在变小,效果却在提升。王晓晖博士举例称,小湃科技内部测试过阿里千问的多模态模型,过去 2.5 版本 7B 的效果,现在 3.5 版本 2B 已经可以做得更好,消耗也更低。

图片来源:雷科技
这意味着,家庭智能体不一定永远依赖昂贵的云端调用;本地模型、本地算力和边缘设备,也能承担复杂的 AI 任务。
对硬件公司来说,这也是一个新的窗口期。王晓晖博士在采访中说得很直接:「我们做硬件的公司机会来了。」在他看来,智能体研究得再好,如果没有硬件承载,终究还是「空中楼阁」。

图片来源:雷科技
当然,行业拐点能否到来,最终还是取决于两个因素:体验和成本。体验上,家庭智能体必须真正解决用户痛点,而不是制造更多误报和配置负担;成本上,算力卡、存储、本地模型适配和云端 Token 消耗,都需要继续下降,才能让更多用户用得起、用得上。
让全屋智能真正拥有智慧
从这次发布会和群访来看,ClawStation Pro 确实是一个极具创意的设备概念。过去的全屋智能,更多是在解决「设备如何被控制」的问题:用户发出指令,系统转发指令,设备执行指令。它只不过是给家里的 IoT 设备配备了一个「语音遥控器」,而非真正为 IoT 设备「增智慧」。
ClawStation Pro 想做的,是把「视觉感知、本地决策、设备执行」串成一个闭环。摄像头负责看见家庭空间,本地模型负责理解场景,Skill 负责调用不同品牌的智能硬件。这样一来,智能家居不再只是被动响应用户命令,还可以根据真实家庭场景主动工作。
当然,这条路线并不轻松。视觉感知要面对隐私焦虑,本地 AI 要面对算力和成本限制,家庭场景的非标准化也考验着模型识别和决策能力。ClawStation Pro 目前的实际体验、长期稳定性和生态兼容性,也还需要更多真实家庭场景中验证。

图片来源:雷科技
但至少在 2026 年这个时间点,小湃给出了一个值得行业认真讨论的方向:全屋智能的下一步,不一定是接入更多设备,也不一定是做更复杂的自动化规则,而是让系统先真正看懂家里发生了什么。
当智能家居从「会听话」走向「能看懂」,家庭智能体才算真正迈出了第一步。

雷科技





































