过去两年,AI行业最热闹的地方一直在云端。
从大模型参数规模,到GPU算力集群,再到模型训练成本,几乎每一次AI产业的重大革新,最终都会变成两个讨论:“谁拥有更多算力”和“谁能训练出更强模型”。但是,随着算力与参数规模逐渐达到瓶颈,大家也将视线转向应用端,去找出AI的真正用法,也就是“智能体”。
在COMPUTEX 2026开幕演讲上,高通公司总裁兼CEO安蒙给出了一个很明确的判断:2026年,是“智能体之年”。

这不是一句简单的口号。过去我们熟悉的AI,更多是一个“回答问题的工具”,用户输入提示词,模型生成答案,交互的主动权仍然在人手里。但智能体AI不一样,它不只是理解问题,而是要理解用户意图,持续读取上下文,拆解任务,调用工具,并在多个系统和设备之间协调执行。
换句话说,AI正在从“帮你回答”,走向“帮你完成”。在过去几个月里,OpenClaw、Hermes等智能体可以说刷新了很多人对AI能力的认知,但同时也让我们意识到,想让智能体真正进入我们的生活,还有更多的问题要解决。
这也是为什么高通会在COMPUTEX上反复强调“计算连续体”。当AI进入智能体阶段,问题已经不只是模型够不够强,而是这些智能体到底运行在哪里、如何降低成本、如何保证时延、如何保护隐私,以及如何让用户随时随地都能用上。

如果所有智能体工作负载都堆到云端,Token成本、网络延迟、能源消耗和隐私风险都会成为规模化落地的瓶颈。高通想讲的故事,正是把智能体AI从数据中心带到手机、PC、汽车、机器人、工业设备乃至未来网络中,让AI不再只是一朵“云”,而是分布在每一个计算节点上的新型基础能力。
为什么智能体时代需要“计算连续体”?
要回答这个问题,首先要理解智能体AI和传统AI的差别。
在雷科技看来,传统AI更像是一个能力很强的问答系统,它可以完成文案、总结和翻译等基础性的任务,但大多数时候,它需要你不停输入指令,告诉它“下一步该做什么”。
而智能体AI则完全不同,你只需要给它一个目标,它就会围绕目标持续运转,直到达成目的为止。在这个过程中,它会给自己下任务、执行、复盘,像“人类”一样工作。
比如用户说“帮我准备今天的工作简报”,智能体并不会简单生成一段文字,而是先拆解完成目标的前提,然后去读取邮件、日历、本地文档和会议记录,再判断今天最重要的事项,整理待办清单,最后再调用Word等工具来输出最终文档。
这个过程里,有些工作确实需要云端大模型参与,但并非所有环节都值得送到云端。比如文件索引、局部摘要、个人数据读取和任务编排等环节,完全可以在本地或边缘设备完成。而且,把这些轻量任务全部塞进云端,不仅性价比低,也会带来不必要的延迟和隐私风险。

即使你不在乎隐私问题,将所有计算都交给云端也会带来额外的Token消耗,让使用成本激增,钱总不能不在乎了吧?
在安蒙的演讲中其实就提到,对话式AI、推理AI和智能体AI的Token需求并不是线性增长,而是随着任务复杂度的提升呈指数级增长。
比如一个简单问答可能只消耗有限Token,但一旦进入多轮推理、多工具调用、多智能体协作和持续上下文状态,Token消耗就会快速放大。因为智能体不是以人类的思考链路去操作软件,而是以机器的方式去调用服务、处理数据、生成中间结果。
这意味着,AI产业不能继续把“堆更多云端算力”当成唯一方向,因为随着任务的复杂化以及智能体使用的常态化,算力消耗也会达到恐怖的数字,而不管是算力还是能源,都是不可能无限增长的。
所以,未来真正重要的,不只是拥有多少算力,而是如何更聪明地使用算力,而高通提出的“计算连续体”,就是为了解决这个问题。
按照高通的设想,智能体工作负载不应该固定在某一个位置,而应该根据成本、性能、时延、功耗和隐私需求,在终端设备、边缘侧、本地服务器和云端之间动态分配。简单的、本地化的、强隐私的任务可以放在设备端;高上下文、高复杂度、需要大模型能力的任务则可以交给云端;中间还有边缘设备和本地AI工作站承担过渡角色。
这不是简单的“端侧AI取代云端AI”或“云端AI压倒端侧AI”之类的转变,而是把整个计算架构进行重新分工。
当然,对于高通来说,这也是回到了他们的熟悉领域。因为在过去几十年里,高通一直在移动计算领域探索一个问题:如何在有限功耗和有限体积里提供足够强的计算能力。手机、耳机、可穿戴设备、汽车、机器人和PC,虽然这些设备的形态不同,但它们都有一个共同的需求:在能效、连接和性能之间取得平衡。

而到了智能体时代,高通在芯片能效上的优势将不再止于手机,而是会扩展到整个AI计算体系。简单来说,高通希望把从毫瓦级可穿戴设备,到千瓦级数据中心推理系统的能力串联起来,让智能体在最合适的位置运行。
从手机到PC,个人设备正在变成智能体入口
对普通用户来说,智能体AI最先改变的,应该会是你每天都在使用的设备——手机。
过去十多年里,智能手机一直是数字生活的中心,我们通过手机使用App、上网、记录生活,而智能手表、无线耳机等可穿戴设备则成为手机体验的延伸。再算上智能家电等IoT设备,你会发现大多数智能终端都是围绕手机搭建的。
但在安蒙看来,智能体时代会让这个中心发生变化:未来数字生态的中心不再只是手机,也不再只是操作系统和应用,而是智能体本身,设备则会变成智能体的端点。
这句话看似抽象,其实很容易理解。今天我们在手机、PC、手表和耳机之间切换,很多体验仍然是割裂的。先不说手机和手表的智能完全依赖于手机,PC和手机之间都依然无法做到自然的任务流转。
但是,如果智能体AI真正成熟,它将具备跟随用户在不同设备之间移动的能力。比如你在手机上提出需求,手机认为自己处理不了,那么就可以交给PC继续处理;当你戴上智能眼镜时,智能体又能通过摄像头和麦克风获得新的感知输入,然后结合之前在手机、PC上的任务,进一步为你提供服务。

看到这里,有人会觉得:这是要取代手机和PC的意思?然而并不是。这只是意味着,手机和PC不再只是运行应用的机器,而是用户接入智能体的第一入口。
高通在演讲中强调,今天的设备大多是为“人类主动操作”设计的。用户点开App,输入内容,等待反馈,这也是过去移动互联网的基础交互逻辑。但智能体AI会带来另一种运行模式:即使用户没有持续操作,智能体也会在后台理解上下文、规划步骤、协调任务,并在合适时机给出结果。
当然,这也对硬件提出了更高的要求。
首先,我们需要更强的CPU。很多人谈AI设备时,第一反应是NPU算力,但智能体并不只是跑模型,它还需要任务编排、工具调用、系统协调和工作流规划,而这些环节高度依赖CPU。高通也在演讲中特别提到,规划会成为智能体时代的核心工作,而规划本身是分布式的,这让大多数设备都很难离开高性能CPU。
当然,只有CPU是不够的,高能效NPU和GPU也是必需的,它们将用来运行本地模型和并行推理任务。因为智能体想要做到实时响应,就不能每一个决定都等待云端返回数据后再去执行,尤其是在语音识别、图像理解、文档摘要等功能中,目前的端侧AI模型已经足够处理。
此外,智能体设备也需要具备更丰富的传感器和连接能力,因为想让智能体真正“懂你”,仅靠提示词是不够的,设备需要主动理解用户所处的环境,并结合过往历史记录和个人数据,判断用户的真实需求。

这也是为什么高通会把手机、AI PC和个人AI设备放在同一条主线上讨论。
手机和PC各自掌握着用户在不同场景下的个人数据,只有打通手机和PC之间的隔阂,智能体才能释放出全部实力。同时,个人AI设备也将为计算终端提供更多环境信息,协助终端完成任务推理。
这个智能生态的未来,是让你能够在任意设备上获得完全相同的智能体验。你的智能体不会因为你在手表上发起提问就变成“傻子”,做到真正的“让AI无处不在”。
所以,高通近几年在汽车领域也是动作不断。随着汽车智能化程度加深,AI在汽车上也不只是车机助手而已。安蒙认为,未来汽车将同时拥有面向用户的个性化智能,以及负责感知和驾驶的实体AI,前者理解用户需求,后者理解道路环境,两者共同构成AI定义汽车的新形态。
而机器人则进一步体现了实体AI设备所需要面对的任务复杂性。它不仅需要推理和规划能力,还需要具备实时控制、传感器融合和可靠执行能力,因此机器人实际上是移动计算、边缘AI和智能连接能力的综合体现。

高通近年来也在将自身优势带入机器人领域,通过低功耗计算、异构计算和系统级集成能力,让部分感知、控制和边缘推理任务能够在更靠近数据源的位置完成,从而降低时延和中心计算压力,提升机器人的响应速度与续航表现。
与此同时,高通也在探索将6G纳入这套体系的方法。虽然6G网络还在研发阶段,但是其中的关键技术节点已经确定,那就是未来网络不仅负责连接,还会承担部分计算和感知任务,让设备、边缘和云端形成更紧密的协同关系。
另外,高通也正式推出Qualcomm AI200、AI250等千瓦级的算力服务器,已经在与超大规模云服务商和全球合作伙伴推进真实部署,随着数据中心产品组合拓展,其产品将覆盖从最小型可穿戴设备到高性能推理数据中心的每一个层级。
换言之,高通正在打造一个“从毫瓦级到千瓦级”的全链路算力生态,而这也是高通能够提出“计算连续体”的关键。
高通想做的不是一颗AI芯片,而是一套智能体时代的底层平台
回头看安蒙这场COMPUTEX主旨演讲,高通真正想表达的,其实不是“我们有一颗更强的AI芯片”,而是希望成为智能体时代的底层平台提供者。
从手机、PC到汽车、机器人和数据中心,高通强调的是同一个逻辑:智能体不会只运行在云端,而是会分布在各种终端和边缘节点之中。因此,未来竞争的重点不只是单点算力,而是如何构建覆盖设备、网络、边缘和云端的完整计算体系。
这也是“计算连续体”的核心意义。因为智能体既需要云端大模型能力,也需要端侧实时响应,它同时依赖高性能计算、低延迟连接和高感知能力。而高通则希望利用自身在移动计算和连接领域的积累,把这些能力整合到同一平台之中。
从安蒙提出“2026是智能体之年”其实可以看出,高通认为AI行业的竞争,正在从模型竞争走向智能体竞争。随着智能体逐步成为新的计算入口,终端设备、边缘计算和连接技术的重要性将持续提升。
过去的十几年里,移动互联网让手机成为数字生活中心,而在AI时代,智能体AI正在让计算重新回到每一台设备上,而高通就是希望成为连接这些设备、支撑智能体运行的关键平台。

雷科技





































