
这周,微软拿出了一台很不像 Surface 的 Surface Laptop Ultra,是微软迄今最强的 Surface Laptop,也是首款搭载英伟达 RTX Spark 的 Windows 笔记本电脑。
但未必是一台 Agent 时代的好电脑。
按照微软的定位,Surface Laptop Ultra 面向创作者、开发者和 AI builders,是为了大型 3D 场景、长时间编译、本地模型和数据集。英伟达则把 RTX Spark 定义为面向个人 AI Agent 的 Windows PC 超级芯片:
6144 个 CUDA 核心、第五代 Tensor Core、FP4 精度,通过 NVLink-C2C 连接一颗 20 核 NVIDIA Grace CPU,最高支持 128GB 统一内存。
作为结果,RTX Spark 可以在本地运行 1200 亿参数大模型和最高 100 万 token 上下文,渲染 90GB 以上 3D 场景,剪辑 12K 4:2:2 视频,生成 4K AI 视频,也能在 1440p 下以超过 100 帧运行 3A 游戏。

图片来源:英伟达
强得有点不像传统笔记本。
RTX Spark 的强,主要还是 GPU 的强,是 CUDA、Blackwell GPU、统一内存和本地模型推理能力的强。如果 AI PC 的问题还是能不能在本地跑一个更大的模型,RTX Spark 的确很有说服力。但雷科技认为,如果问题已经变成 Agent 能不能长期替用户执行任务,答案就没那么简单了。
Agent 意味着拆任务、调应用、查文件、跑代码、开网页、维护沙盒、处理权限、等待外部响应,还要在不同任务之间切换上下文。这些负载需要云端的强大模型能力,也更依赖端侧 CPU、I/O、系统调度、安全隔离、应用接口和云端状态。
相反,端侧模型的性能远远不够支持 Agent 的模型能力需求,即便是 RTX Spark 这种「怪兽」,也更像是把一台小型 AI 工作站压进笔记本形态,而不是为 Agent 时代重新设计的一台个人电脑:
或者说,它在用 2023 年的本地大模型想象,回答 2026 年的 Agent 问题。
从 NPU 到 CPU,英伟达强化PC存在
英伟达并不是突然对 PC 处理器产生了兴趣。
从短期生意看,这家公司甚至没有太多必要亲自下场做一颗 PC SoC。它在 PC 市场本来已经足够舒服:独立显卡长期占据绝对优势,游戏、创作、专业图形和 CUDA 生态都握在自己手里;数据中心 GPU 更是供不应求,排队买卡的客户比英伟达更着急。
但 AI PC 改变了 PC 的负载结构,也改变了英伟达在 PC 里的位置。(注:AI PC 主要指笔记本电脑,不包括 DIY 电脑主机。)
过去 PC 的核心负载主要围绕 CPU 和图形性能展开。英伟达只需要把 GPU 做得越来越强,再通过 PCIe 接进 PC,就能稳稳站在性能链条上游。
可进入 AI PC 时代后,越来越多负载开始围绕本地推理、多模态理解、语音视频处理、语义搜索、本地知识库和系统级 AI 功能展开,NPU 比 GPU 更贴近日常 PC 形态。
NPU 的低功耗、常驻、安静、长续航、系统级调用,正是 AI PC 早期最需要的体验。而传统独显的数据要在系统内存和显存之间来回搬运,功耗一上来风扇起飞,续航也很难看。
对于笔记本这种天然受限于电池、散热和体积的瘦终端来说,NPU 的逻辑很有吸引力。
2024 年,微软用 AI+ PC(最早是 Copilot+ AI)划了一条线:NPU 算力至少 40TOPS,才能跑新一代 Windows AI 功能。高通、AMD、英特尔轮番上场,PC 厂商也终于有了一个比 CPU 多核性能、屏幕素质和续航时间更新鲜的卖点。

图片来源:微软
但如果未来的 PC AI 负载都被 NPU 接管,英伟达在 PC 里的角色就可能从平台定义者退回到高端图形配件。
所以英伟达要做 RTX Spark,把 CUDA、RTX、TensorRT、OptiX、DLSS、FP4、Blackwell GPU 和统一内存一起带进 Windows 笔记本,让 PC 不只是运行 AI 功能点,还有本地 AI 工作流,避免 AI PC 时代绕开 GPU 和 CUDA。
在微软 Build 的连线中,黄仁勋提到,三年前他就与微软 CEO 萨蒂亚·纳德拉讨论了一种新的个人电脑:既适合设计师和创作者,也适合人工智能;既有本地处理能力,也能和 Windows、创作软件以及 AI 软件栈深度整合。

图片来源:X
RTX Spark 和 Surface Laptop Ultra 就是那次对话的结果。它确实回答了一个问题:如果 Windows 阵营想造一台真正能跑本地大模型、本地创作、本地 AI 开发的高端笔记本,硬件应该有多激进。
但三年时间,AI 已经变了太多。
三年前,整个行业还处在 ChatGPT 刚刚爆发后的本地推理想象里,很多人相信,AI PC 的关键是把模型跑到本地。这样一来,用户不用把隐私数据丢进云端,不用为每次调用付 token 账单,也能获得更低延迟、更稳定的 AI 体验。
这个逻辑没有错,今天也依然成立一部分。但 2026 年的 AI 已经不只是聊天机器人。从推理到 Agent,上下文、推理链、KV cache……几乎所有要求都在提高,本地设备和云端模型之间的能力差距在很多任务上也被进一步拉大。

图片来源:X
事实上,今天几乎所有针对 Agent 进行训练过的大模型,对硬件的要求都大幅超过了以往,量化压缩的模型并不能满足 Agent 的良好运行,以及用户对于 Agent 表现的要求。
简言之,至少目前来看,端侧根本无法支撑好的本地 Agent 体验,基于云端必然。所以对个人 PC 来说,CPU 反而更重要。
「过时」 arm CPU,能适应 Agent 时代吗?
到了 Agent 时代,用户不只是要一个答案,而是希望 AI 完成任务。
但完成任务和本地生成文本不是一回事。一个 Agent 要执行任务,往往需要访问网页、调用软件、运行代码、读取文件、处理权限、验证结果,还要在后台持续运行。它像一个操作员,而不是一个离线模型。越是复杂的工作流,越需要 CPU、I/O、系统调度、浏览器环境、沙盒和云端服务协同。
与此相对的,RTX Spark 的重点几乎都在 GPU 和 AI 侧:1 petaflop AI 性能、6144 个 CUDA 核心、Blackwell RTX GPU、128GB 统一内存、本地 120B 模型、百万 token 上下文。
CPU 上,英伟达选择了联发科,采用了 10 核 Cortex-X925、10 核 Cortex-A725。这两个核心已经是 Arm 两年前发布的 IP,被广泛用于过去两年的旗舰、次旗舰手机 SoC 上,包括天玑 9400、天玑 8400、玄戒 O1、Exynos 2500 等。
而去年的天玑 9500,已经用上了 Arm 最新的旗舰架构 C1-Ultra,同时采用下一代 C2 核心的 SoC 也预计将在未来几个月推出。

图片来源:Arm
当然,RTX Spark 的 CPU 核心数量要多得多,但从规划到预期,CPU 恐怕都不是英伟达打造这款消费级 PC SoC 的核心。
这也不奇怪,英伟达最强的护城河本来就是 GPU 和 CUDA。可智能体时代会重新抬高 CPU 的地位。英伟达面向数据中心发布的 Vera CPU,本质上也承认了当 AI 从聊天机器人走向智能体,代码执行、数据处理、沙盒环境、任务编排都会变成关键路径,CPU 不再只是给 GPU 打杂。
但 RTX Spark 把太多预算、功耗、芯片面积和系统想象都压在了 GPU 和本地推理上,却没有真正回答智能体最关键的执行、调度、长期状态和跨设备协同问题。
而与 Surface Laptop Ultra 同场发布的 Project Solara,则是微软想出的另一个答案。
按照微软 Applied Sciences Group 负责人 Steve Bathiche 的说法,Project Solara 是一个「芯片到云」平台,为 agent-first experiences 和新的设备形态而设计。它不是把智能带进 PC、浏览器或手机,而是让智能进入工作流、环境和任务现场,设备不再围绕 App 设计,而是围绕 Agent 设计。
对了,Project Solara 用的还是 Android,而非 Windows。
更重要的是,Project Solara 的状态不是只放在某一台设备里,而是经由 Azure 覆盖一组专用设备。微软展示了便携形态以及桌面形态,并且明确高通和联发科会是第一批芯片合作伙伴。

Project Solara,目前还有两款设备,图片来源:微软
这条路线看起来没 Surface Laptop Ultra 那么震撼,甚至还很早,但它更接近 Agent 的真实需求。Agent 的价值不在于每个入口都拥有一整座本地 AI 工厂,而在于能不能在正确的时间、正确的地点、正确的设备上出现,并且把任务交给云端状态和后台智能继续推进。
换言之,Surface Laptop Ultra 是把 PC 做「大」,Project Solara 是把设备做「瘦」。Agent 时代更需要的,可能恰恰是后者。
写在最后
本地算力不是不重要。
隐私数据、本地文件、低延迟交互、离线场景、创作素材和开发环境,都需要足够强的端侧能力。Surface Laptop Ultra 对专业用户,对于需要本地模型、本地渲染、本地视频生成、本地 CUDA 工作流的人来说,它可能会是一台很好的机器。
但 Agent 时代的个人电脑应该长什么样,Surface Laptop Ultra 可能不是最好的答案。
Agent 天然更适合云端作为中心,再由多个轻设备作为入口。手机、PC、工牌、桌面屏、耳机、眼镜都可以成为 Agent 的触点,但它们不必都变成一台小型 AI 工作站。
从这个角度看,Surface Laptop Ultra 和 RTX Spark 这类 AI PC,确实像是用 2023 年的本地推理想象,回答 2026 年的 Agent 问题。它们很强,也重要,但不是下一代 Agent 设备的起点。


雷科技




































