通用大模型垂直化,垂直大模型加速迭代。

11 月 29 日,讯飞医疗中标合肥国家人工智能应用中试基地(医疗领域基层卫生服务方向)项目软件服务,订单金额达到 4.3 亿元


据悉,该项目涉及 6 个大模型采购,其中 1 个为通用大模型,5 个为定制开发的医疗领域大模型。具体而言,分别为通用认知大模型(成品软件),医疗认知大模型(定制开发)、医疗语音大模型(定制开发)、医学影像大模型(定制开发)、医疗图文识别大模型(定制开发)、医疗多模态大模型(定制开发),招标限价分别为 1600 万元、2155.5 万元、480 万元、5622 万元、768 万元、2377.5 万元。


按照招标公告说法,该项目除了采购通用大模型底座,以及医疗认知、语音、影像、图文识别、多模态等 5 个国产化自主可控的千亿级参数医学垂类大模型;还将建设医疗高质量数据资源平台,采集汇聚治理不少于 5PB 医疗健康行为数据,建设 34 个面向医学大模型增强的高质量医学知识库、42 个面向医学大模型构建的高质量医学多模态数据集和 11 个面向基层医疗疾病研究转化数据集的医疗数据资源中心。医学大模型,搭档数据资源平台,可全面加快 AI+ 医疗领域服务应用落地。


此前的 9 月 29 日,科大讯飞中标金华「婺城数智未来」新型基础设施建设项目,订单金额达到 3.8 亿元。该项目更是涵盖十大行业 AI 落地场景,包括 AI+ 教育、AI+ 公安、AI+ 人社、AI+ 招商、AI+ 产业、AI+ 医疗、AI+ 水务、AI+ 管理、AI+ 办公、AI+ 法院


对报价文件进行细化统计,该项目的软件部分金额(占比 41%)超过硬件部分(占比 38%),而这也被一些媒体视作「AI 大模型开始『卖钱』的一个重要信号」。


垂直大模型应用越来越「金贵」。无独有偶,在科大讯飞拿下最新大单的前一天,华为与深交所联合发布基于华为盘古 Reasoner 38B 的证券行业法规大模型


融合深交所行业法规知识体系(10 万多条法规条文标签数据),结合华为自研精调技术与场景化训练能力,大模型可实现 90%+ 问答准确率,并具备可扩展和实时性等特点。


拿下亿元大单,垂直大模型率先吃鸡


相比垂直大模型,公众无疑对经常在使用的豆包、千问、元宝、DeepSeek 等通用大模型更为熟知。然而,现阶段却是垂直大模型比通用大模型更容易赚钱。


核心原因在于,垂直大模型目标明确,就是用来提升各行各业处理具体实际问题的工作效率,可以让行业用户用来解决老大难的「降本增效」问题,这条商业路径不仅清晰、直接,而且可以更快、更易变现,可以看成是一类「专业技能人才」


通用大模型则是志向高远,着力构建一个无所不知、无所不能的「类人」交流角色,积极拥抱普罗大众的同时,却不能赤裸裸地把赚钱当己任,可以看成是一类「广博知识人才」


截屏2025-12-03 07.35.44.png

(图源:讯飞医疗)


而从内容输出角度来看,垂直大模型更擅长解决实际问题、处理具体事务,担当人类的助手;通用大模型更擅长启人思考、发散创意,担当人类的伙伴。


助手是用来赚钱的,伙伴是用来陪伴的。从定位到功用,垂直大模型都比通用大模型更易赚钱。


不过,没有通用大模型提供的底座或者说母体,垂直大模型也就成了「无源之水,无本之木」。故而可以看到,合肥刚刚完成招标的医疗项目,正是 1 个通用认知大模型 + 5 个医疗应用大模型(不同侧重)的组合。


深耕垂直大模型,许多企业正在默默数钱


不只科大讯飞以及华为、阿里、字节跳动、腾讯、百度等科技巨头企业,国内垂直大模型市场早已涌进了更多派系玩家,包括垂直行业领域内的大企业,以及不少大模型新创企业,而且也都在默默赚钱。行业大类上,金融、医疗、教育、政务等企业领域或公共领域客户,成为垂直大模型市场首批「大金主」。


金融领域,由于涉及细分应用场景较多,而且能较快变现,不仅科技巨头(例如蚂蚁集团、百度等)在积极参与金融类大模型产品的研发和推广,不少证券、银行、保险企业也在借「科技金融」之名参与其中。


金融大模型细分应用场景中,智能投研与投顾、智能风控与合规、 智能营销与客服、智能交易与运营等,成为热点领域。值得一提的是,DeepSeek 母公司幻方量化,就是一家‌专注于量化投资与 AI 技术研发的私募机构。而在 A 股,现在的量化交易金额,已经来到相当体量的规模占比


截屏2025-12-03 08.37.26.png

幻方 AI 深度学习训练平台「萤火二号」(来源:幻方量化)


对当下的大模型创业企业来说,垂直大模型也是比通用大模型更好的「赚钱养家」之道,毕竟先要活下去,才能有诗与远方。


「AI 大模型六小虎」企业中的智谱 AI、零一万物和阶跃星辰,今年以来也都在聚焦垂直大模型领域,或靠 B 端应用市场来加速商业变现。


其中,智谱 AI 除了在 C 端应用市场持续刷存在感,也在发力大模型在金融、医疗、教育、政务等多个 B 端垂直行业的落地,号称有数万合作伙伴企业。值得一提的是,今年以来,这家北京 AI 独角兽企业,还先后拿下了杭州、珠海、成都、北京、上海等全国多地国资或产业基金的战略投资,或已拿下 AI 创业团队中的政务服务大模型代表之位


李开复创立的零一万物,今年宣布不再涉足万亿参数以上的超大基础模型,而是着力打通基座模型到垂直场景的「最后一公里」,并带来了万智企业大模型一站式平台。


阶跃星辰,是「AI 大模型六小虎」中目前估值规模相对靠后的一家。今年,阶跃星辰开始裁撤 C 端产品线,聚焦 AI 智能体和大模型研发。有媒体解读为,这是阶跃星辰的公司发展重心,从覆盖 C 端产品应用,收缩至面向开发者群体和 B 端行业市场。


通用大模型垂直化,垂直大模型加速迭代


今年以来,伴随攻势愈加猛烈的通用大模型产品,以及持续刷屏面向 C 端用户市场的 AI 智能体技术应用(注:B 端大模型市场也有大量智能体技术应用产品),垂直大模型企业和行业的焦虑感,同样在与日俱增。不少人开始悲观认为,垂直大模型将在不远的将来被通用大模型彻底取代。


这样的看法并非毫无道理,但在实现进程表上可能并没有那么快。正如科大讯飞刚刚中标的合肥医疗大单项目(1 个通用认知大模型 + 5 个医疗应用大模型)所展现的那样:


在行业或企业级 AI 平台应用中,通用大模型可以负责理解、认知和规划、交互,垂直大模型可以负责执行专类的子任务,从而可以形成「一个通用大脑指挥多个专业小脑」的协作体系网络。


故而,在可预见未来,不管是通用大模型,还是垂直大模型,都将有广泛的用武之地。行业和企业级 AI 应用市场,除了针对各行各业高度适配的垂直大模型,也需要通用大模型的底座和公共属性能力。


与此同时,聚焦垂直大模型领域的玩家,尤其新创企业,同样在加速垂直大模型的技术和应用迭代进程。


医疗大模型领域,除了有科大讯飞这类押注其中的大企业(甚至专门成立旗下子公司讯飞医疗),亦有不少新创企业的身影。作为较早涉足垂直大模型领域发展的新创企业,同样也是「AI 大模型六小虎」之一,王小川于 2023 年创立的百川智能,经过前两年的探索,和最近一年的调整,于今年进一步确立了专注医疗领域 AI 大模型及其应用的公司发展战略。


今年 8 月,百川智能带来全新的医疗大模型 Baichuan-M2,参数量只有 32B,但在各项基准测试中都超越了比自己规模大数倍的开源/闭源模型。为真实世界的医疗推理任务设计,Baichuan-M2 支持 RTX4090 单卡部署——即便是中小型医疗机构,也有条件进行私有部署


312453.jpg

今年 8 月的医疗健康领域大模型评估测试集排名(来源:OpenAI)


王小川表示,这款大模型的性能超过了 OpenAI 此前刚发布的两个开源模型;而在闭源领域,它的能力也仅次于 GPT-5。王小川对他的新目标毫不掩饰:在医疗这个垂直领域,实现对通用模型的超越


再接再厉,今年 10 月,百川发布 Baichuan-M2 Plus,通过首创的「六源循证推理」范式,着力提升医疗大模型的回答专业度和可信度


具体而言,在知识收集阶段,Baichuan-M2 Plus 会主动屏蔽互联网的非专业信息来源,只使用权威来源的医学证据,确保回答建立在「高等级证据」之上;同时,将医学证据分为六个层级,分别为「原始研究层」「证据综述层」「指南规范层」「实践知识层」「公共教育层」「监管反馈层」,并按适用性动态调用。



截屏2025-12-03 10.03.24.png

「六源循证推理」范式(来源:百川智能)


官方提供的评测结果显示,基于这套「循证推理」范式,Baichuan-M2 Plus 的医疗回答幻觉率大幅下降,「可信度在多场景评测中达到比肩资深临床专家的水平,同时其医学知识运用能力也领先于人类顶尖医生」。


试想,如果将诸如此类的逻辑严密「循证推理」范式应用到更多「严肃内容产出」行业领域,例如教育等类别,是否可以带来更多行业领域堪比「业务专家」水平的垂直大模型产品呢?


垂直大模型领域玩家在持续发力技术迭代,通用大模型领域玩家也在更深涉足垂直大模型技术及应用。在深度求索刚刚发布的 DeepSeek V3.2 中,除了面向公众群体的常规 V3.2 版本,还提供了一个 V3.2-Speciale 版本(仅支持 API 服务访问)。


据悉,DeepSeek-V3.2-Speciale 集成了长思考与 DeepSeek-Math-V2 的定理证明能力,专注于探索模型推理边界,并具有更强的指令跟随、数学证明和逻辑验证能力,其在 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 等顶级国际竞赛中均斩获金牌,ICPC 成绩相当于「人类选手中的第二名」。


312456532.jpeg

(图源:深度求索)


某种程度上来说,DeepSeek-V3.2-Speciale 何尝不是深度求索推出的面向推理计算和定理证明领域的一项「垂直大模型」产品技术呢?


垂直大模型也将在自身技术加快迭代,和通用大模型玩家的更深介入下,迎来全新的技术和产品应用发展阶段。


CES2026开幕在即!(1月6日-1月9日)


作为中国报道科技展会最悠久、最深入、最专业的新媒体,雷科技CES2026报道团正在进行紧张的前期筹备。届时雷科技将派出史上最大规模的CES报道团,并由雷科技创始人兼总编辑罗超带队,对CES2026进行一线、专业和立体报道,敬请期待!

2e0ab9d7dac54aba821c10c20be6db29.jpg