手握30亿、被蚂蚁狂挖人,转型被骂惨的王小川,真的翻身了?

发布时间:2026-01-15 09:00:26 天津市天津宏远家政有限公司

作者  | 褚杏娟

在“大模型六小虎”成为历史后,王小川终于等来了自己的风口。

近日,国内外大厂在医疗领域动作频繁。1 月 8 日,OpenAI 高调入局,除了推出 ChatGPT Health,还收购了医疗保健初创公司 Torch。几乎同期,Anthropic、英伟达、苹果等都有产品和合作发布。国内,蚂蚁阿福自发布后短期内月活用户突破 3000 万,单日提问量超千万。资本市场上,AI 医疗板块逆势走强,成为最近市场热点。

在此前大模型竞争激烈的当口,AI 医疗并不是一个很性感的话题。那种不信任来自百川内外。

2023 年成立的百川在一年后战略收缩,决定聚焦医疗,成为国内较早专注到医疗的大模型创企。但内部“没有足够传达在医疗上的决心和路径要求,没有让每个团队在医疗价值创造中深度思考 why 和 how,进而导致部分团队工作目标出现了摇摆和偏差。”“去年中途转过来时被骂惨了。”

不只内部,业界对 AI 医疗也存有疑虑,连带着对百川的路线选择也有质疑。“2024 年跟医生谈 AI,大家都不信。”王小川直言。

直到 2025 年,大家看到 DeepSeek 真的比百度靠谱很多;年末阿福发布,投了 10 亿来砸广告,看到了技术和应用进展;今年 1 月 8 日,OpenAI Health 正式上线,Anthropic 也发布了自己的两个技术能力:医疗计算和 Agent,两个巨头都开始进入医疗。

“所以,从市场判断来看,医疗作为 AI‘皇冠上的明珠’这样的高级阶段,已经开始进入应用范畴。”王小川说道。

从发布反思信至今 9 个月过去,王小川向 InfoQ 表示,百川如今的护城河主要有三个:一是模型结构的优先级,“医疗安全性”和“诊断准确性”始终是首位;二是切入点选择,百川聚焦严肃、高价的医疗场景,区别于其他企业的健康类打法,这类场景的壁垒更高,且有明确的付费意愿;三是产品形态的差异化,百川身份差异化服务和决策辅助能力,是现有产品不具备的。

王小川尤其提到,大厂和创业公司不一样,他们有职业团队,需要的是更安稳的方案。“大创新靠小厂,小创新靠大厂,必须切入我们认为有高价值的事情,共识不是我们优先的突破点,而大厂更多的是注重共识,路线图和产品形态是不一样的。”

1

 模型要低幻觉、能问诊,多模态非主战场

“去年 8 月发布的 M2 作为百川重新聚焦医疗之后的主力模型,在行业得到很多好评。典型现象就是蚂蚁开始疯狂挖人,从技术人员到财务人员,所以属于小圈子认可技术路线图。”王小川说道。

昨天,百川正式开源了新一代医疗大模型 Baichuan-M3。据百川智能模型技术负责人鞠强介绍,Baichuan 系列采用 SCAN 框架,实现临床医生层级的推理与问诊。其核心在于不仅询问疾病类型,更通过定量问题将模糊主诉转化为可定位、可量化的临床证据;并且突破单一症状的局限,进行跨系统关联推理。

其次,团队高度重视并主动防控大模型在医疗中的“幻觉”,坚持正确知识并进行原子级事实检验:在模型推理过程中进行逐层事实核查,确保结论基于真实输入。

鞠强介绍,在模型训练中,抑制“幻觉”与提升推理能力之间存在明显的“跷跷板效应”,容易陷入两种极端:若过度追求推理表现,其生成内容会更丰富、答对率上升,但幻觉也难以控制;若强力抑制幻觉,模型则会趋向过度保守,回答变得拘谨甚至回避问题,导致实用性下降。这也是团队在 Baichuan-M3 训练中重点攻克的问题。

为破解这一矛盾,研发团队引入了 Fact-aware 强化学习技术。该技术核心在于,在强化训练过程中,既对幻觉进行充分压制,又确保推理能力不受损,反而同步提升。

结果显示,相比前代模型 M2,百川正式开源新一代医疗大模型 Baichuan-M3 的幻觉率大幅下降,同时在医疗专业评测 HealthBench 上的推理能力得分从 34 分显著提升至 44 分,位列榜首。在不依赖工具或检索增强的纯模型设置下,医疗幻觉率 3.5,超越 GPT-5.2。“这验证了我们通过强化学习方法,在抑制幻觉与增强推理之间取得了有效平衡。”鞠强表示。

Hugging Face 地址:https://huggingface.co/baichuan-inc/Baichuan-M3-235B

GitHub 地址:https://github.com/baichuan-inc/Baichuan-M3-235B

另外,模型深度集成的问诊能力,从日常症状中识别风险。团队设计了防御性思维追问,以甄别背后潜在的系统性疾病,还会进行组合症状敏锐识别,比如用户描述“情绪激动时左牙疼”时,模型能会关联“牙痛 + 情绪症状”,优先建议排查心脏系统问题,从而排除重大隐患,而非直接推荐牙医或止痛药。该能力已集成至产品,服务于医生与普通用户。

在 AI 医疗中,除了文字,还有影像等信息。不过,王小川认为,多模态并非当前 AI 主战场。

他解释道,ChatGPT 之所以令人震撼,正是因为它展现出一种“智力”,而智力的本质,是将具体事物进行抽象的能力,其核心在于符号系统。在这一逻辑下,智能主要依托于三种形式语言:自然语言、数学语言与代码语言。至今,评估一个模型能力的强弱,本质上仍是检验其符号处理与逻辑推理的水平,功能可用并不等同于智力高超。在医疗领域,这一观点尤为关键。医疗的核心是决策,而不仅仅是感知。

实际上,未来医学影像的初步解读可由专用小模型完成,许多厂商也已具备相应的图像引擎。但真正的价值在于:将影像符号化之后,如何用语言模型进行综合推理与判断。因此,感知模型与认知模型必须结合。

他认为,当前的一些工作,比如将 CT 影像转化为报告,或是专注于胰腺癌筛查的视觉模型,固然有其价值,但它们更像是“挂在智力之树上的叶子”,是整体流程中的一环,而非驱动智能演进的主战场。真正的突破,仍在于如何通过符号与语言,构建能够进行复杂医疗决策的认知核心。

2

 “在中国 To C 比 To B 更好”

“未来巨大的增量是在院外,不在院内。”王小川说道。其核心是直接服务患者,而不是通过服务医生间接服务患者。

反观 OpenAI 的入局是靠打造“个人超级助手”,Anthropic 则从合规性与临床效率上做 B 端突围。对此,王小川的评价是:“美国是 To C 和 To B 都可以干,但在中国 To C 比 To B 更好。”

王小川认为,国内的医疗现状是医生供给不足,互联网虽能连接信息却无法创造供给;医患权力不均,双方容易沟通不畅、患者无助;患者更倾向三甲医院,致使基层医疗薄弱;医疗知识分散于各科室,复杂病症往往缺乏整体视角。

基于此,他的设想是 AI 可以“造出高质量医生”,但不是要 AI 取代医生。“在某些维度上,AI 超过医生是必然的,比如信息收集的完整性、医学知识的储备量、循证的精准度等。但 AI 不会取代医生的核心执行能力,比如手术、查体等。”

在不取代医生的情况下,AI 可以推动“权力让渡”,即帮助患者理解病情与方案,获得更多参与权和知情权。另外,居家通过 AI 进行初步咨询,让“居家首诊”可能,减轻医疗系统负担。此外,复杂问题需要跨科室会诊,以前就是入院即入组,即进入某个科研队列,有了 AI 后能够做到“看病即入组”,更有机会做好生命模型。

在实现的产品形态上,百川目前主打还是百小应 App,不过用户进入后可以选择医生和患者两种身份,给出的结果是不一样的:医生版更像 OpenEvidence,答案更加专业、更加强调循证,引用的文章在系统中 100% 存在,让其能够做决策、信息够充分;患者版本则强调补充信息,进入启发式端到端的问诊,也给到患者决策能力。

“我们与 OpenEvidence 的区别在于,OpenEvidence 只是服务于医生,百川是可复数、可懂、可决策、可行动、能够服务到患者的,这样的产品定位在全球是独一无二的。”王小川补充道。

在其看来,做 To C 产品,重点是让产品价值触达真正的目标人群,即有严肃医疗需求、愿意为决策辅助付费的患者。他举例称,达摩院做的胰腺癌平扫 CT 模型,虽然技术门槛高,但解决了核心临床痛点,就有明确的付费方;而泛健康类服务看似覆盖广,但价值不突出,反而难以找到稳定的付费用户。百川目前的做法就是基本全覆盖,重点放在儿科、慢病和肿瘤,优先突破有明确痛点的领域。

收费模式上,王小川认为,不是只赚医院或医生的钱,还可以向患者收费,也可以形成服务包,后面的医疗资源和药械以服务包形式收费。

“我倒不担心商业模式本身,确实要过了这个门槛、为用户创造价值,之后不管直接收费还是生态收费都是很容易的事情。”王小川说道。目前,百川账上还有 30 亿人民币,这也留给了王小川证明的时间。

据王小川透露,今年上半年,百川会完成两款产品的发布和推广,核心是回归决策层面,帮助用户(包括患者和医生)做出更好的医疗决策,最终实现“医生时刻陪伴式”的健康管理。“我们第二个产品已经可以当成院外医生来看了。”此外,百川也有计划硬件产品发布和出海计划,具体日程未定。

为了培养用户心智,百川未来也会增加一定的广告宣传投入,另外会重视医生对产品的认可度。“阿福跟我们的路线不一样,老医生都是无感的。我们希望医生和患者一体两面,共享一款产品,要让专家点头,而不只是患者鼓掌。产品做好以后确实能够取得一定的口碑效应。”王小川说道。

“今年上市的两家主要还是踩在通用模型技术红利和政策支持的基础上,但目前他们的市值和商业化能力并不匹配,但 AI 医疗今天也是大模型竞争中的一个范式,虽然它的成熟会晚一点,在后面我们肯定也是奔着上市去的。”王小川给了自己两年的时间再看看。

声明:本文为 InfoQ 原创,不代表平台观点,未经许可禁止转载。