界面新闻记者 |
界面新闻编辑 | 文姝琪
“重振旗鼓,跟大家重新建立连接。”百川智能CEO王小川用这样一句话解释为何在这个节点选择再次发声,“之前从通用(模型)转过来的时候被‘骂’惨了。”
当前,“大模型六小虎”的概念已鲜少再被提及。一个与之并行的现实是,这六家公司在过去两年的确走出了分化愈发明显的发展道路,而率先切向医疗垂直应用场景的百川智能,承受了尤其多“掉队”“落后”等类似解读。
王小川并不回避自己面对的现有行业格局。对于智谱AI和Minimax两家大模型公司先后上市,王小川评价称,这是“踩在了通用模型技术红利和国家对科技强国的扶持基础上”,认为二者的市值与商业化能力尚不匹配。
就百川智能自身的融资规划,王小川表示,公司可能在2027年启动IPO,目前账上还有30亿元资金储备。
“现在我们准备好了,可以开始给大家交东西了。”他说。
1月13日,百川智能宣布开源其新一代医疗大模型Baichuan-M3。根据公司披露的评测结果,该模型在OpenAI发布的医疗AI基准测试HealthBench中取得第一;在更侧重复杂临床决策能力的HealthBench Hard子集中同样位居首位。
M3目前已上线“百小应”,提供AI问诊服务。王小川表示,公司会坚持To C(用户)产品路线,在2026年发布全新独立C端产品,主打严肃医疗场景。
不过,在现行法规约束下,百川智能短期不会触碰诊疗结论这条红线,产品不直接出具诊断和处方,而是辅助患者理解方案、做出选择,帮患者建立产品在辅助决策层面的价值。王小川称,产品初期免费开放,后期通过服务包或与药械企业合作实现商业化。
如果要让王小川设定一个产品价值被验证的用户规模,他用直觉拍出的数字是“10万人”。
百川智能同时披露了模型在医疗幻觉控制方面的表现。在不依赖外部检索或工具系统的情况下,M3的医疗幻觉率为3.5,低于当前主流通用模型在同类评测中的公开结果。
百川智能模型技术负责人鞠强在接受界面新闻等媒体采访时表示,其做法是在模型训练阶段将医学事实一致性纳入强化学习的核心目标(事实感知强化学习/Fact-AwareRL架构),如此可以在压降幻觉的同时提升推理能力。
M3的另一项关键进展在于端到端的严肃问诊能力。不同于依赖角色扮演提示词的常见做法,百川通过原生训练方式,围绕其提出的SCAN原则(安全分层、信息澄清、关联追问、规范化输出),让模型具备像临床医生一样主动追问、风险优先的信息采集能力。
关于多模态的问题,王小川强调语言仍是智能中轴,图像识别仅为辅助手段。未来将结合多模态感知模型,但主战场仍在基于符号逻辑的推理系统上。
过去一年,医疗成为通用大模型厂商加大投入的重点方向之一。OpenAI已推出面向医疗场景的ChatGPT Health,Anthropic也发布了面向医疗机构的Claude for Healthcare。在这一背景下,百川智能M3为医疗大模型竞争提供了新的对比样本。
在这一领域,王小川认为百川智能的竞争优势来自三方面:持续领先的模型能力(以算法为核心)、切入高价值非共识场景的战略定力、以及独特的产品形态创新。
在大厂竞争层面,针对近期颇为高调的蚂蚁阿福,王小川将其划归到泛健康类产品,认为百川更针对严肃医疗,核心目标是解决临床需求,而不是浅层消费级服务。
谈及医疗领域病种或场景的偏向,王小川称儿科慢病和肿瘤会是公司当前相对重视的方向。在长期目标上,公司也追求通过训练范式迭和挖掘更多数据,实现更高层级的模型智能,以突破医疗领域尚未解决的疑难杂症。
“我其实第一天就想做医疗,但内部(过去)可能被媒体或者别的裹挟了之后,很多同学就不爽了,觉得这不是他想干的人生理想。”沟通会的最后,王小川仍旧短暂回顾了公司过去一段时间所经历的动荡。
“所以现在我长教训了,每个新人我都得直接面试,告诉他我就是想做医疗的。”王小川说。



还没有评论,来说两句吧...