OpenAI的创始人之一Sam Altman(萨姆·奥尔特曼)曾说:“我们现在正见证一场AI革命。”
今年2月Sora横空出世以来,大模型相关的发布进入了史上最密集时期。围绕着模型能力的热点也时刻滚动,长文本、知识库、MOE、多模态、端到端等不一而足。
今年3月,全国两会政府工作报告明确指出,积极推动“人工智能+”行动计划,着力强调大模型技术与产业界的深度融合及实际应用场景的落地拓展,大模型正在各个产业实践中扮演越发关键的角色。
大模型“诸神之战”一触即发。
医疗是最适合发展大模型的行业之一。2010年-2020年期间,医疗数据以+40%的增长率快速增长,而数据是大模型的“天然养料”。
医疗也是最迫切落地大模型的行业之一。据预测,到2030年,全球1/6的人口将超过60岁,全球医护人员缺口预计将达1000万。
但医疗行业的复杂、高壁垒,也成为诸多跟风进入大模型领域企业避而远之的存在,在医疗领域实现全面的大模型落地,难度无异于攀顶珠峰。即便也有不少企业冒风险入局,但发展仍旧良莠不齐。
“联影智能有信心走到最后。”早在2018年,联影智能联席CEO沈定刚教授在媒体采访中表示。
随着大模型席卷各行各业,联影智能在医疗这个垂直领域又有什么样的布局和落地呢?在2024年世界人工智能大会上,联影智能联席CEO周翔博士分享了联影智能在医疗大模型领域的阶段性成果。这个从医学影像人工智能起家的医疗AI企业,在医疗大模型上,展现出了敏捷而扎实的布局。
01、影像模态,医疗大模型中难摘的“明珠”
人脑是天生的多任务处理器,机器不是。
AGI(Artificial General Intelligence,通用人工智能)被视为AI皇冠上的明珠,其目标是模仿并超越人类的智力水平。但迄今为止,尚未有现实AGI成果出现,个中原因便在于,当前的AI无法克服认知模型复杂性这一难题。
在AGI尚未到来的当下,行业有一个共识:真实场景中的大规模应用,是大模型价值验证和通往AGI的必由之路。
找到高频、刚需场景,实现规模应用,完成模型能力迭代以及运转的闭环,正是这一阶段的竞争重点。
在医疗场景,医疗影像是与医疗场景联系最为紧密的数据模态。90%的医疗数据由医疗影像构成,它提供着人体内部结构或功能的直观图像,是影像诊断、辅助手术、治疗规划等重要细分场景中必不可少的依据。
但与之相对的现实情况是,医疗影像大模型却是市面上最少见的大模型类型,这正是因为其巨大的开发难度所决定的:医疗影像由成千上万个像素组成,这也意味着大模型需要理解像素形成的各类人体器官、病灶、疾病征象,且在识别精确度上需要达到极高水准。
也就是说,影像大模型是医疗大模型必须跨越的“天堑”,也是必须摘得的“明珠”。如果可以突破影像这个壁垒,医疗大模型就可以真正落地到医疗领域的大量多模态的细分场景,实现规模化的应用。脱胎于联影集团的联影智能,根基就在医学影像。
作为集团在人工智能领域的重要战略布局,联影智能基于对行业以及客户真实需求的理解,在医学影像领域积累了大量知识、经验以及数据,这些为联影智能在医疗大模型上的发力提供了得天独厚的优势条件。
在影像方面,联影智能基于uAI医疗影像大模型基座,构建了基于多病种影像数据的医疗影像大模型。该大模型突破性具备医学影像的通用认知能力,既可助力实现一扫多查,又可快速拓展出新的能力。
这一功效在样本量较小的应用上尤其明显——大模型会超越训练,产生有意义的“脑补”。以数字减影血管造影(DSA)技术为例,作为常用于心脏介入手术的技术,其数据和标注也往往较难收集。
并且由于图像中的造影导丝非常细,且背景存在较多噪音,因此对导丝的标注、分割和追踪往往是一项极具挑战性的任务。通过借助少批量的人工标注数据,使用大模型生成大量模拟导丝图并配以不同的动态背景,得到海量自带金标准的DSA训练视频,再将生成的数据投入到模型训练后发现,造影导丝的检测和分割的准确性提升了6%。
这意味着,在影像大模型的加入下,医学影像AI的实际开发仅需少量样本进行微调或增量学习,即可快速开发全新产品,为新产品开发落地提供强大加速度,推动模型开发迈入新范式,能够更灵活、快速地满足更多维的临床需求。
长远来看,也有望推动行业创新产品迎来爆发性落地。
02、下一个赛点
产业大模型,技术仅是门槛,落地才是赛点。联影智能在医疗影像领域的长期深耕,让医疗大模型深入渗透到更垂直的细分场景提供了必要的前置条件。
例如,在报告书写场景下,联影智能将影像、文本、语音模态进一步结合,最新推出了混合模态方向产品“uAI影智医声报告系统”。
基于uAI影智医声报告系统内置的语音、文本、影像多模态大模型技术,AI通过对医生的语音识别,智能分析语音描述、自动匹配影像部位,实现标准化报告描述,并可根据语音指令自动生成规范的检查结论,智能屏蔽无关对话内容,让报告书写工作更加便捷、规范,带来高效、精准、智能的全新报告书写体验。
区别于市面大多数的语音电子病历软件,该软件可与联影智能的独有优势领域,即多达50余款的全疾病谱、全模态医学影像AI辅助诊断软件无缝衔接,在患者进行影像扫描后,可将AI辅助诊断结果直接生成初步结构化报告,并通过语音指导uAI影智医声报告系统全自动完成报告书写,获得“影像诊断-报告撰写”全流程、多模态AI赋能。
而结合AI影像诊断能力进一步将放射科场景精细化、智能化仅是联影智能基于传统优势的自然延伸,如果能够将基于影像的AI大模型能力拓展至临床科室,渗透到治疗环节,则是将竞争壁垒直接带上了一层新的台阶。
今年六月,香港大学牙医学院口腔颌面外科的专家团队利用联影智能混合模态大模型产品uAI MERITS多元手术规划平台完成了「全球首例」混合大模型驱动的口腔颌面整复外科手术,创新性通过影像大模型分割算法及智能动态跟踪投影技术,解决了在穿支皮瓣制备中,医生靠经验和感觉定位穿支血管的临床痛点,极大提升手术效率和精准度。
术中使用uAI MERITS
目前,该团队已成功完成三例由uAI MERITS平台赋能的口腔颌面整复外科手术,其中区别于前两例的腓骨肌皮瓣制备手术,第三例手术首次实现了股前外侧穿支皮瓣制备手术,里程碑效应明显。
著名的登山家乔治·马洛里在被问及为何要攀登珠穆朗玛峰时说,“因为山就在那里。”
在医疗场景中,有不少比较容易被解决的痛点与需求,它们像小山一样,较易登顶,但价值自有其上限。
同时,也存在着好比“珠峰”一般极难被攻克的需求,即使实现难度极大,却仍旧吸引着无数人前往挑战。
让大模型在医疗领域全面落地,无疑是如“珠峰”般宏大的目标。而在医学影像领域的长久深耕,构成了联影智能在医疗大模型方面足以承前启后的先决条件,为其攀顶提供了更有利的支撑。
03、一条长途“登顶”之路
医疗决策紧密关系着患者的生命安全与健康福祉,技术本身的成熟度与安全性理应被置于更高的优先级。
于技术提供者而言,其行业经验的深度与广度,以及对医疗责任的深刻认识,都是衡量其能否承担医疗大模型开发的关键标尺。这意味着开发者必须明辨哪些创新是可行的、哪些技术尚未成熟、如何稳中求进、又如何确保技术安全着陆。
要达成这一宏大目标,对攀登者的耐力、实力、行业沉淀提出了更高的要求。
联影智能在成立伊始就曾表明,医疗AI是一个需要跑长跑的行业——这个行业没有“卡点式”的成功,只有深厚积累下的水到渠成。
成立六年,目前联影智能已形成全栈全谱医疗AI产品线、强大的研发力量、扎实的产学研医布局、灵活高效的商业化落地能力,这些都练就了联影智能深耕医疗场景的巨大耐力、丰富的实战经验与敏锐的行业洞察。
同时,联影智能还拥有其他跨界进入医疗大模型领域企业无可比拟的优势,即背后联影集团已经构建了AI+医疗全智能医疗健康生态。
现阶段,联影集团已在影像扫描、辅助诊断、临床治疗、智慧医院、前瞻科研、区域医疗、健康管理等方面完成超前布局,形成医疗设备、医疗机器人、医疗元宇宙、医疗芯片等多领域的生态联动,全面覆盖了“预防、诊断、治疗、康复、健康管理”的多个临床场景,这一全智能医疗健康生态为联影智能的未来发展提供了全面、多元、可期的发展空间。
某种程度上说,中国AI赋能产业化落地,是一种“既要又要,还要都要”的多重考验。因为一家企业要想从行业残酷淘汰中脱颖而出,势必速度至上,也要生存至上。既要有短期商业的闭环,也要有长期坚实的布局。面对未来,企业不仅需要技术的爆发力,还需要创新的持久力。
兼具爆发力和持久力的联影智能,也将持续演进。未来,面对日趋复杂的医疗场景以及庞大的医疗需求缺口,我们期待,联影智能带给行业的不仅仅是uAI影智大模型,而是更高效、更精准、更个性化、更泛在可及的新一代超级智能平台。
本文作者可以追加内容哦 !