研究人员开发出一套人工智能系统,可在症状出现前20年预测1000多种疾病的患病风险——这项发表于《自然》周刊的最新研究显示。
这款名为Delphi-2M的模型在近期健康预测中达到76%的准确率,即便预测十年后的健康状况仍能保持70%的准确度。
它在同步评估人类全谱系疾病风险的同时,其表现超越了现有的单病种风险预测工具。
<span data-mce-type=”bookmark” style=”display:inline-block;width:0px;overflow:hidden;line-height:0″ class=”mce_SELRES_start”></span>
研究人员指出:”人类疾病随年龄演进的典型特征包括健康期、急性病症发作期以及慢性衰弱期,通常表现为共病集群现象。目前鲜有算法能预测覆盖国际疾病分类第十版(ICD-10)编码体系顶层1000多种诊断的全谱系疾病。”
该系统从英国生物样本库40.2万名参与者的数据中学习疾病规律后,无需额外训练即在190万份丹麦健康记录中验证了其有效性。
若您正跃跃欲试想体验这款医学预测工具,很遗憾——普通用户暂时无法直接使用。
训练完成的模型及其权重参数受英国生物样本库管控流程保护,仅向研究人员开放。虽然模型训练代码已在GitHub 以MIT协议开源,理论上可自行构建模型,但必须获取海量医疗数据集才能实际运行。
目前这仍是一项科研工具,而非消费级应用。
技术原理
该技术将医疗史视为序列进行处理——类似ChatGPT解析文本的方式。
每个标注首次发生年龄的诊断结果都被转化为标记符。模型通过解读这种医疗”语言”来预测后续发展。
在充足信息与训练基础上,系统既能预测下一个标记符(即潜在疾病),也能估算该标记符的生成时间(在大概率事件序列下发病的预期时长)。
对于患有糖尿病和高血压的60岁患者,Delphi-2M可能预测其胰腺癌风险增加19倍。若该患者后续确诊胰腺癌,模型测算其死亡风险将激增近万倍。
Delphi-2M采用的Transformer架构将个人健康轨迹呈现为诊断代码、吸烟/BMI等生活方式指标及人口统计数据的时序链。就诊间隔由”无事件”填充符占据,使模型理解时间推移本身就会改变基线风险。
这种机制与通用大语言模型即使缺失部分词句仍能理解文意的工作原理高度相似。
经临床工具对标测试,Delphi-2M表现持平或更优:在心血管疾病预测中,其AUC值达0.70(AutoPrognosis为0.69,QRisk3为0.71);对于痴呆症预测达到0.81(与UKBDRS持平)。关键差异在于:传统工具仅针对单一病症,而Delphi-2M可实现全病种同步评估。
除个体预测外,该系统还能生成完整的合成健康轨迹。
基于60岁起始数据,它可模拟数千种健康演进路径,得出误差在统计范围内的群体级疾病负担估算。利用合成数据训练的次级Delphi模型准确率达74%,仅比原始模型低三个百分点。
模型揭示了疾病间的动态关联:癌症的死亡风险影响存在数年”半衰期”,而败血症效应会急剧衰减,数月内恢复至基线附近。心理健康问题则呈现持续集群效应,某个诊断可强力预测数年后同类别其他疾病的发生。
局限性
该系统存在明显边界:其20年期预测准确率普遍降至60-70%,具体数值因疾病类型而异。
研究指出:”97%的诊断AUC值超过0.5,表明绝大多数疾病存在至少部分可预测规律。”但同时也强调:”Delphi-2M的平均AUC值在10年后从0.76降至0.70″,且”采样首年正确预测疾病标记符的比例平均为17%,20年后降至不足14%”。
换言之,该模型在相关场景下预测表现优异,但20年间变数众多,它并非诺查丹玛斯式的预言神器。
罕见病与高环境关联性疾病预测难度较大。英国生物样本库的人口偏差(以白人、高学历、相对健康志愿者为主)带来的数据偏倚,研究者承认亟待修正。
丹麦验证暴露另一局限:Delphi-2M习得了英国特有的数据采集特性。主要基于医院记录诊断的疾病呈现人为高估,与丹麦民众登记数据相悖。
对于有住院记录者,模型预测的败血症发病率为正常值八倍,部分原因在于英国生物样本库中93%的败血症诊断来自医院档案。
研究团队采用改进型GPT-2架构训练Delphi-2M,参数量220万——相较于现代语言模型虽显精简,但已满足医疗预测需求。核心改进包括:用连续年龄编码替代离散位置标记,引入指数型等待时间模型以预测事件发生时机而非仅预测事件类型。
训练数据中每条健康轨迹平均包含从出生到80岁的18个疾病标记符。性别、BMI分级、吸烟饮酒状态等构成背景信息。
模型自动学习这些因素的权重关系,发现肥胖增加糖尿病风险、吸烟提升患癌概率——这些医学界早有定论的关系无需显式编程即自主涌现,堪称健康领域的专用大语言模型。
临床部署仍存多重障碍:需在更多样化人群中验证(例如尼日利亚、中国、美国民众的生活习惯差异可能显著影响模型精度);涉及详细健康史的隐私问题需审慎处理;与现有医疗系统整合面临技术及监管挑战。
但应用前景广阔:从筛选不符合年龄标准的普查对象,到模拟群体健康干预措施。保险公司、药企及公共卫生机构显然兴趣浓厚。
Delphi-2M加入了基于Transformer的医疗模型家族,同类项目包括哈佛大学预测帕金森/阿尔茨海默症逆转基因药物组合的PDGrapher、蛋白质连接关系专用大语言模型、谷歌基于DNA配对训练的AlphaGenome等。
Delphi-2M的独特价值在于其广泛的作用范围、覆盖疾病的极大广度、超长预测周期,以及能生成既保持统计关系又保护个人隐私的逼真合成数据。
换言之,”我还能活多久?”或将不再是无解的诘问,而成为可测算的数据指标。
通用智能通讯
© 版权声明
文章版权归作者所有,未经允许请勿转载。