切换到宽版
  • 55阅读
  • 2回复

[智能应用]AI 医疗诊断平均准确率 52.1%,与非专家医生相当 [1P] [复制链接]

上一主题 下一主题
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君
 

发帖
129290
金币
126814
道行
20023
原创
757
奖券
68
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 13957(小时)
注册时间: 2012-06-21
最后登录: 2025-04-22
只看楼主 正序阅读 使用道具 楼主  发表于: 昨天 08:11
IT之家 4 月 21 日消息,大阪都会大学医学研究生院 Hirotaka Takita 博士和 Daiju Ueda 副教授领导的研究小组近期发布一项系统性回顾和荟萃分析,深入评估了生成式人工智能(AI)在诊断医疗状况方面的表现,并将其与医生进行了对比。

研究团队筛选了总计 18371 项研究,最终确定 83 项进行详细分析。这些研究涉及多种生成式 AI 模型,包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等,覆盖了多个医疗领域。其中,GPT-4 是研究最多的模型。结果显示,这些 AI 模型的平均诊断准确率为 52.1%(95% 置信区间:47.0% - 57.1%)。部分模型的诊断准确率与非专家医生相当,两者之间没有显著统计差异(准确率差异:0.6% [95% 置信区间:-14.5% 至 15.7%],p=0.93)。然而,专家医生的表现仍优于 AI,其准确率差距为 15.8%(95% 置信区间:4.4% - 27.1%,p=0.007)。尽管如此,随着技术的不断进步,这一差距可能会逐渐缩小。
研究还发现,AI 在大多数医学专科的表现较为一致,但有两个例外:皮肤科和泌尿科。在皮肤科,AI 的表现更为出色,这可能是因为该领域涉及模式识别,而这是 AI 的强项。但皮肤科同样需要复杂的推理和针对患者的决策,因此 AI 的优势并不能完全反映其在该领域的实际应用价值。对于泌尿科,研究结果仅基于一项大型研究,因此其结论的普适性受到一定限制。
“这项研究表明,生成式 AI 的诊断能力与非专家医生相当。它可以用于医学教育,支持非专家医生,并在医疗资源有限的地区协助诊断。”Hirotaka Takita 博士表示,“未来的研究需要在更复杂的临床场景中进行评估,使用实际病历进行性能评估,提高 AI 决策的透明度,并在不同患者群体中进行验证,以进一步证实 AI 的能力。”
IT之家注意到,除了诊断领域,该研究还强调了生成式 AI 在医学教育中的潜力。研究人员指出:“当前生成式 AI 模型在非专家环境下的表现与医生相当,这为将 AI 整合到医学培训中提供了机会。” AI 可以用于模拟真实病例,帮助医学生和受训者学习和评估他们的技能。
然而,研究也对这些模型的透明度和偏见提出了担忧。许多 AI 系统并未公开其训练数据的详细信息,这引发了关于其结果是否适用于所有人群的疑问。研究人员强调,“透明度确保了对模型知识、背景和局限性的理解”,并强调需要开发清晰、符合伦理且经过充分验证的 AI 应用。
目前,尽管生成式 AI 具有巨大潜力,但在涉及详细患者信息的复杂病例中仍面临挑战。医生们是否需要担心失去工作?目前尚难定论,但在诊断领域,这种情况是有可能发生的。
山庄提示: 道行不够,道券不够?---☆点此充值☆
 
我有我可以
在线jjybzxw

UID: 551814


发帖
145402
金币
95226
道行
1988
原创
2393
奖券
2610
斑龄
33
道券
936
获奖
0
座驾
设备
摄影级
在线时间: 33895(小时)
注册时间: 2008-10-01
最后登录: 2025-04-22
只看该作者 板凳  发表于: 昨天 17:04
  大阪都会大学医学研究生院Hirotaka Takita博士和Daiju Ueda副教授领导的研究小组进行了一项系统性回顾和荟萃分析,评估了生成式人工智能(AI)在医疗诊断方面的表现,并将其与医生的表现进行了对比。研究团队从18371项研究中筛选出83项进行详细分析,涉及包括GPT-4、Llama370B、Gemini1.5Pro和Claude3Sonnet等多种AI模型,覆盖多个医疗领域。结果显示,这些AI模型的平均诊断准确率为52.1%,部分模型的诊断准确率与非专家医生相当,两者之间没有显著统计差异。然而,专家医生的表现仍优于AI,准确率差距为15.8%。随着技术的进步,这一差距可能会缩小。

  研究还发现,在大多数医学专科中AI的表现较为一致,但在皮肤科和泌尿科中有所不同。在皮肤科,AI的表现更为出色,可能是因为该领域涉及模式识别,这是AI的强项。但对于泌尿科,研究结果仅基于一项大型研究,结论的普适性受到限制。

  Hirotaka Takita博士指出,生成式AI的诊断能力与非专家医生相当,可以用于医学教育、支持非专家医生,并在医疗资源有限的地区协助诊断。未来的研究需要在更复杂的临床场景中评估AI的性能,并提高AI决策的透明度。

  此外,研究强调了生成式AI在医学教育中的潜力,可以用于模拟真实病例,帮助医学生和受训者学习和评估技能。但同时,研究也对AI模型的透明度和偏见提出了担忧,强调需要开发清晰、符合伦理且经过充分验证的AI应用。

  尽管生成式AI具有巨大潜力,但在涉及详细患者信息的复杂病例中仍面临挑战。目前尚难定论医生是否需要担心失去工作,但在诊断领域,这种情况是有可能发生的。

如何不发帖就快速得到金币道行
 
在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖
129290
金币
126814
道行
20023
原创
757
奖券
68
斑龄
0
道券
0
获奖
0
座驾
设备
摄影级
在线时间: 13957(小时)
注册时间: 2012-06-21
最后登录: 2025-04-22
只看该作者 沙发  发表于: 昨天 08:12
AI医疗诊断的准确率与非专家医生的比较
根据最近的研究,生成式人工智能(AI)在医疗诊断方面的平均准确率为52.1%,这一数据与非专家医生的诊断准确率相当。这项研究由大阪都会大学医学研究生院的Hirotaka Takita博士和Daiju Ueda副教授领导,他们进行了一项系统性回顾和荟萃分析,评估了多种生成式AI模型,包括GPT-4、Llama370B、Gemini1.5Pro和Claude3Sonnet等在内,这些模型覆盖了多个医疗领域。结果显示,虽然部分AI模型的诊断准确率与非专家医生没有显著统计差异,但专家医生的表现仍优于AI,准确率差距为15.8%。不过,研究者指出,随着技术的进步,这一差距可能会逐渐缩小。

AI在医疗诊断中的潜在应用
尽管AI的平均准确率与非专家医生相当,但其在医疗领域的应用前景依然广阔。AI可以用于医学教育,支持非专家医生,并在医疗资源有限的地区协助诊断。Hirotaka Takita博士强调,未来的研究需要在更复杂的临床场景中进行评估,使用实际病历进行性能评估,提高AI决策的透明度,并在不同患者群体中进行验证,以进一步证实AI的能力。

AI与人类医生的合作模式
尽管AI在某些方面的诊断准确率已经很高,但它并不能完全取代人类医生。AI应该成为医生的好帮手、好搭档,与人类医生联手,提高诊断的速度和准确性,同时保留医疗行业的人情味。这种合作模式可以使AI和人类医生共同为患者提供更加准确、高效的医疗服务。

AI医疗诊断的未来发展
AI医疗诊断技术的发展正在迅速推进,未来的发展方向应该是让AI成为医生的得力助手,而不是竞争对手。AI在医疗领域的应用难度虽然较大,但会逐步渗透到一些典型场景中。随着技术的不断进步,AI在医疗诊断中的准确率有望进一步提高,从而更好地服务于医疗行业。

总结
AI医疗诊断的平均准确率52.1%与非专家医生相当,这表明AI在医疗诊断领域具有一定的潜力和应用价值。然而,AI在医疗领域的应用还需要更多的研究和验证,特别是在提高诊断的透明度和确保结果适用于所有人群方面。未来,AI与人类医生的合作将是医疗诊断领域的重要发展方向,旨在提高诊断效率和质量,同时保持医疗服务的人文关怀。
如何不发帖就快速得到金币道行
 
我有我可以
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个