55阅读
2回复

[智能应用]AI 医疗诊断平均准确率 52.1%，与非专家医生相当 [1P] [复制链接]

上一主题下一主题查看指定楼层

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 129290

金币: 126814

道行: 20023

原创: 757

奖券: 68

斑龄: 0

道券: 0

获奖: 0

座驾

设备

摄影级

在线时间: 13957(小时)
注册时间: 2012-06-21
最后登录: 2025-04-22

只看楼主正序阅读使用道具楼主发表于: 昨天 08:11

IT之家 4 月 21 日消息，大阪都会大学医学研究生院 Hirotaka Takita 博士和 Daiju Ueda 副教授领导的研究小组近期发布一项系统性回顾和荟萃分析，深入评估了生成式人工智能（AI）在诊断医疗状况方面的表现，并将其与医生进行了对比。

研究团队筛选了总计 18371 项研究，最终确定 83 项进行详细分析。这些研究涉及多种生成式 AI 模型，包括 GPT-4、Llama3 70B、Gemini 1.5 Pro 和 Claude 3 Sonnet 等，覆盖了多个医疗领域。其中，GPT-4 是研究最多的模型。结果显示，这些 AI 模型的平均诊断准确率为 52.1%（95% 置信区间：47.0% - 57.1%）。部分模型的诊断准确率与非专家医生相当，两者之间没有显著统计差异（准确率差异：0.6% [95% 置信区间：-14.5% 至 15.7%]，p=0.93）。然而，专家医生的表现仍优于 AI，其准确率差距为 15.8%（95% 置信区间：4.4% - 27.1%，p=0.007）。尽管如此，随着技术的不断进步，这一差距可能会逐渐缩小。
研究还发现，AI 在大多数医学专科的表现较为一致，但有两个例外：皮肤科和泌尿科。在皮肤科，AI 的表现更为出色，这可能是因为该领域涉及模式识别，而这是 AI 的强项。但皮肤科同样需要复杂的推理和针对患者的决策，因此 AI 的优势并不能完全反映其在该领域的实际应用价值。对于泌尿科，研究结果仅基于一项大型研究，因此其结论的普适性受到一定限制。
“这项研究表明，生成式 AI 的诊断能力与非专家医生相当。它可以用于医学教育，支持非专家医生，并在医疗资源有限的地区协助诊断。”Hirotaka Takita 博士表示，“未来的研究需要在更复杂的临床场景中进行评估，使用实际病历进行性能评估，提高 AI 决策的透明度，并在不同患者群体中进行验证，以进一步证实 AI 的能力。”
IT之家注意到，除了诊断领域，该研究还强调了生成式 AI 在医学教育中的潜力。研究人员指出：“当前生成式 AI 模型在非专家环境下的表现与医生相当，这为将 AI 整合到医学培训中提供了机会。” AI 可以用于模拟真实病例，帮助医学生和受训者学习和评估他们的技能。
然而，研究也对这些模型的透明度和偏见提出了担忧。许多 AI 系统并未公开其训练数据的详细信息，这引发了关于其结果是否适用于所有人群的疑问。研究人员强调，“透明度确保了对模型知识、背景和局限性的理解”，并强调需要开发清晰、符合伦理且经过充分验证的 AI 应用。
目前，尽管生成式 AI 具有巨大潜力，但在涉及详细患者信息的复杂病例中仍面临挑战。医生们是否需要担心失去工作？目前尚难定论，但在诊断领域，这种情况是有可能发生的。

山庄提示：道行不够，道券不够？---☆点此充值☆

我有我可以

分享到 淘江湖新浪 QQ微博 QQ空间开心人人豆瓣网易微博百度鲜果白社会飞信

在线jjybzxw

UID: 551814

精华: 0
职务: 超级斑竹
级别: 得道成仙

发帖: 145402

金币: 95226

道行: 1988

原创: 2393

奖券: 2610

斑龄: 33

道券: 936

获奖: 0

座驾

设备

摄影级

在线时间: 33895(小时)
注册时间: 2008-10-01
最后登录: 2025-04-22

只看该作者板凳发表于: 昨天 17:04

　　大阪都会大学医学研究生院Hirotaka Takita博士和Daiju Ueda副教授领导的研究小组进行了一项系统性回顾和荟萃分析，评估了生成式人工智能（AI）在医疗诊断方面的表现，并将其与医生的表现进行了对比。研究团队从18371项研究中筛选出83项进行详细分析，涉及包括GPT-4、Llama370B、Gemini1.5Pro和Claude3Sonnet等多种AI模型，覆盖多个医疗领域。结果显示，这些AI模型的平均诊断准确率为52.1%，部分模型的诊断准确率与非专家医生相当，两者之间没有显著统计差异。然而，专家医生的表现仍优于AI，准确率差距为15.8%。随着技术的进步，这一差距可能会缩小。

　　研究还发现，在大多数医学专科中AI的表现较为一致，但在皮肤科和泌尿科中有所不同。在皮肤科，AI的表现更为出色，可能是因为该领域涉及模式识别，这是AI的强项。但对于泌尿科，研究结果仅基于一项大型研究，结论的普适性受到限制。

　　Hirotaka Takita博士指出，生成式AI的诊断能力与非专家医生相当，可以用于医学教育、支持非专家医生，并在医疗资源有限的地区协助诊断。未来的研究需要在更复杂的临床场景中评估AI的性能，并提高AI决策的透明度。

　　此外，研究强调了生成式AI在医学教育中的潜力，可以用于模拟真实病例，帮助医学生和受训者学习和评估技能。但同时，研究也对AI模型的透明度和偏见提出了担忧，强调需要开发清晰、符合伦理且经过充分验证的AI应用。

　　尽管生成式AI具有巨大潜力，但在涉及详细患者信息的复杂病例中仍面临挑战。目前尚难定论医生是否需要担心失去工作，但在诊断领域，这种情况是有可能发生的。

如何不发帖就快速得到金币和道行

在线姜谷粉丝

UID: 1569053

精华: 2
级别: 玉清道君

发帖: 129290

金币: 126814

道行: 20023

原创: 757

奖券: 68

斑龄: 0

道券: 0

获奖: 0

座驾

设备

摄影级

在线时间: 13957(小时)
注册时间: 2012-06-21
最后登录: 2025-04-22

只看该作者沙发发表于: 昨天 08:12

申请VIP---在山庄畅通无阻还送FTP单独下载账号!

AI医疗诊断的准确率与非专家医生的比较
根据最近的研究，生成式人工智能（AI）在医疗诊断方面的平均准确率为52.1%，这一数据与非专家医生的诊断准确率相当。这项研究由大阪都会大学医学研究生院的Hirotaka Takita博士和Daiju Ueda副教授领导，他们进行了一项系统性回顾和荟萃分析，评估了多种生成式AI模型，包括GPT-4、Llama370B、Gemini1.5Pro和Claude3Sonnet等在内，这些模型覆盖了多个医疗领域。结果显示，虽然部分AI模型的诊断准确率与非专家医生没有显著统计差异，但专家医生的表现仍优于AI，准确率差距为15.8%。不过，研究者指出，随着技术的进步，这一差距可能会逐渐缩小。

AI在医疗诊断中的潜在应用
尽管AI的平均准确率与非专家医生相当，但其在医疗领域的应用前景依然广阔。AI可以用于医学教育，支持非专家医生，并在医疗资源有限的地区协助诊断。Hirotaka Takita博士强调，未来的研究需要在更复杂的临床场景中进行评估，使用实际病历进行性能评估，提高AI决策的透明度，并在不同患者群体中进行验证，以进一步证实AI的能力。

AI与人类医生的合作模式
尽管AI在某些方面的诊断准确率已经很高，但它并不能完全取代人类医生。AI应该成为医生的好帮手、好搭档，与人类医生联手，提高诊断的速度和准确性，同时保留医疗行业的人情味。这种合作模式可以使AI和人类医生共同为患者提供更加准确、高效的医疗服务。

AI医疗诊断的未来发展
AI医疗诊断技术的发展正在迅速推进，未来的发展方向应该是让AI成为医生的得力助手，而不是竞争对手。AI在医疗领域的应用难度虽然较大，但会逐步渗透到一些典型场景中。随着技术的不断进步，AI在医疗诊断中的准确率有望进一步提高，从而更好地服务于医疗行业。

总结
AI医疗诊断的平均准确率52.1%与非专家医生相当，这表明AI在医疗诊断领域具有一定的潜力和应用价值。然而，AI在医疗领域的应用还需要更多的研究和验证，特别是在提高诊断的透明度和确保结果适用于所有人群方面。未来，AI与人类医生的合作将是医疗诊断领域的重要发展方向，旨在提高诊断效率和质量，同时保持医疗服务的人文关怀。

如何不发帖就快速得到金币和道行

我有我可以

发帖回复

返回列表


	关闭您还没有登录，快捷通道只有在登录后才能使用。立即登录还没有帐号？赶紧注册一个


	关闭选中1篇全选

帖子

[智能应用]AI 医疗诊断平均准确率 52.1%，与非专家医生相当 [1P] [复制链接]