环球速读:“AI问诊就是抛硬币”!甚至漏掉67%病患
“AI的一些医疗决策,实际上就是抛硬币。”
哈佛医学院的数据科学家Kun-Hsing Yu语出惊人。
(相关资料图)
他还补充道:
即便比赛中正确率达90%的获奖模型,再用原数据集子集测试时,准确度最多60-70%,可谓惨败。这让我们很惊讶。
上述科学家的观点来自Nature最近新发表的一篇文章。
内容对AI在医疗领域的可重复性提出了质疑,呈现诸多医疗领域及场景中,AI自带的黑箱属性造成的隐患。
更值得关注的是,尽管问题存在,但AI仍在医疗领域大规模推广使用。
举例来看,数以百计的美国医院已在使用一种AI模型标记败血症早期症状,但在2021年,该模型被发现未能识别率高达67%。
所以,AI究竟带来了哪些医疗隐患,如何解决?
继续往下看。
△图源:Nature人工智能的“看病难”
我们先从哈佛医学院的数据科学家Kun-Hsing Yu发现AI“抛硬币”的始末聊起。
在医疗领域,AI用于诊断检测人体一直质疑声不断,Kun-Hsing Yu此番研究也是希望有个直观体感。
他选定了常见癌症之一的肺癌,每年有350万美国人因该病症去世,若能更早通过CT扫描筛查,很多人可以免于死亡。
该领域的确备受机器学习界关注,为此,2017年业内还举办了面向肺癌筛查的竞赛。
该活动归属于Kaggle的Data Science Bowl赛事,数据由主办方提供,涵盖1397位患者的胸部CT扫描数据。参赛团队需开发并测试算法,最终大赛按准确率给予评奖,在官宣中,至少五个获奖模型准确度90%以上。
但Kun-Hsing Yu又重新测试了一轮,然后震惊地发现,即便使用原比赛数据的子集,这些“获奖”模型最高准确率却下降到了60-70%。
△一位参赛者分享的模型结构
上述状况并非个例。
普林斯顿一位博士,Sayash Kapoor,在17个领域的329项研究中报告了可重复性失败和陷阱,医学名列其中。
基于研究,这位博士及自己的教授还组织了一个研讨会,吸引了30个国家600名科研者参与。
一位剑桥的高级研究员在现场表示,他用机器学习技术预测新冠传播流行趋势,但因不同来源的数据偏差、训练方法等问题,没有一次模型预测准确。还有一位研究者也分享了——自己用机器学习研究心理课题,但无法复现的问题。
在该研讨会上,还有参与者指出谷歌此前遇到的“坑”。
他们曾在2008年就利用机器学习分析用户搜索所产生数据集,进而预测流感暴发。谷歌为此还鼓吹一波。
但事实上,它并未能预测2013年的流感暴发。一家独立研究机构指出,该模型将一些流感流行无关的季节性词汇进行了关联和锁定。2015年,谷歌停止了对外公开该趋势预测。
Kapoor认为,就可重复性来说,AI模型背后的代码和数据集都应可用并不出错误。那位研究新冠流行模型的剑桥ML研究者补充道,数据隐私问题、伦理问题、监管障碍也是导致可重复性出问题的病灶。
他们继续补充道,数据集是问题根源之一。目前公开可用的数据集比较稀缺,这导致模型很容易产生带偏见的判断。比如特定数据集中,医生给一个种族开的药比另一个种族多,这可能导致AI将病症与种族关联,而非病症本身。
另一个问题是训练AI中的“透题”现象。因数据集不足,用于训练模型的数据集和测试集会重叠,甚至该情况一些当事人还不知道,这也可能导致大家对模型的正确率过于乐观。
△Sayash Kapoor博士
尽管问题存在,但AI模型仍已被应用在实际诊断场景中,甚至直接下场看病。
2021年,一个名为Epic Sepsis Model的医疗诊断模型被曝出严重漏检问题。
该模型用于败血症筛查,通过识别病人早期患病特征检测,避免这种全身感染的发生,但密歇根大学医学院研究者通过调查分析了27697人的就诊情况,结果发现,该模型未能识别67%败血症病患。
此后,该公司对模型进行了大调整。
一位计算生物学家对此指出,该问题之所以较难解决,也同AI模型透明度不足有关。“我们在实践中部署了无法理解的算法,也并不知道它带什么偏见”,他补充道。
△曝出Epic Sepsis Model问题的文章
可以明确的是,只要上述问题一直未能解决,商业巨头及相关创业项目也有些举步维艰——
去年谷歌谷歌健康(Google Health)宣布人员拆分到各团队,前几天,谷歌孵化的生命健康子公司Verily又被曝裁员约15%。
有没改进措施?
对于这样的现状,一些研究者和业内人士也在着手改进医疗AI。
一方面,是构建靠谱的超大数据集。
涵盖机构、国家和人口等多方面的数据,并向所有人开放。
这种数据库其实已经出现了,比如英国和日本的国家生物库,以及重症病房远程监护系统eICU合作的数据库等。
就拿eICU合作研究数据库来说,这里面大约有20万次的ICU入院相关数据,由飞利浦医疗集团和MIT的计算生理学实验室共同提供。
为了规范数据库的内容,需要建立收集数据的标准。例如一个关于医疗结果伙伴关系的可观测数据模型,让各医疗机构能以相同的方式收集信息,这样有利于加强医疗保健领域的机器学习研究。
当然,与此同时,也必须重视严格保护患者的隐私,而且只有当患者本人同意时,才有资格把他们的数据纳入库。
另一方面,想要提升机器学习质量的话,消除冗余数据也很有帮助。
因为在机器学习中,冗余数据不仅会延长运行时间、消耗更多资源;而且还很可能造成模型过拟合——也就是训练出来的模型在训练集上表现很好,但是在测试集上表现较差。
对于AI圈很热门的预测蛋白质结构,这个问题已经得到了有效缓解。在机器学习过程中,科学家们成功地从测试集中删除了和训练集用到的过于相似的蛋白质。
but,各病人医疗数据之间的差异,并没有不同蛋白质结构差异那么明显。在一个数据库中,可能有许许多多病情非常相似的个体。
所以我们需要想清楚到底向算法展示什么数据,才能平衡好数据的代表性和丰富性之间的关系。
哥本哈根大学的转化性疾病系统生物学家Soren Brunak如是评价。
除此之外,还可以请行业大佬们制定一个检查表,规范医疗AI领域的研究开发步骤。
然后,研究人员就能更方便地搞清楚先做什么、再做什么,有条不紊地操作;还能Check一些可能遗漏的问题,比如一项研究是回顾性还是前瞻性的,数据与模型的预期用途是否匹配等等。
其实,现有已有多种机器学习检查表,其中大部分是基于“EQUATOR Network”先提出的,这是一项旨在提高健康研究可靠性的国际倡议。
此前,上文提到的普林斯顿的Kapoor博士,也和团队共同发表了一份包含21个问题的清单。
他们建议,对于一个预测结果的模型,研究人员得确认训练集中的数据要早于测试集,这样可以确保两个数据集是独立的,不会有数据重叠和相互影响。
推荐
- 环球速读:“AI问诊就是抛硬币”!甚至漏掉67%病患
- 每日观点:大庆石化:越是关键时刻,越要绷紧安全弦
- 通化医药高新技术产业开发区环卫市场化改革项目公布中标结果 天天即时看
- 快播:春节可以送伞吗 春节能不能送伞呢
- 今日热讯:第六届平遥国际电影展公布创投获奖名单
- 世界观点:023年,中国创新药投资告别“豪赌”时代
- 天天观焦点:济南九顶塔欢乐中华年大庙会开放时间
- 晶雪节能:融资净买入23.37万元,融资余额4153.97万元(01-17)
- 独特又霸气的情侣网名 好听独特又霸气的情侣昵称精选
- 全球滚动:澳门商务签注办理预约入口
- 东方盛虹(000301)1月17日主力资金净卖出2539.66万元|世界观焦点
- 01月17日12时湖南常德昨日疫情新增0例、累计报告阳性感染者确诊102例-环球快讯
- 今日热门!蒙煤外运再添新引擎 红进塔站明望达铁路专用线开通运营
- 2个月股价大涨46%!这家股份行"秀"业绩:净利增速25.3%!银行股行情来了?
- “烟花刺客”出现:网红“加特林”单价上百仍需抢,消费上千听个响 世界快看
- 怀化靖州着力推进高标准农田建设项目数量质量生态一体化 促进农业高质量发展
- 天天看点:我国拥有有效发明专利企业35.5万家
- 2023-2028年中国椎间孔镜行业市场深度研究及投资前景展望报告 全球热消息
- 韩国登记人口约5144万人,连续三年减少|每日热文
- 汕头知识产权专业律师费如何收_环球报资讯
- 国家卫健委:全国发热门诊的诊疗量2022年12月23日达到高峰_世界信息
- 焦点资讯:23省份定下今年GDP增长目标:最高9.5%左右 着力促消费
- 天天热讯:本田幼兽CrossCub110落户新本国产或将在第一季度上市
- 今日最新!发行热度延续 银行同业存单供需有望走强
- 东方锆业(002167)12月29日主力资金净卖出595.90万元-天天信息
- 借去花逾期期17天会怎样|世界新视野
- 厦门灵玲国际马戏城元旦节门票多少钱?-看点
- 美国冬季风暴重灾区雪深难清理 交通电力仍部分中断-全球快报
- 东莞塘厦新冠疫苗第四针接种点在哪
- 1月3日见!NV要发新显卡 你买不买?
- A股异动 | 大为股份开盘涨停 拟220亿元投建锂矿产资源综合利用及锂电池产业链项目等
- 要闻速递:号召读书的句子精选401句
- 我阳了...
- 天天微资讯!众源新材12月28日盘中涨停
- 密谋绑架密歇根州女州长,男子重囚16年_环球时快讯
- 热文:12月27日基金净值:华夏创成长ETF最新净值0.5625,涨1.22%
- 左江科技:与中移(成都)产业研究院签订战略合作协议-焦点报道
- 天天热点!莱美药业董秘回复:公司重点品种研发进度请您参见公司定期报告“管理层讨论与分析”相关内容
- HY兴业投资:在美债收益率提振下,美元/日元上涨至三日内的高水平突破133.00
- 天天新资讯:中科创达: 《章程(草案)(GDR上市后适用)》及其附件修订对比表
- 派生科技(300176)11月28日主力资金净卖出527.22万元
- 【世界报资讯】石家庄循环化工园区以更大力度上项目稳投资添动力
- 济源市气象台发布道路结冰黄色预警「III级/较重」「2022-12-25」
- 天天简讯:她曾是央视一姐,辞职后变成为公司董事长,54岁素颜出镜风采依旧
- 新疆铁路货运量首破两亿吨 提前8天完成全年生产任务指标
- 世界今头条!北京银行: 北京银行股份有限公司关于召开2023年第一次临时股东大会的通知
- 29.8亿元!财政部提前下达河南省补助资金支持安居工程建设 当前通讯
- AMD的超频记录被打破 i9-13900K超到9GHz
- 12月22日热点行业分析:红黄药酒、白酒行业领涨
- 世界最资讯丨阿牛智投:行情转折还需等待
- 全球最新:小赢卡贷网贷逾期三个月征信会怎么样
- 环球热点评!创新技术获上海市经信委资助 北信源工控安全业务或迎新机遇
- 当前热点-网贷10万还不起会不会被起诉
- 今日热搜:【解码2023河南经济发展②】河南如何加强市场化引才?专家提出这些建议
- 全球热消息:“60后”退休群体撬动“不一样”的养老服务业
- 直击调研 | 老百姓(603883.SH):自有品牌销售占比达到19.8% 深度整合怀仁药房仍需时间 微资讯
- 【焦点热闻】西安—达州“复兴号”动车1月1日开行 万源步入“动车时代”
- 热点评!中国信通院赵相楠:预防软件供应链风险需营造安全可信网络空间生态环境
- 宜人贷网贷逾期1千征信会怎么样
- 今日热议:许昌经济技术开发区:打击传销宣传进社区
- 环球视点!库里空砍32+5+5生死时刻走步致命 最后一攻成诱饵
- 发展新能源是实现能源本质安全的主要选择
- 世界信息:德信服务集团(02215.HK)授出3.15亿元贷款
- 本周盘点(12.12-12.16):苏美达周跌3.95%,主力资金合计净流出1266.23万元 每日观察
- 天天快消息!离婚后拒付子女培训费,法院成功执结6600元
- 任职资格获批:葛仁余正式接棒江苏银行行长|环球滚动
- 天天热点!公司向股东借款合同怎样写要注意哪些问题
- 异动快报:神雾节能(000820)12月15日9点38分触及涨停板
- 合同诈骗罪贷款诈骗,具体如何处罚? 天天短讯
- 【世界新要闻】贴近需求送服务 倡树文明好风尚
- 之江生物(688317)12月13日主力资金净卖出7681.08万元-环球观察
- 天天滚动:鑫海建元为高净值人员提供帮助
- 金钟股份:12月12日获融资买入87.21万元,占当日流入资金比例16.08%
- 焦点快看:水晶光电(002273.SZ):拟推第六期员工持股计划 筹资总额上限为4580.68万元
- 如何面向零零后开设大学写作课_环球热推荐
- 全球新动态:“女鞋第一股”金蝉脱壳,卖鞋终归不如搞直播
- 内幕交易江特电机细节全曝光,赣锋锂业被罚442万 全球快播报
- 全球通讯!华大智造(688114)12月7日主力资金净卖出378.86万元
- 股票行情快报:中炬高新(600872)12月6日主力资金净卖出9037.26万元|全球热文
- 就地过节 露营度假!“微度假”成今年十一假期新趋势
- 超四成转化至制造业领域!我国科技成果转化合同项数超46万项
- 前4个月甘肃外贸进出口总值209.8亿元 同比增长8.1%
- 株洲首座220千伏“多站合一”变电站将于6月投运
- 合肥市龙河口引水工程取水口围堰顺利合龙
- 中宣部:斩断伸向未成年人的盗版侵权“魔爪”
- 国务院开展根治欠薪冬季专项行动 为农民工追讨欠薪68.62亿元
- 坚决打击网络暴力 帮助网民切实维护自身权益
- 七台河市鹿山煤矿二井发生矿震 4人被困井下
- 暂停27天后 福建仙游火车站重启
- “大工匠”传经送宝
- 黑龙江七台河一煤矿发生矿震 目前井下4人被困
- 湖南临澧凌晨拉响防空警报 回应:短路引起故障
- 广东国庆假期高速公路车流总量超5000万车次 大湾区车流量同比增长10%
- 南海热带低压加强为台风 海南发布台风三级预警
- 广东升级广交会期间疫情防控举措 所有持证人员核酸检测“应检尽检”
- 国庆假期北京市接待旅游总人数861.1万人次
- 高福、童贻刚团队:新冠病毒溯源将是一场“持久战”
- 四川水利国庆假期全力应战最强秋汛
- 南海热带低压将于8日夜间至9日上午在海南岛东部登陆
- 聊天群背后的黑色产业链 金钱诱惑下被害人变成害人者
X 关闭
行业规章
X 关闭