设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 手机 数据 公司
当前位置: 首页 > 运营中心 > 建站资源 > 经验 > 正文

帝国理工:如何用 AI 解决 80% 专科医生担忧的心律装置移植手术难题

发布时间:2019-04-29 23:59 所属栏目:19 来源:李雨晨
导读:伦敦帝国理工学院的研究人员开发了一种基于AI的软件,目前,这款软件被称为PPMnn(永久起搏器神经网络), 用于识别起搏器或者除颤器的制造商和型号。该研究结果发表在美国心脏病学会(JACC):临床电生理学杂志上。这篇论文介绍了基于神经网络的系统的开发、

伦敦帝国理工学院的研究人员开发了一种基于AI的软件,目前,这款软件被称为PPMnn(永久起搏器神经网络), 用于识别起搏器或者除颤器的制造商和型号。该研究结果发表在美国心脏病学会(JACC):临床电生理学杂志上。这篇论文介绍了基于神经网络的系统的开发、验证和有效性。

帝国理工:如何用 AI 解决 80% 专科医生担忧的心律装置移植手术难题

背景

全世界每年有超过一百万人进行心律装置的移植手术,在移植过程中,医护人员通常是通过一些算法来辅助自己识别设备的X图像,进而确定起搏器或除颤器的制造商和型号。但即使是最有效的算法,识别也不是完美的,而一旦错误就会导致病情延误。

事实上,多达80%的心脏相关专科医生报告说他们“经常”难以识别设备。

研究人员对来自5家生产厂家的45种型号的1676台设备的X光图像进行提取。利用1451幅图像作为训练集,建立了卷积神经网络对图像进行分类。测试集还包含其余的225幅图像,每种型号包括5个样本,并将神经网络识别设备的能力与心脏病专家进行了比较。

结果显示,神经网络对制造商设备的识别准确率为99.6%(95%置信区间:97.5 ~ 100),对型号的识别准确率为96.4%(95%置信区间:93.1 ~ 98.5)。5名心脏病专家对制造商识别正确率的均值为72.0%(范围为62.2% ~ 88.9%),无法进行型号识别。可以看出,基于神经网络识别的能力明显优于所有心脏病专家。

方法

数据提取

在本研究中,数据集是选取1998年2月至2018年5月期间在 Imperial College Healthcare NHS Trust医疗保健中心植入的心率仪的图像。

训练神经网络需要足够多的类别样例,每一类至少包括25幅图像,包括便携式和部门AP/PA胸片,不包括侧位胸片。从连续病例患者中提取图像,每个型号最多提取40张图像,以最小化类不平衡。从每张X光图像中,分割出一个比设备稍大的正方形区域,该区域最大限度地提高了网络的信噪比。然后将这些裁剪后的图像调整为224×224像素,并进行归一化,得到0到1之间的像素值。在提取过程中注意,在某些情况下,如果制造商引进一种新型号时,在X光图像上没有检测到变化,这可能只是设备软件上的一个更新,或者是部件外观上几乎相同无法区分。

第一步,是从45类中随机分配5张图片作为“测试集”,这在网络的任何训练阶段都不会用到,在最终验证准确性时才会使用。

剩下的“训练集”用于训练网络,分为两个不同阶段:第一个阶段是决定使用哪个底层网络(包括结构特征,如层的数量和大小)以及训练的快慢(称为 “学习率”)。这些卷积神经网络类似于人类大脑的层次结构组织,解决图像分类问题;第二阶段是调整权重的详细过程,以对起搏器进行分类。这两个阶段都使用了训练集,但方式不同。

在网络训练第一阶段 (如图1所示),每种神经网络候选模型都从75%的训练集中学习,并正确预测剩余25%的训练集。如此重复4次,这样所有的训练集都轮流扮演了两个角色。这个过程被称为“4次交叉验证”。

帝国理工:如何用 AI 解决 80% 专科医生担忧的心律装置移植手术难题

图1 网络设计流程图

第二阶段,基于第一阶段选择的神经网络模型开始,但是使用整个训练集对网络进行训练,得到最终的神经网络模型。

最后,这个训练好的网络模型第一次向“测试集”公开,“测试集”始终保持独立,以评估其正确分类制造商和型号的能力。

该研究获得了卫生研究管理局(集成研究应用系统标识249461)的监管批准。

卷积神经网络架构与训练

我们评估了五种不同的卷积神经网络架构(DenseNet、Inception V3、VGGNet、ResNet和Xception),这些架构在近几年都是世界领先级的。在对整个模型进行再训练时,使用ImageNet上训练得到的权值对所有网络进行初始化。

对于每个网络,输出层设置为45个密集连接的神经元(对应每个设备型号1个)。使用交叉熵损失函数对其中16幅图像进行损失计算,并使用ADADELTA优化器更新权重。损失是用来评估网络性能和改进网络性能的技术指标。损失比简单的错误率(准确度的倒数)更敏感,因为要获得满分(零损失),网络对每个心脏起搏器图像的正确预测达到100%。

神经网络的训练是一个自动调整权值以使损失最小化的过程,直到损失函数达到稳定。使用Tensorflow和Keras机器学习框架的Python编程语言进行编程。

可视化

对每个例子进行处理以提供特征映射,其中梯度最高的像素对应于正确的类(突出显示对网络决策贡献最大的像素),这可以使用Keras-vis软件完成 。

借助算法的专家测试

将225张图像的测试集提供给5名心脏病专家(其中两个是电生理学家),同时提供心律仪识别算法CaRDIA-X(3)。该算法只针对制造商进行区分,而不能识别特定的型号。对于每一幅图像,都已知是起搏器、除颤器还是循环记录器。

我们要求评分者将每种设备分类为Biotronik、Boston Scientific、Medtronic、Sorin或St. Jude Medical。

统计分析

对比测试神经网络和借助CaRDIA-X算法的专家对制造商分类的结果。采用McNemar检验进行评估,p值0.05作为统计特征阈值。最后参照每位专家的评估结果计算精度均值。

精确度定义为测试集中正确分类的图像数量除以测试集中图像的总数。精确度的置信区间使用二项式方法计算。对于大小不相等的制造商类别,也计算F1分数,定义为精度和召回率的平均值的两倍,范围在0和1之间。

使用费希尔精确检验,对网络的准确性进行了不同子组的评估。韦尔奇不等方差t检验通过计算每张图像的拉普拉斯方差来评估部门和便携式x线片在图像清晰度方面的差异,采用R软件进行统计分析。

结果

数据集

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读