基于非典型类数据平衡的皮肤癌智能诊断策略
作者: 彭建伟 谭政波 韩霖 庄艳 陈科 林江莉
摘要:皮肤癌早期诊断和筛查非常重要,但是皮肤癌识别难度较大,诊断准确度一直偏低。在国际皮肤影像协会举办的最近一次多分类竞赛ISIC2019上,冠军模型的平均准确率仅为63.6%。目前亟须性能良好的策略来提升皮肤病智能分类的准确性。经研究使用EfficientNet网络,并创新性提出非典型类数据平衡策略。用ISIC2019竞赛数据进行实验,结果显示,八分类的平均准确度高达82.4%。非典型类数据平衡策略为不均衡数据集的分类提供了一个新的方案。
关键词:皮肤癌图像;EfficientNet ;不均衡数据集;多分类;ISIC2019
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2023)01-0041-02
1 概述
根据世界卫生组织2020年的数据,皮肤癌已经成为发病率前五的癌症,在1000万的死亡病例中皮肤癌约有120万例。
目前皮肤病的临床辅助诊断手段主要是皮肤镜技术,但是部分疾病的皮肤镜图像相似度高,临床诊断困难[1],近年来人工智能在皮肤病诊断领域显示出优越性能,研究发现,人工智能模型在皮肤镜图像上有着超过人类医生的诊断准确度[2-4]。但是由于皮肤癌图像的“同病异影”和“同影异病”问题严重(如图1所示),皮肤癌智能诊断准确度较低。ISIC2019竞赛上,针对黑色素瘤、鳞状细胞癌等8种皮肤病的分类任务中,官方公布的冠军模型的准确率只有63.6%。
鉴于此,本文针对性提出皮肤癌智能诊断策略,致力于进一步提升分类准确率。
2 方法
2.1 数据集
研究数据来自ISIC2019竞赛,主要包括HAM10000,BCN20000,以及ISIC挑战赛本身的数据。数据集共有25331张,包括八种病变[5]。分别是5类良性病变:NV:黑色素痣(12875张),BKL良性角化病(2624张),AK光化性角化病(867张),VASC:血管源性病变(253张),DF皮肤纤维瘤(239张);以及3类恶性病变:MEL黑色素瘤(4522张),BCC基底细胞癌(3323张),SCC鳞状细胞癌(628张)。最多的黑色素痣有12875张,最少的皮肤纤维瘤, 仅有239张,样本分布极不均衡。
2.2 数据平衡扩增
为平衡各类样本数量,首先采用传统扩充策略,即直方图均衡,水平翻转,旋转30、90、150或180度,随机擦除等方法进行扩增,使扩增后每类的数量接近黑色素痣数量的二分之一左右。
2.3 非典型类数据平衡方法
传统平衡扩增之后,分类准确率提升并不明显,在此基础上本文提出了一种全新的“非典型类”数据平衡扩增方法。技术路线如图2所示。
非典型类是指在传统平衡扩增数据集训练后错分到其他类别的图片,就是FN(False Negative) 。通过大量扩增非典型类图像,达到数量分布趋于平衡。
2.4 EfficientNetB0网络
EfficientNetB0是MingXing Tan等人在2019年提出的。网络由 9个单元组成,主要模块有MBConvBlock,MBConv,SepConv,使用了深度可分离卷积(DWConv) ,SE模块等结构。本文采用迁移学习改善此网络训练过程中由过拟合和随机初始化权重带来的梯度消失问题。
3 实验结果
3.1 实验设置和评价
训练过程中,输入图像大小为224×224pixels,并做随机数据增强操作,最后归一化转为向量输入网络。Epoch为100,Batch Size为64,迁移学习的学习率为0.01,迁移学习之后的学习率为0.001,两次训练均使用带动量的SGD优化器,动量为0.9,衰减速率设置为0.0001。对于识别结果,采用敏感度SEN,准确率ACC,F1_Score进行评估;并画出ROC曲线计算AUC,来评价模型的可靠性。
3.2 实验结果
EfficientNetB0分类器使用非典型类数据平衡策略之后,模型的敏感度、准确率和F1_Score都获得最优,结果如表1所示。
敏感度SEN代表着正样本的检出率,是医生最关注的指标。表2显示了实验结果中各个类别的敏感度数据。可见,除NV和VASC略有下降,其他类别的灵敏度都有不同程度的提升,特别是黑色素瘤MEL的提升对临床筛查有较大帮助。
分类器的ROC曲线和AUC如图3所示,AUC值均高于90%,这说明模型的分类结果非常可靠。
3.3 验证实验
为进一步验证非典型类数据平衡方法的有效性,实验选取了VGG,ResNet以及GoogLeNet进行测试,测试结果如图4。可见,三个网络在非典型类数据平衡策略下的F1分数均取得了最优的效果。
4 结束语
本研究针对皮肤癌图像高度相似及数据不均衡的特点,提出一种全新的非典型类数据平衡方法,大幅提升了皮肤癌识别的准确性,超过ISIC2019冠军模型20%,为皮肤癌的早期筛查提供了有效策略,为不均衡数据集的分类提供了新的思路。
参考文献:
[1] 邵虹,张鸣坤,崔文成.基于分层卷积神经网络的皮肤镜图像分类方法[J].智能科学与技术学报,2021,3(4):474-481.
[2] 埃斯特瓦,库普勒,诺沃亚,等. 皮肤科医生级皮肤癌的深度神经网络分类[J].自然,2017,542(7639):115-118.
[3] 海恩斯勒,芬克,施耐德鲍尔,等. 人对机器:深度学习卷积神经网络在皮肤镜黑色素瘤识别中的诊断性能与58位皮肤科医生的比较[J].肿瘤学纪事,2018,29(8):1836-1842.
[4] 布林克尔,海科勒,艾恩克,等.在面对面皮肤镜黑色素瘤图像分类任务中,深度学习优于157名皮肤科医生中的136名[J]. 欧洲癌症杂志,2019,113:47-54.
[5] 钱德尔,罗森达尔,基特勒.HAM1000数据集:一个收集了大量常见色素性皮肤病变的多源皮肤镜图像的数据集[J].科学数据,2018,5(1):1-9.
【通联编辑:闻翔军】