本文主要通过改进后的YOLOv5模型结合Mask R-CNN模型实现外周血细胞的计数任务,但是由于两部分算法模型是分开的两个python项目操作起来较繁琐,所以编写一个桌面应用将二者整合起来。 开发环境为Python 3.6,编译器Pycharm CE 2021,程序开发工具为tkinter,模型训练使用的数据集使用的是kaggle的血细胞数据集。
血细胞在染色后呈现的颜色特征不同,而借助颜色信息可以更好的进行识别和分类,比如白细胞的颜色相对红细胞更深,红细胞由于其双凹盘结构中心颜色较浅接近于背景色。
(1)颜色注意力实现原理:
加入全卷积网络后,模型在训练过程中会对其认为重要(使损失函数更小)的颜色(像素)自动赋予更合适的权重,基本结构如下图:
After adding the full convolutional network, the model will automatically assign more appropriate weights to the colors (pixels) it considers important (to make the loss function smaller) during training. The basic structure is as follows:
(2)加入颜色注意力的优势:
经过实验对比,加入颜色注意力相比加入常用的SENet通道注意力机制,得到的mAP@0.5差距并不大,但加入颜色注意力机制的YOLOv5模型训练时间更短(如下300轮实验数据)
After experimental comparison, adding color attention is not much different from adding the commonly used SENet channel attention mechanism in terms of mAP@0.5, but the YOLOv5 model with the color attention mechanism takes less time to train (as shown in the following 300 rounds of experimental data)
(1)输入:在程序主窗口输入所要处理的血细胞图片路径
(2)YOLOv5目标检测:将已经训练好的权重文件和预测代码嵌入程序中,点击按钮【YOLO】完成目标检测操作,并生成带有Bounding boxes的图片,不同类别血细胞数量信息将会显示在窗口右侧。
(3)粘连细胞实例分割:将训练好的Mask R-CNN权重以及相关文件嵌入,点击【Mask】按钮,对之前检测到的每一个RBC2区域进行实例分割,并且可以查看每一个区域的实例分割带掩码图片,比如下图4个按钮对应4个重叠的红细胞,点击【0】即可查看第1个重叠红细胞实例分割后的图片。