陈舒,陈若寒
(福建警察学院 计算机与信息安全管理系,福建 福州 350007)
摘要:肿瘤癌变细胞FISH图像分析系统中,需要解决粘连细胞核的分割问题。FISH属于新兴技术,产生的是特殊的荧光彩色细胞图,现有细胞图像分析方法并不适用。文章创新设计了基于深度凹陷检测和构造自然凹陷力的方法,分离粘连细胞核。首先,针对参差不齐的实验成像,在RGB模型下结合统计思想,将图像分为三类,分别进行预处理。继而,利用融合了Kmeans聚类算法的改进马尔科夫随机场(MRF)方法,将细胞核与癌变信号点进行有效提取。在此基础上,利用几何原理,创新设计了一套粘连细胞核分离算法。最后,给出细胞核快速计数和信号点提取方法。该系统设计基本完整,并达到预期效果。
关键词:FISH图像;细胞核提取;MRF模型;细胞核粘连;自然凹陷力
中图分类号:R857.3;TP391文献标识码:ADOI: 10.19358/j.issn.1674-7720.2017.01.015
引用格式:陈舒,陈若寒. 肿瘤癌变细胞FISH图像分析系统的研究[J].微型机与应用,2017,36(1):48-51,55.
0引言
较多研究表明,癌变细胞中都存在HER2蛋白的过表达或基因扩增现象。当前的检测技术有很多种,其中的FISH技术虽是一项新兴技术但已经被公认为业界的“黄金标准”[12]。
经过FISH技术处理后产生的肿瘤癌变细胞图像中,包含三个主要成分:背景(黑色)、细胞核(蓝色)、信号点(红色和绿色)。通过统计、分析细胞核与信号点的个数,就可以实现对HER2蛋白扩增现象的检测。
1预处理
FISH图像中,具有研究价值的区域恰好与RGB颜色模型的三个通道相吻合,不需要进行复杂的映射或者换算,所以选用RGB模型来进行设计。通过批量观察以及相应资料的查阅,FISH技术呈现的细胞核大致具有3个特点:边缘模糊(荧光强度不同)、核外轮廓各异(探针手工着色)、核内结构复杂(孔洞),需要进行预处理使得图像呈现最佳效果,从而简化算法。
1.1FISH图像分类
首先,根据成像的荧光效果,将图像分为三类:(1)弱荧光信号图;(2)晕染严重信号图;(3)理想信号图。分别如图1(a)、(b)、(c)所示。在专家指导下进行手工分类作为训练样本,得出图像在蓝色通道上的分布规律,借助统计学原理,进行自动分类。
1.2非理想图片的改善
需要对弱荧光图进行增强,对晕染现象进行去除。
1.2.1弱荧光图自适应增强
(1)原图像进行叠加,I=1.5×I(这步操作的实质是对亮度进行叠加);
(2)重新判断是否为弱荧光,如果是,则重新转入步骤(1),否则停止。实验效果如图2所示。
1.2.2晕染现象的自动去除
(1)将判别为“晕染严重”的原始图像转化为蓝色亮度图;
(2)运用Otsu法进行阈值分割,目标标记为1(白),背景标注为0(黑);
(3)填补小于阈值Pc个像素点的连通区域(孔洞);
(4)去除小于阈值Pc个像素点的连通区域(非细胞核区域);
(5)将标记为目标的区域恢复成RGB图,其他部分保持黑色背景;
(6)重新判断是否晕染严重,如果是,则重新转入步骤(2),否则停止。实验效果如图3。
其中Pc默认为原图总像素点的4%,这个百分比是根据多次实验效果得出的经验值,表示该图片中的细小孔洞,可以自适应各种尺寸的原始图像。
2FISH图像细胞核的提取
2.1传统方法
对细胞核提取的常用方法主要依据四类原理,分别是:阈值分割、边缘检测、传统区域思想以及基于特殊算法的理论[34]。
阈值分割虽然快速简便、不需要先验知识,却没有考虑与邻域像素点之间的关联性,分割较为粗糙,容易发生误判;边缘检测虽然是基于各个像素点与其邻域的差异,但是细胞核内荧光信号产生了大量的梯度变化,给真实边缘的检测增加了困难;传统区域思想需要先验知识并对图像有一定要求,且不考虑空间信息,容易造成过分割;而基于特殊算法的理论,则因为其特定的应用条件、复杂的参数或对图像计算量的要求等,在FISH图像的细胞核提取中并不适用。
2.2本文方法
综合以上算法的优缺点,本文考虑到像素点间的关联,选取马尔科夫随机场(MRF)[57]与无监督的聚类算法相结合来进行图像分割,提取FISH图像的细胞核。
从算法计算量和精度的角度考虑,在MRF建模中,选用二阶8邻域系统的Potts模型作为标记场模型,有限高斯混合模型(FGMM)建立观测场,迭代条件模式(ICM)作为最优化分割算法,其中Potts模型中的势函数β改进为可变势函数βb。
2.2.1可变势函数
势函数β的大小对分割结果影响很大。以图4a为例进行分割,选取其中β=0.5和β=5的情况,分割结果如图4(b)和图4(c)。
显然,当势函数β增大时,标记场就越占主导,区域性就越好,分割结果细节也就越差;当势函数β变小时,标记场的影响就弱了,观测场占的比重变大,分割结果细节信息丰富,区域性差。由此引入可变势函数βb,符合“前期着重在区域性的控制,后期集中在细节信息的判断”的规律,势函数应该是逐渐变小的。
综上所述,设计可变势函数如下:
令初始势函数β=1,总迭代次数限制为maxIter,当前迭代次数为Iter,则当Iter<maxIter时,构造可变势函数βb,表达式为:
上式保证在迭代次数Iter增加时,势函数βb是缓慢变小的,并且不会偏离最初由经验确定的β值太多。
2.2.2FISH图像细胞核的提取具体步骤
(1)将原始图像转化为蓝色亮度图;
(2)设定实验图像分类数K=2,初始势函数β=1,最大迭代次数maxIter=10;
(3)应用Kmeans聚类算法得到初始分割;
(4)估计观测场参数μ和σ2;
(5)计算FGMM模型建立的观测场能量;
(6)计算Potts模型建立的标记场能量;
(7)根据能量最小原则,估计新的分割;
(8)判断是否满足迭代终止条件(MAP准则和最大迭代次数),满足则算法停止,得到最佳分割,否则更新势函数βb的值,并重新转入步骤(3)。
2.2.3实验效果
分别用Otsu自动阈值法、传统的Kmeans聚类算法以及本文算法对FISH细胞图像进行分割,效果如图5所示。可以看出,本文算法比前两种产生的分割结果更加连续,且错判产生的孔洞现象更少。这说明:融合了MRF模型的Kmeans聚类分割方法,在兼顾了区域完整性的同时较好地保有了细节信息。而引入可变的势函数βb的优势,在前文已有分析。在判定为细胞核的一些区域内,仍然存在一些细小的孔洞,用前文处理晕染图片时使用的方法修复,效果如图6所示。
3粘连细胞核的分离
对粘连细胞核分离的常用方法主要依据三类原理,分别是:基于数学形态学、基于形状特征以及特定理论的方法。
3.1传统方法
当目标粘连紧密时,应用基于数学形态学的方法通常得不到理想的种子点个数。
基于形状特征原理,主要是采用寻找凹点进而分离的方法。将细胞核的粘连方式分为串联和并联两类,根据每个区域凹点奇偶性或者其他准则,来判断属于哪一类粘连。然后运用不同的凹点匹配策略,进行凹点连线划分。但大部分的方法并没有考虑更加复杂的串并联混合情况,FISH细胞核恰属于复杂粘连情况,同时,FISH细胞核边缘不规则,容易出现“假凹点”。
基于特定理论的方法中,比较适合FISH图像复杂结构的是文献[8]中提出的基于水平集和随机霍夫圆检验方法来分离原生质细胞核。但该算法融入了水平集算法,需要设定的参数非常多,随着粘连细胞核个数的增加和粘连情况的复杂,相应的参数也更加难以全面设置,并且需要用到统计学的霍夫投票法决定区域的分割归属问题,计算量较大,影响了总体分析效率,故不采用。此外,其他文献中基于主动轮廓模型[910]和图论[1112]等方法的改进,都因计算量比较大,不予采用。
3.2本文方法
在Harris和Susan算法的基础上,改进设计出“深度凹陷点”的检测方法,寻找因粘连造成的真正凹陷,同时判断出粘连现象的存在与否。接着,创新引入“自然凹陷力”的概念,令深度凹陷点的凹陷有规律有方向地加深,并逐渐产生区域断裂,最终实现粘连的分离。
3.2.1深度凹陷点检测
本文将角点分为以下4种点情况:钝角凸点、锐角凸点、轻微凹陷点、深度凹陷点。本文定义的深度凹陷点必须满足以下条件:以该角点作为圆形模板的中心,角点的两条线段在目标区域内构成的夹角必须大于225°。
本文设计的深度凹陷检测方法:
(1)设FISH细胞核二值图I中,目标(细胞核区域)标记为1,背景标记为0,同时构造半径R=5的圆形模板M,模板内标记为1的像素点总个数为MMAX;
(2)利用Harris角点检测算法对I进行扫描,得到一个角点集合J(j1,j2,...,jn);
(3)将圆形模板M的中心与J(j1,j2,...,jn)逐点重合;
(4)借鉴Susan算法的思想,得到每一个角点位置上的USAN值MUSAN;
(5)当MUSAN>5/8×MMAX时,该角点判定为深度凹陷点,存入集合H中,用于下一阶段运算。
3.2.2粘连判断
当某个目标连通区域内存在深度凹陷点时,该区域存在粘连现象,需要实现细胞分离,否则是独立细胞核。
3.2.3自然凹陷力
设想:在现实世界中,要让这些粘连的细胞核产生分离,可以对每一个深度凹陷处施加作用力,要求该作用力的大小一致,方向顺应每个凹陷处的凹陷方向,这样在凹陷处就会不断地加深凹陷程度,粘连的细胞核们也会逐渐被挤压得分离开。当某几处作用力汇集到一点时,该局部的粘连区域就被分离;当图像中所有深度凹陷处施加的作用力都汇集到某一处时,则粘连部分被完全分离。
为了满足实时性的需求,本文采用纯几何的线性思想来模拟自然凹陷力的作用,如图7所示。
本文设计的自然凹陷力具体作用过程为:
(1)取深度凹陷点集合H(H1,H2,...,Hn);
(2)定位至其中一点Hi(i=1,2...,n),以该点为圆心、R=8(多次实验的经验值)为半径构造一个圆,设该圆交Hi两条边的交点分别为J1和J2;
(3)作线段J1J2的中垂线(图中HiHi′→所指的方向即为凹陷方向),在目标内交圆于Hi′点,将凹点Hi移动至Hi′,则该凹陷局部区域的边界,由原先的弧J1Hi⌒和弧HiJ2⌒,变为由线段J1Hi′和线段Hi′J2 构成,实现该区域凹陷程度的加深;
(4)逐个定位至H中的其他点,重复步骤(2)和(3),遍历一轮后,将产生的集合H′作为新的凹陷点集合H,完成一轮自然凹陷力作用;
(5)定位至更新过的Hi点,重复步骤(2)~(4),直至新产生的Hi′不再在目标内时,停止Hi点的继续凹陷,跳至H中的其他点继续操作,直至所有的H′都在背景中时(表示粘连产生的凹陷区域都完成分离),停止所有操作。
3.2.4本文粘连分离方法
(1)读取一张原始FISH细胞核图Iy;
(2)利用前文设计的方法,将Iy分类并预处理为理想图I,使用前文设计的细胞核提取方法,将I中的细胞核提取出来,并将图像转化为二值图I0;
(3)对I0做边界提取,记录目标初始边缘ED0;
(4)利用半径R=3的近圆形结构元素SE,对I0图像做腐蚀运算,分离轻微粘连的细胞核;
(5)利用前文设计的“深度凹陷检测方法”,检测出当前图中深度凹陷点,存入集合H;
(6)利用前文“自然凹陷力”,逐点加深H点处的凹陷,最终使得细胞核粘连区域全部得以分离;
(7)对分离后的各个区域进行连续粗化运算(保持不连通性),使各个区域复原成原始大小,直至区域边缘达到ED0的极限,且结果不再变化为止;
(8)对当前二值图I0做边界提取,记录当前目标的边缘ED,则ED为细胞核的分离界线;
(9)将分离界线转化为红色,叠加于图像I上,作为输出结果。
3.2.5实验效果
分别选取“简单粘连”和“复杂粘连”的FISH细胞核图像进行分离实验,结果如图8、图9所示,实验效果理想。
4细胞核计数和信号点提取
4.1细胞核计数
读取一张经过粘连分离后的细胞核二值图I0,继而计算标记为目标(标记为1)的连通区域数,即为细胞核个数。
4.2信号点提取
红色信号点的提取方法:先将G和B的值减为0,得到R红色荧光图,再通过阈值分割和极限腐蚀法得到几何中心,用于后续分析。同理,可用于绿色信号点的提取。
5结论
系统主要实现4个功能:(1)FISH图像预处理;(2)FISH细胞核的提取;(3)粘连细胞核的分离;(4)细胞核技术和信号点提取。上述设计,都在满足精确度和视觉效果要求的范围内,尽可能构造计算量小、直观性强的方法。但仍存在着不足:无法实现某些特殊情况下的粘连分离,比如在细胞核严重团簇、细胞核发生多层粘连时,内层细胞核相互挤压,没有形成凹陷,使之无法分离。这有待进一步改善。
参考文献
[1] 柳威, 谢凤, 陈临溪. CAbl在肿瘤发生及治疗中的重要作用[J]. 临床与病理杂志, 2012, 32(6):516-523.
[2] 唐磊. 基于肿瘤分类与生长建模的癌症药物疗效预测平台设计与应用[D]. 合肥:中国科学技术大学, 2012.
[3] 杨泽新.基于颜色和形状的图像检索技术研究与实现[D].武汉:华中科技大学,2006.
[4] 许新征,丁世飞,史忠植,等 .图像分割的新理论和新方法[J].电子学报,2010,38(Z1):76-82.
[5] 刘国英. 基于Markov随机场的小波域图像建模及分割[M]. 北京:科学出版社, 2010.
[6] 白雪. 基于三马尔可夫场的SAR图像分割[D]. 西安:西安电子科技大学, 2012.
[7] 段汕, 陈晓惠, 郑晨. 基于区域特征的模糊多尺度Markov模型在纹理图像分割中的应用[J]. 中南民族大学学报(自然科学版), 2010, 29(3):93-99.