第35卷第2期2009年3月              光学技术
OP T ICA L T ECHN IQ U E
V ol.35No.2
M arch 2009
文章编号:1002
-1582(2009)02-0292-03基于对称特征相似性的图像识别算法研究
X
霍云,宗光华,孙明磊,张杰,毕树生
(北京航空航天大学机械工程及自动化学院,北京 100083)
摘 要:研究了一类微小生物)))线虫的图像识别算法。首先对图像进行边缘检测、二值化和去除干扰点等操作,得到线虫的身体轮廓线;然后利用其身体的对称特征,通过比较相邻线段的相似性实现对线虫的识别及对干扰的区分。实验结果表明,此算法优于骨架法、面积法等典型图像识别方法,对线虫的检测
和定位具有很高的准确度和快速性,并可应用于其它具有对称特性的微小生物的图像识别。
词:视觉;图像;对称;相似性;识别
中图分类号:T P242.6+2  文献标识码:A
Image recognition algorithm based on symmetric similarity
H UO Yun ,ZONG Guang -hua,SU N Ming -lei,ZH AN G Jie,BI Shu -sheng
(School of M echanical Eng ineering and Automation,Beijing U niv ersity of Aeronautics and Astronautics,Beijing  100083,China)
Abstract:A new image recog nition alg orithm for a small creatures )))caenorhabditis elegans is developed.T his metho ds first use edge detection,binarizat ion and other methods to g et the body contours of caenorhabditis eleg ans.T hen using its body symmetry,caenor habditis elegans is r ecog
nized by comparing similar ity of consecutive lines in imag e.T he exper imental r esult shows t he high positioning accuracy and rapidity of t he proposed algorithm.T his method can also be applied to other pro perty recog nit ion from the biolog ical imag e of creatures wit h sy mmetric body.
Key words:visual;imag e;symmetry;similarity;r ecognition
1 引 言
筛选操作是生物工程研究的一种常用技术。微小生物的筛选操作可分为/软筛选0和/硬筛选0两个层面。硬筛选是指对操作对象进行物理操作,如注射、切割、夹持、吸附等;软筛选是指对操作对象进行个体识别、特征识别(如长度、直径、死活等)、特征信息统计等。后者不仅要实现对操作对象的定位,而且还要对图像特征进行理解,体现了更高层次的认知功能。理想的软筛选操作应具备在微小生物活体的整个生命周期内对其身份进行准确、快速辨认的能力。
秀丽线虫(Caenorhabditis elegans,简称线虫)是生物医学研究中的一种重要的模式生物,其幼虫长约为80L m,宽约为20L m,成虫长为500~1200L m,宽为60~120L m 。目前,在面向生物工程微操作领域中的研究对象一般为细胞或染体[1,4],对与线虫大小相仿的微小生物活体的软筛选研究还开展得较少。
线虫图像特征是:生长在膏状培养基中,背景混乱,培养基中的气泡面积与线虫身体面积近似,干扰
旅游景点排行榜前十名
了判断;单皿中存在不同年龄的线虫,其身体形态各
不相同,常出现自身缠绕和与其它线虫交叠或身体钻入培养基中等复杂情况,故在处理中身体边缘呈若干不连续的线段。因此,细胞识别中常用的区域面积测算识别法[4]
、骨架抽取法[3]
、染体识别常用的模版匹配法[1]、中轴法[5]等都不适用于线虫识别。
本文抓住线虫身体存有高度对称性这一特征,先经过图像分析得到其身体轮廓线一侧的链码值,然后通过比较相邻线段链码值的相似系数来识别出线虫。此算法既能够正确区分线虫与培养基气泡,还原线虫身体轮廓,还可用于对其它含有对称特性的生物体的辨识。
2 线虫生命周期检测系统的构成
本文所涉及的线虫生命周期检测系统是辅助实验人员对线虫进行RNAi 实验的,能够完成从实验前的铺板、注射林肠杆菌到实验中的线虫死活的判断、尸体分拣和实验数据记录的全自动化。可将实验人员从大量繁琐枯燥的工作中解放出来,提高了实验效率。系统的完整流程图如图1所示。
292
X 收稿日期:2007-08-21    E -mail:hdbs00@yahoo
作者简介:霍云(1982-),女,北京市人,北京航空航天大学机械工程及自动化学院硕士研究生,主要从事图像处理方面的研究。
图1线虫生命周期检测系统流程图
视觉系统是整个系统的核心与关键,所要完成的任务首先是识别培养皿中(约为100条)的线虫,判断其生命状态(死亡、存活),而后获得死亡线虫的具体位置信息。
视觉系统由硬件和软件两大部分组成:
(1)硬件部分由显微镜、摄像头、图像采集卡和图像处理计算机构成。其中显微镜为倒置生物显微镜OLYM PUS IX70,选用的放大倍率为4倍;CCD 摄像头为JVC TK1270E,输出标准为视频信号PAL 制25帧/s,视场大小为600L m@450L m,分辨率为0.872L m;图像采集卡为Matrox-CronosPlus;图像处理计算机为台湾研华科技/Advantech工控机IC-6908P4。
(2)软件部分由图像获取、自动聚焦、预处理、特征识别、位置标注、信息输出等部分构成。
3图像预处理
所采集的线虫图像由于各种因素的影响会出现反差不够理想、背景上有污点等干扰,故识别之前需进行图像预处理。具体步骤为:
(1)边缘检测及二值化。经比较,选择高斯-拉普拉斯(LoG)算子进行边缘检测。它结合了高斯算子的滤波特性与拉普拉斯算子的边缘提取特性,图像先经过高斯滤波器将噪声过滤掉,边缘探测器将梯度值最大的部分作为图像边缘以降低边缘扩散造成的影响。预处理后得到的是包含较多干扰的二值图像,背景为白。
(2)运动目标检测及图像分割。检测运动目标的方法主要有光流法和差图像法。光流法耗时长,实时性和实用性较差。差图像法原理比较简单,即通过对当前连续两幅图像做差分运算来进行目标的运动识别[4]。根据实验和测算,成年线虫的游动速度为0.2mm/s,可间隔1s对采集到的两帧图像进行差分。由于本系统只关心死亡线虫的具体位置,故可对图像进行分区,不关心只有存活线虫的区域,重点判断其它区域中死亡线虫的存在与位置。4线虫的特征识别
影响线虫识别的最大因素是培养基内的气泡,气泡边缘长度与线虫身体长度相近,且包围面积与线虫身体面积也近似相等。通过观察发现,线虫的身体是完全对称的,虽然经过预处理后不能得到线虫边缘的完整包络曲线,但其身体两侧的线段也存在极高的相似性,而且气泡边缘曲线周围没有与其很相似的曲线,通过这一特点能够很清楚地区分线虫身体曲线及其气泡边缘曲线。
线虫识别算法的步骤如下:
(1)对图像进行逐行扫描。第一次扫描:去除孤立点和分叉点后对其进行图像边缘细化。经过图像预处理后得到的二值图像中包含许多有分叉的线段,首先要去除分叉点,使图中仅含单支线段以方便操作。为便于算法描述,在每一个像素点周围定义一个八邻域模型,如图2所示。其周围8点只有三种情况:周围只有一点是黑,此点为线段起始点或终止点;周围有两点是黑,此点为线段中间点;周围有三点或三点以上是黑,此点为交叉点或分叉点。其中满足分叉点特征条件的有9
种,如图3
所示。通过模板匹配可将
分叉点一一去掉,使图像成为完全的
单像素宽边缘[2]。
P3P2P1
P4P P0
P5P6P7
图2八邻
域模型
图3分叉点模板
100222220000
010*********
001101000200
330101000020
030100100020
030011002200
003000020000
图4线段的依次标号
第二次扫描:检测线段,去除干扰短线段,记录长线段的位置信息及中点坐标,确定线段链码。其步骤为:逐行扫描,到线段起始点,给出其标号;按像素点邻域情况依次判断出线段的走向,沿其走向给这一线段标上同一标号,一条线段标注完毕后回到起始点继续逐行寻下一个起始点,如图4所示;确定线段链码,线段链码是非常重要的数据,它不但能够表示线段的长度,而且还能表示其走向,物体的有些特征必须通过它们来进行识别。本文使用8连通区域链码(也称Freeman码)[2],链码值的定义见图5。当到一起始点后沿线段走向按顺序逐
293
第2期霍云,等:基于对称特征相似性的图像识别算法研究
图5 8联通链码
点确定出链码值直至终止点,之后再回到起始点继续按水平扫描顺序查下一个起始点,确定下一线段的链码值,其过程如图6所示。
(2)计算相邻两条线段的相似性,对每条虫身保留相似性最高的两条线段信息,
计算虫身中点坐标图6 图像边缘跟踪(链码为0671707611)
并做十字标记。
具体方法为:首先提取一条线段的所有点信息,在起始点周围寻是否存在其它线段,如有则提取该线段
的点信息。以两线段中较短线段为基准,利用两线段的链码值计算其相似性。计算两相同长度线段相似系数的公式为[7]
r =
E n i =1E n
i=1
qq闪退(A i -
A )(
B i -B )
[
E n i=1E
n
i=1
(A i -A )2][
黄海波嫖娼被拘
E n i =1E
n
i=1
(B i -B )2]
式中:[A 1,,,A n ]和[B
吴昕杜海涛结婚
1,,,B n ]分别为两线段的链码值;A =
E n
i=1
A i /n;
B =E n
i =1
B i /n 。相似系数越
接近1,两线段形状越相似。
图7 线虫识别算法流程图
在本文所研究的图像中,一般两线段长度并不相等。这时可先在较长线段的链码值中从头截取与短线段链码相同长度的链码值来计算相似系数,然后再依次向后移动1位,取相同长度的链码值来进行计算,直至取完较长线段的所有
桃花源记古今异义词
链码值为止。
如较短线段有n 个链码值,较长线段有m 个链码值,则共需计算(m -n +1)次相似系数,最后比较所有相似系数,以值最大的一组作为两线段的相似系数。由于线虫的身体具有对称性,同一线虫身体的两轮廓线相似程度显著,相似系数大,而不同线虫身体的轮廓线或线虫身体轮廓线与气泡轮廓线的相(a)
似系数小,故可用此方法判断两线段是否属于同一线虫。根据相似性定义,当相似系数大于017时相似程度高,故取017作为判断阈值。识别算图8 线虫识别算法
中各步骤的结果
(a)原始的采集图像;(b)预处理后的图像;(c)最终识别结果。
法的流程图如图7所示。
图像的复杂程度决定了算法的处理时间。根据测算,在上述线虫识别定位算法中,单帧图像算法处理周期小于012s,远远高于人工分拣的速度。
5 线虫识别实验
图8给出了一次线虫识别实验的图像处理结果(图中共含6条死亡线虫),表1给出了实验中的线段相似性计算结果。
表1 图像线段相关系数的比较
气泡3气泡4虫1线段a 虫2线段a 虫3线段a
气泡10.01410.15650.0180气泡20.02900.11110.3541虫1线段b 0.19600.11370.82600.15650.0601虫2线段b 0.03360.09030.22130.73630.1339虫3线段b 0.09030.15700.06010.02120.7409
从表1可以看出:属于同一线虫身体的两线段相似系数都大于0.7,远比不同线虫身体的两线段或线虫身体曲线与气泡轮廓线的相似系数大很多,这也验证了本算法的有效性和可行性。
在20天的时间内,通过在10个培养皿中的多次实验可知,此算法能够准确定位各种复杂环境下的线虫尸体位置,准确率为98%,并且具有很好的实时性、有效性和一定的鲁棒性。
表2 三种算法结果的比较
实验1实验2实验3实验4实验5实验6实验7实际数
3612124本文方法3612124骨架方法5813144面积方法
4912133
为进行比较,分别使用骨架提取法和面积比较
法对7幅线虫图像进行了识别,其结果见表2。由表2数据可见,由于气泡干扰和其它因素的影响,使用其它两方法判断不能得到很好的结果,这表明本文提出的基于对称特征相似性的线虫识别算法更加准确。
(下转第298页)
294
PSNR B ,其中当C =0.001时PSNR R 最大,比模糊图像PSNR B 提高了6dB 以上。由此可见,在维纳滤波方法中选择适当的功率谱密度比参数可以收到明显的恢复效果。
从图4曲线对比结果还可以看出,在离焦半径R 较小时,模糊图像的峰值信噪比PSNR B 下降较快,随着离焦半径的增加,PSNR B 变化趋于平缓;复原图像的峰值信噪比PSNR R 也有相同的趋势。
图5为测试图像。其中图5(a)是原始图像,图5(b)是离焦半径R =5的模糊图像,图5(c)至图5(e)分别显示了使用功率谱密度比C =0.00001,0.001,0.1时的复原结果图像。对比图像可以看出,图5(b)的模糊效果比较明显。在复原结果图像中,当C 较小时,恢复图像噪声较大;当C 较大时,虽然抑制了噪声,但模糊现象还有残余,同时也带来了明显的/振铃效应0
(a)          (b)          (c)          (d)          (e)
图5 Lena 图像恢复实验结果
5 结 论
本文重点讨论了离焦误差对光学系统的影响及模糊图像的逆滤波和维纳滤波复原方法,采用维纳滤波方法进行了图像复原的对比实验。理论分析和测试实验结果表明,离焦误差使得成像系统光学传递函数衰减,信息传递能力下降,导致图像模糊。通过建立图像模糊模型,采用图像复原技术,可以解决由于离焦误差造成的图像模糊问题,可较好地恢复原始图像,能有效地提高图像质量。
逆滤波和维纳滤波算法简单,使用灵活,有较高的恢复精度。在图像复原性能方面有如下特点:
(1)逆滤波方法对图像特征恢复效果较好,对噪声比较敏感。(2)维纳滤波在处理光学传递函数在零点附近的噪声放大问题比较有效,通过选择适当参数,可以有效地消除或抑制噪声和/振铃效应0。参考文献:
[1]Kenneth R Castleman.数字图像处理[M ].北京:电子工业出版
社,2004.
[2]HOCK LIM ,KAH -CHYE TAN,AND B T G T AN.Edge errors
in inverse and w iener filter restorations of moti on -bl urred images and their w indow ing treatment[J].CVGIP,1991,53:186)195.[3]KAH -CHYE TAN,HOCK LIM ,AND B T G TAN.Restoration
of Rea-l World M otion -Blurred Images [J ].CVGIP,1991,53:291)299.[4]C he -Yen Wen,Chien -Hsiung Lee.Point Spread functions and their
application to forensic image restoration[J].Forensic Science Jour -nal.2002,(1):15)26.
[5]Joseph W Goodman.傅里叶光学导论(第三版)[M ].北京:电子
工业出版社,2006.
[6]宋华丰.现代空间光电信息处理技术及应用[M ].北京:国防工
业出版社,2004.
(上接第294页)
6 结 论
本文提出了一种基于对称特征相似性的秀丽线虫图像识别算法,该算法利用线虫身体具有对称性这一特点,只须对图像扫描两次即可完成对图像的各种复杂线段的标号、去除多余线段和计算相似性等工作,同时可得到虫身线段点信息及对应边界链码值,为后续处理提供数据准备,定位准确率达到了98%,算法所用时间在0.2s 以下,具有较高的效率。
这一算法已在秀丽线虫生命周期检测系统样机开发中得到了应用,今后还可加入线虫轮廓恢复以及对活体线虫的跟踪定位算法等,使系统的图像识别过程更加完善。参考文献:
[1]张斌,赵卫东,马世雄.人类显带染体的图像分析与识别系统
[J].中国图像图形学报,1996,1(5,6):148)150.[2]M ilan S onka,Vaclav Hlavac,Roger Boyle.图像处理、分析与机器
视觉(第二版)[M ].北京:人民邮电出版社,2003.30)31,157)178.
[3]阳波,王卫星,李彦文.基于骨架的血细胞图像分离算法[J].计
算机工程与应用,2003,16:94)97.
[4]刘印峰,王宝华,胡平.CD4细胞显微图像的分析与识别研究
[J].中国医学仪器杂志,2005,29(6):419)422.
[5]汪建.一种寻C 带染体中轴的方法[J].四川大学学报(自
然科学版),2004,41(6):768)773.
[6]秦涛,周泽魁.一种检测序列图像中运动目标的新方法[J ].计
算机应用与软件,2004,21(9):105)107.
[7]王晓丹,吴崇明.基于M ATLAB 的系统分析与设计)))图像处
理[M ].西安:西安电子科技大学出版社,2000.57.
298