• 
    <ul id="auswy"><sup id="auswy"></sup></ul>
  • <ul id="auswy"></ul>
    ABB
    關(guān)注中國(guó)自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
    CAIAC 2025
    2025工業(yè)安全大會(huì)
    OICT公益講堂
    當(dāng)前位置:首頁(yè) >> 案例 >> 案例首頁(yè)

    案例頻道

    DNA芯片圖像的自適應(yīng)提取
    • 企業(yè):控制網(wǎng)     領(lǐng)域:人機(jī)界面     行業(yè):建筑樓宇    
    • 點(diǎn)擊數(shù):1840     發(fā)布時(shí)間:2011-02-24 09:52:56
    • 分享到:
    軟件內(nèi)嵌探針測(cè)試是在探針函數(shù)模板的框架內(nèi)編寫被測(cè)對(duì)象,并對(duì)被測(cè)對(duì)象進(jìn)行面向?qū)ο筌浖某R?guī)測(cè)試,在觀察預(yù)期結(jié)果與實(shí)際結(jié)果是否一致的同時(shí),還要察看探針函數(shù)輸出的信息,以確定對(duì)象的狀態(tài)是否正確。本論文研究的重點(diǎn)在于探針函數(shù)的構(gòu)成、探針函數(shù)的實(shí)現(xiàn)及內(nèi)嵌探針測(cè)試方法的應(yīng)用研究,意在構(gòu)筑一個(gè)基本的應(yīng)用框架,提供一種實(shí)用的測(cè)試方法。

        (廈門大學(xué)自動(dòng)化系模式識(shí)別與智能系統(tǒng)研究所,福建 廈門 361005)陳福振,陳光磊
                         
        陳福振(1985-)男,福建莆田人,廈門大學(xué)自動(dòng)化系碩士研究生,主要從事模式識(shí)別與智能系統(tǒng)方面的研究。
    基金項(xiàng)目:福建省自然科學(xué)基金(2009J05153)

        摘要:軟件內(nèi)嵌探針測(cè)試是在探針函數(shù)模板的框架內(nèi)編寫被測(cè)對(duì)象,并對(duì)被測(cè)對(duì)象進(jìn)行面向?qū)ο筌浖某R?guī)測(cè)試,在觀察預(yù)期結(jié)果與實(shí)際結(jié)果是否一致的同時(shí),還要察看探針函數(shù)輸出的信息,以確定對(duì)象的狀態(tài)是否正確。本論文研究的重點(diǎn)在于探針函數(shù)的構(gòu)成、探針函數(shù)的實(shí)現(xiàn)及內(nèi)嵌探針測(cè)試方法的應(yīng)用研究,意在構(gòu)筑一個(gè)基本的應(yīng)用框架,提供一種實(shí)用的測(cè)試方法。

        關(guān)鍵詞:軟件內(nèi)嵌探針;探針函數(shù);測(cè)試

        Abstract: his article studies the automatic extraction of gene chip image information. In view of the difficulties in automatic processing, such as the huge number of the DNA spots, the low resolution ratio and the anomalous contour, this article proposes an automatic image division algorithm provided with high efficiency in spot localization and compact spot outline edge. Through the effective selection of structure operator, the nimble application multi-layer mathematics morphology's transformation, and the automatic binaryzation using the difference and standard deviation, this algorithm can automatically read genome image information. Through many experiments of reading genome image information, we also show that this algorithm obtain a compact image segmentation and high precision, in which its relative error with commercial software is less than 5%.

        Key words: DNA chip; Mathematics morphology; Image segmentation

        1 引言

        微陣列芯片,又稱為基因芯片,它將大量DNA探針分子或經(jīng)純化的蛋白分子通過(guò)點(diǎn)樣固化于玻片上,構(gòu)成高密度的分子陣列,再利用特定的儀器對(duì)樣本進(jìn)行掃描成像[1]。基因芯片的每個(gè)樣點(diǎn)表達(dá)了一定的生物信息,微陣列芯片技術(shù)可對(duì)成千上萬(wàn)的基因進(jìn)行并行分析,該技術(shù)廣泛應(yīng)用在疾病診斷、藥物篩選及基因測(cè)序等生命科學(xué)領(lǐng)域。完整的微陣列生物芯片分析過(guò)程包括樣本采集、芯片制備、掃描成像、圖像處理和數(shù)據(jù)分析等幾個(gè)部分,其中圖像處理的目的是準(zhǔn)確地提取基因表達(dá)的熒光信號(hào)強(qiáng)度值,為后續(xù)的分析提供數(shù)據(jù)基礎(chǔ),圖像處理提取的信息正確與否,直接決定后續(xù)數(shù)據(jù)分析的意義。

        傳統(tǒng)的基因芯片圖像處理主要包括基因點(diǎn)定位和信息提取兩個(gè)步驟,基因點(diǎn)定位分為網(wǎng)格定位和斑點(diǎn)分割,用于確定各基因點(diǎn)的位置,信息提取是在分割出基因點(diǎn)與背景區(qū)域后對(duì)該點(diǎn)的亮度表達(dá)值進(jìn)行計(jì)算。

        由于原始圖像中的熒光斑點(diǎn)以矩陣形式排列,故傳統(tǒng)的基因點(diǎn)定位方法,大多是先做傾斜校正,然后定位斑點(diǎn)的矩形區(qū)域(網(wǎng)格定位),再分割出更緊湊的斑點(diǎn)邊緣區(qū)域(斑點(diǎn)分    割)。在網(wǎng)格定位方面,主要有基于投影的網(wǎng)格定位[2,3],該方法運(yùn)算速度快,但容易受噪聲影響,導(dǎo)致定位失敗。基于爬山法的網(wǎng)格定位[4],通過(guò)尋找局部最優(yōu)方式逐步迭代來(lái)進(jìn)行網(wǎng)格定位,初始點(diǎn)的設(shè)定將直接影響計(jì)算結(jié)果。基于馬爾可夫隨機(jī)場(chǎng)的網(wǎng)格定位方法[5]利用不同應(yīng)用限制和啟發(fā)式規(guī)則進(jìn)行網(wǎng)格定位,需要給定每個(gè)網(wǎng)格內(nèi)基因的行列數(shù)和網(wǎng)格行列數(shù)。基于遺傳算法的網(wǎng)格定位[6]通過(guò)計(jì)算間距和初始行列位置進(jìn)行網(wǎng)格定位,需要設(shè)定較多參數(shù),運(yùn)算耗時(shí)。

        網(wǎng)格定位后,對(duì)斑點(diǎn)進(jìn)行分割的方法有固定圓形法[7,8],采用固定圓形方式進(jìn)行鄰域搜索,不適用于其他形狀的基因點(diǎn)分割;自適應(yīng)圓形法[9]利用大小可變的圓形進(jìn)行鄰域搜索分割,但受點(diǎn)樣探針形狀及點(diǎn)樣過(guò)程玻片滑動(dòng)等因素的影響,難以找到非絕對(duì)圓形的基因點(diǎn);自適應(yīng)形狀法以分水嶺算法或種子區(qū)域生長(zhǎng)算法為基礎(chǔ),可進(jìn)行可變形狀的基因點(diǎn)分割,但該方法種子選取困難、標(biāo)記迭代次數(shù)多、復(fù)雜度高;肖松山對(duì)圓形定位處理過(guò)程進(jìn)行了分類討論,將樣點(diǎn)分成“圓域、圓環(huán)和不規(guī)則區(qū)域三類”,并提出相應(yīng)的“模板匹配法,霍夫變換法和形心法”等三種自動(dòng)識(shí)別算法,但該文獻(xiàn)還是以圓形作為基本模板進(jìn)行處理,變換所用的算法復(fù)雜度較大,實(shí)驗(yàn)結(jié)果并沒有與商業(yè)軟件進(jìn)行對(duì)比或?qū)⑵渑c最終的表達(dá)數(shù)據(jù)進(jìn)行分析;直方圖分割法利用一個(gè)比任何靶點(diǎn)都大的目標(biāo)模板對(duì)待分割區(qū)域進(jìn)行套框操作,對(duì)每個(gè)套框中的像素點(diǎn)進(jìn)行直方圖分析,按照預(yù)定義的光密度比率分割出信號(hào)和背景,該方法的優(yōu)點(diǎn)在于算法簡(jiǎn)便、速度快,缺點(diǎn)是目標(biāo)模板的大小對(duì)分割結(jié)果有較大影響,造成穩(wěn)定性差、重復(fù)性不好,此外,該方法的分割結(jié)果往往會(huì)得到一個(gè)非連通的前景區(qū)域,與點(diǎn)樣的實(shí)際結(jié)果不符合,對(duì)于弱信號(hào)靶點(diǎn)的分割,直方圖分割法的缺點(diǎn)表現(xiàn)得更為明顯,應(yīng)用仍較少。

        綜上所述,現(xiàn)有的基因芯片圖像處理方法普遍存在如下幾個(gè)問題:(1)自動(dòng)化程度低,每種方法都涉及到多個(gè)參數(shù)的預(yù)設(shè),有些參數(shù)是隨機(jī)的,有些參數(shù)是與圖像相關(guān)的;(2)靶點(diǎn)分割不準(zhǔn)確,由于傳統(tǒng)方法采用的是網(wǎng)格定位后進(jìn)行基因點(diǎn)分割,網(wǎng)格定位的誤差將直接向后累加,導(dǎo)致基因點(diǎn)分割失敗。基于此,考慮到數(shù)學(xué)形態(tài)學(xué)的基本思想是用具有一定形態(tài)的結(jié)構(gòu)元素去量度和提取圖像中的對(duì)應(yīng)形狀,以達(dá)到對(duì)圖像分析和識(shí)別的目的。因此根據(jù)基因斑點(diǎn)自身不規(guī)則的形態(tài)特征,本文提出了基于數(shù)學(xué)形態(tài)學(xué)的基因芯片圖像分割方法,在閉運(yùn)算對(duì)斑點(diǎn)周圍進(jìn)行噪聲清除的基礎(chǔ)上,結(jié)合開運(yùn)算對(duì)斑點(diǎn)的形態(tài)進(jìn)行修復(fù)彌補(bǔ),最終緊湊地進(jìn)行斑點(diǎn)分割。本文的方法實(shí)現(xiàn)了基因芯片圖像的形態(tài)學(xué)分析和自適應(yīng)二值化,大大提高了圖像分析和處理的速度與精度。

        2 圖像的自適應(yīng)提取

        2.1 流程改進(jìn)

        基因芯片圖像處理的一種常用方法是投影法,處理步驟如表1,由于受噪聲等影響,很容易產(chǎn)生矩形框誤定位,從而導(dǎo)致基因點(diǎn)分割錯(cuò)誤,如圖1所示。大塊高亮噪聲會(huì)導(dǎo)致矩形框定位冗余,此外,矩形框定位有時(shí)會(huì)壓在基因點(diǎn)上,如果再在矩形框內(nèi)進(jìn)行圓形定位,可能會(huì)導(dǎo)致基因點(diǎn)不完整,或完全找不到基因點(diǎn)。
                           
                                          表1 處理步驟對(duì)比
                              

                           
     
                             

                                            圖1  投影法誤定位情況 

        為避免投影網(wǎng)格定位產(chǎn)生的誤定位問題,本文提出一種新的基因點(diǎn)分割方法,如表1所示。為使離散的斑點(diǎn)進(jìn)一步豐滿起來(lái),方便精確地刻畫其邊緣,引入了數(shù)學(xué)形態(tài)學(xué)方法,在對(duì)其增強(qiáng)的基礎(chǔ)上,利用差分運(yùn)算獲取分割閾值進(jìn)行斑點(diǎn)與背景的分離,從而確定基因點(diǎn)進(jìn)行數(shù)據(jù)讀取。

        2.2 自適應(yīng)圖像增強(qiáng)

        傳統(tǒng)的圖像增強(qiáng)方法一般采用灰度映射法,需要設(shè)定較多閥值來(lái)界定輸入輸出的灰度范圍,并需要反復(fù)實(shí)驗(yàn)提取經(jīng)驗(yàn)值。為提取斑點(diǎn)自身的不規(guī)則形態(tài)邊緣,并去除斑點(diǎn)邊緣離散噪聲的影響,利用形態(tài)學(xué)的開閉運(yùn)算進(jìn)行處理。應(yīng)用閉運(yùn)算來(lái)填充斑點(diǎn)內(nèi)細(xì)小空洞、連接鄰近像素點(diǎn)、平滑其邊界的同時(shí)并不明顯改變其面積。再應(yīng)用開運(yùn)算消除離散噪聲像素,在纖細(xì)點(diǎn)處分離斑點(diǎn)與噪聲。此外,由于數(shù)學(xué)形態(tài)學(xué)的開閉運(yùn)算具有極值濾波功能,開運(yùn)算增大了谷值,擴(kuò)展了峰頂,是極大值濾波;閉運(yùn)算減少了峰值,加寬了谷域,是極小值濾波。基于此,本文提出一種自適應(yīng)圖像增強(qiáng)算法如下:

          (1)用原圖像減去開運(yùn)算后的圖像獲得峰值,   ,其中f 為原始圖像,r 代表開運(yùn)算, B為結(jié)構(gòu)算子

        (2)用閉運(yùn)算后的圖像減去原圖像獲得谷值,

          (3)增強(qiáng)圖像為 

        應(yīng)用數(shù)學(xué)形態(tài)學(xué)進(jìn)行圖像增強(qiáng)處理的關(guān)鍵在于結(jié)構(gòu)算子的選擇,由于DNA芯片與經(jīng)過(guò)熒光標(biāo)記的樣品雜交后,產(chǎn)生的熒光圖像中包含一系列類圓形的斑點(diǎn),故選擇圓形結(jié)構(gòu)算子,其直徑為基因點(diǎn)直徑。增強(qiáng)效果對(duì)比情況如圖2所示。 

                      
                        (a) 原圖部分區(qū)域   (b)傳統(tǒng)圖像增強(qiáng)效果   (c)本文方法增強(qiáng)后的效果  

        2.3 自適應(yīng)二值化圖像分割

        形態(tài)學(xué)增強(qiáng)后的斑點(diǎn)邊緣基本清晰可見,可以較容易地提取出邊緣。但為了后續(xù)數(shù)據(jù)進(jìn)行斑點(diǎn)連通域索引,需要對(duì)圖像進(jìn)行二值化處理。把斑點(diǎn)區(qū)域像素位置記為1,把背景像素位置記為0。這樣可以省去很多邊緣提取的復(fù)雜計(jì)算,又為后續(xù)圖像分割減少計(jì)算量。

            由形態(tài)學(xué)增強(qiáng)后的圖像直方圖可見,如圖3a所示,雖然沒有明顯的雙峰效果,基本是呈一個(gè)下降的趨勢(shì),且有從陡到平的過(guò)渡過(guò)程,很難用常規(guī)閾值分割方法進(jìn)行處理。 從直方圖中圖像背景的大范圍分布可以看出其對(duì)應(yīng)灰度值的集中性,此外,在坡度放緩之后有一段較為平整的灰度帶,表明各個(gè)斑點(diǎn)雖然內(nèi)部灰度值區(qū)別較大,但總要經(jīng)過(guò)一個(gè)灰度值從背景與斑點(diǎn)內(nèi)部的過(guò)渡。    因此,本文提出利用灰度的一階差分來(lái)觀察灰度值之間的變化趨勢(shì),從而找出分割閾值,圖3b給出了灰度的一階差分效果。 

                    
                                     (a)  區(qū)塊對(duì)應(yīng)直方圖
                    
                                  (b)  區(qū)塊對(duì)應(yīng)直方圖一次差分效果,箭頭為閥值點(diǎn)  

        (b)對(duì)區(qū)塊直方圖一次差分效果,箭頭為閥值點(diǎn)圖3 對(duì)圖1所在22×22整個(gè)區(qū)塊進(jìn)行形態(tài)學(xué)變換后的分析結(jié)果利用標(biāo)準(zhǔn)差來(lái)評(píng)估差分曲線可能的變化或波動(dòng)程度。標(biāo)準(zhǔn)差越大,差分的范圍就越廣,差分的波動(dòng)就越大。
       
                 

          其中, n 為圖像灰度直方圖差分的最大范圍, xi為當(dāng)前點(diǎn)的差分值,x'為平均值。

    但本文并不關(guān)心標(biāo)準(zhǔn)差本身的大小,而是關(guān)心差分序列中的哪個(gè)灰度值開始接近或等于標(biāo)準(zhǔn)差,即能體現(xiàn)背景與斑點(diǎn)的最大差別,并把此灰度值作為二值化的閾值。根據(jù)實(shí)際的差分曲線波動(dòng)由大到小,灰度由背景向斑點(diǎn)過(guò)渡的特點(diǎn),只從小灰度開始搜索,這時(shí)的差分值由比標(biāo)準(zhǔn)差大到比標(biāo)準(zhǔn)差小變化,找到第一次差分序列中絕對(duì)值開始接近(實(shí)際程序取開始小于)標(biāo)準(zhǔn)差的灰度值,即為二值化閥值。具體如下:

          (1)為方便計(jì)算,首先將16位灰度圖轉(zhuǎn)換為8位灰度圖g' =g / 256;

          (2)獲取增強(qiáng)后圖像直方圖dh(g')

          (3)計(jì)算直方圖的一次差分序列sd

        (4)計(jì)算差分曲線的標(biāo)準(zhǔn)差;

        (5)判斷灰度級(jí)下的絕對(duì)差分值與標(biāo)準(zhǔn)差的關(guān)系,如果小于標(biāo)準(zhǔn)差則表示第一次接近標(biāo)準(zhǔn)差,轉(zhuǎn)(6),否則重復(fù)步驟;

          (6)獲取分割閾值。二值化后的基因芯片圖像如圖4a所示。 

                      
                          (a)  對(duì)圖1進(jìn)行二值化的后效果      (b) 形態(tài)學(xué)邊緣提取法  

                                    圖4  圖像提取  

        2.4 數(shù)據(jù)讀取

        對(duì)二值化后的圖像中進(jìn)行0,1索引,對(duì)于每個(gè)連通域,即每個(gè)斑點(diǎn),逢1即以當(dāng)前坐標(biāo)為準(zhǔn)返回原圖讀取像素值,得到如圖4b所示的邊緣提取效果。在背景灰度扣除上,我們利用形態(tài)學(xué)外圍像素的中值作為背景值,該值能較為準(zhǔn)確地說(shuō)明其周邊背景的分布情況,從后續(xù)的實(shí)驗(yàn)分析中我們可以看到此方法確實(shí)效果更好。

        3 實(shí)驗(yàn)分析

        為檢驗(yàn)本文算法的效率與準(zhǔn)確性,我們針對(duì)美國(guó)Baylor醫(yī)學(xué)院提供的10G多的圖像數(shù)據(jù)進(jìn)行對(duì)比實(shí)驗(yàn)。計(jì)算機(jī)仿真實(shí)驗(yàn)在Matlab7下完成。

        3.1 斑點(diǎn)邊緣分割形態(tài)對(duì)比

        圖5為采用投影分割圓形定位法(如著名的GenePix Pro與ScanAlyze軟件)與本文的形態(tài)學(xué)邊緣提取法定位各斑點(diǎn)的對(duì)比效果圖;為使對(duì)比清晰,底層為圖像增強(qiáng)后的圖。  

                       

              (a)投影分割在圖像增強(qiáng)后的效果 (b) 圖形定位在圖像增強(qiáng)后的效果 (c)形態(tài)學(xué)邊緣在圖像增強(qiáng)后的效果
                    圖5  邊緣提取的效果對(duì)比圖  

        從圖5可看出,本文的方法(圖5c)可以更為完整并精確地定位斑點(diǎn)。本文的方法之所以可以更為完整和精確地定位斑點(diǎn),是因?yàn)椋海?)本文的方法由于沒有用到傾斜校正與坐標(biāo)投影,不存在傾斜校正的樣本選取、算法復(fù)雜度的問題和投影分割閥值設(shè)定的問題。(2)本文的方法直接通過(guò)形態(tài)學(xué)的方法圈定其緊湊的類橢圓的緊湊輪廓,而非投影分割法中帶有噪聲的矩形框(圖5a)和需經(jīng)過(guò)圓心定位,半徑取值后再繪制的圓框(圖5b);從圖5中的三組對(duì)比可以清晰地看到一些離散的噪聲點(diǎn)被形態(tài)學(xué)處理后的邊緣輪廓排除在外,而前兩組則無(wú)法將背景像素完全排除在外。(3)本文的方法二值化處理后,只要跟蹤圖像中非0像素,再對(duì)應(yīng)到原圖,即可讀取原像素值;這樣既降低了原來(lái)需要邊緣提取的算法復(fù)雜度,又對(duì)前一步處理留下的噪聲進(jìn)行進(jìn)一步的清除。

        3.2 數(shù)據(jù)提取對(duì)比

        圖6是本文方法對(duì)cy5與cy3的散點(diǎn)圖,圖7是本文的方法與業(yè)界公認(rèn)的權(quán)威分析軟件Bluefuse數(shù)據(jù)讀取的相對(duì)誤差圖。   

                   
                                    圖6  cy5與cy3圖像數(shù)據(jù)散點(diǎn)圖  

          從圖6可看出,散點(diǎn)圖中呈現(xiàn)趨勢(shì)統(tǒng)一的擬合直線,說(shuō)明本文提取的數(shù)據(jù)是較為精確的。另外,數(shù)據(jù)點(diǎn)分布在散點(diǎn)圖零點(diǎn)區(qū)域的多少可體現(xiàn)基因數(shù)據(jù)提取的完整度。從圖6的零點(diǎn)區(qū)域散點(diǎn)稀少也可以看出本文提取數(shù)據(jù)的完整度較高。從圖7可以明顯看到本文方法與Bluefuse軟件的相對(duì)誤差基本保持在0.05以內(nèi),并集中在0.02左右,較為充分地說(shuō)明了本文方法算法的準(zhǔn)確性。  

                       
                                  圖7  Bluefuse軟件對(duì)比本文算法的相對(duì)誤差圖  

        4 結(jié)束語(yǔ)

        本文利用數(shù)學(xué)形態(tài)學(xué)和自適應(yīng)二值化方法,在實(shí)現(xiàn)基因芯片圖像數(shù)據(jù)自動(dòng)提取的同時(shí),也獲得了可競(jìng)爭(zhēng)的讀取精度。與其他軟件產(chǎn)品,如GenePix Pro與ScanAlyze 的手動(dòng)網(wǎng)格定位,手動(dòng)調(diào)節(jié)半徑等過(guò)程對(duì)比,本文的方法可以更容易更快捷地得到DNA芯片的圖像分割與斑點(diǎn)數(shù)據(jù)信息。實(shí)驗(yàn)證明該算法大大提高檢測(cè)的效率和準(zhǔn)確度,為后續(xù)生物信息學(xué)數(shù)據(jù)挖掘,模式識(shí)別分析提供可靠的數(shù)據(jù)支持。

        參考文獻(xiàn):

        [1] 劉長(zhǎng)春, 文孟良. 生物芯片[J]. 分析儀器, 2001(3): 37-39.

        [2] Luis Rueda and Bidya Vidyadharan. A hill-climbing approach for automatic gridding of cDNA microarray images[J]. IEEE Transactions on Computational Biology and Bioinformatics, 3(1),2006:72-83

        [3] Zacharia, E.,Maroulis, D.,An Original Genetic Approach to the Fully Automatic Gridding of Microarray Images[J]. IEEE Transaction on Medical Imaging,2008, 27(6):805-813.

        [4] Antonio P.G. Damiance Jr., Liang Zhao, Andre C.P.L.F. Carvalho.A dynamical model with adaptive pixel moving for microarray images segmentation[J] . RealTimeImg(10) ,2004, (4): 189–195.

        [5] Glasbey C A ,Ghazal P. Combinatorial Image Analysis of DNA Microarray Features. Bioinformatics, 2003,19 (2) :1942203.

        [6] 肖松山. 生物芯片圖像自動(dòng)識(shí)別算法研究[J]. 生命科學(xué)儀器. 2003.

        [7] 馬馳, 張紅云, 苗奪謙, 張學(xué)東. 改進(jìn)的多閾值動(dòng)態(tài)二值化算法[J]. 計(jì)算機(jī)工程. 2006. 3.

        [8] 崔屹. 圖像處理與分析——數(shù)學(xué)形態(tài)學(xué)方法及應(yīng)用[M]. 北京: 科學(xué)出版社. 2000. 4. 67-77.

        摘自《自動(dòng)化博覽》2010年第十一期 

     

    熱點(diǎn)新聞

    推薦產(chǎn)品

    x
    • 在線反饋
    1.我有以下需求:



    2.詳細(xì)的需求:
    姓名:
    單位:
    電話:
    郵件: