當(dāng)生物芯片和樣品探針雜交完畢后,就需要對雜交結(jié)果進行圖象采集和分析。一般膜芯片的雜交都用同位素p32、p33作標(biāo)記,其信號的檢測需通過傳統(tǒng)的磷光成像系統(tǒng)來完成。而對于用熒光標(biāo)記的玻璃芯片雜交后的檢測,則需要用專門的熒光芯片掃描儀。
1. 磷感屏成像系統(tǒng)Cyclone Storage Phosphor System
Cyclone磷屏成像系統(tǒng)為美國Packard公司生產(chǎn)的第一臺集高分辨率、高靈敏度和5個數(shù)量級的線性范圍于一身的計算機控制數(shù)字化自動放射成像分析系統(tǒng),由于其使用方便、快捷、自動化程度、分辨率、圖像清晰度均很高,既可定位亦可定量,目前已廣泛應(yīng)用于核醫(yī)藥學(xué)、細胞與分子生物學(xué)、生物化學(xué)、藥理學(xué)、基因工程學(xué)、藥物代謝動力學(xué)、放射免疫及受體免疫等多方面實驗研究,成為十分方便的有力工具。其優(yōu)異品質(zhì)主要得益于Packard專利的激光技術(shù)和共聚焦成像系統(tǒng)。應(yīng)用范圍為我們前面介紹的DNA Macroarray以及Northern、Southern、Western Blot.,手工測序,放射性原位雜交等的同位素結(jié)果檢測。使用Cyclon磷屏可以大大縮短研究周期,獲得清晰的分辨率。
其工作原理在于:同位素標(biāo)記的雜交結(jié)果在磷屏上曝光,曝光過程32P等核素核衰變同時發(fā)射β射線,首先激發(fā)磷屏上分子,使磷屏吸收能量分子發(fā)生氧化反應(yīng),以高能氧化態(tài)形式儲存在磷屏分子中。激光掃描磷屏,對于激發(fā)態(tài)高能氧化態(tài)磷屏分子發(fā)生還原反應(yīng),即從激發(fā)態(tài)回到基態(tài)時多余的能量以光子形式釋放,從而在PMT捕獲進行光電轉(zhuǎn)換,磷屏分子回到還原態(tài)。計算機接受電信號,經(jīng)處理形成屏幕圖像,并進一步分析和定量。一般化學(xué)發(fā)光物質(zhì)如熒光染料標(biāo)記樣品成像過程與放射性類似。
系統(tǒng)特點
放射性自顯影成像系統(tǒng)。儲存式磷屏根據(jù)不同樣品厚度、射線能量有多種型號磷屏可供選擇,磷屏可以多次重復(fù)使用。
靈敏度較X光片高數(shù)十倍,可以檢測最弱的信號。曝光時間可以縮短20倍以上。
快速成像,從對磷屏進行掃描到獲得完整的的數(shù)字化圖像,總共需要不到10min的時間,實時圖像顯示,同時立即報告分析結(jié)果。
可對放射性位置和強度進行相關(guān)的定位、定量分析,寬達105的線性范圍,定量準(zhǔn)確。
不需膠片、暗室設(shè)備、沖洗底片,一步到位完成分析過程。
可選配Ouant ArrayTM 軟件,用于尼龍膜上同位素標(biāo)計的Gene Array定量分析。
2. 熒光芯片掃描儀
由于雜交時產(chǎn)生序列重疊,會有成百上千的雜交點出現(xiàn)在圖譜上,形成極為復(fù)雜的雜交圖譜。序列重疊雖然可為每個堿基的正確讀出提供足夠的信息,可提高序列分析的可靠性,但同時信息處理量也大大增加了。一般說來,這些圖譜的多態(tài)性處理與存儲都由專門設(shè)計的軟件來完成,而不是通過對比進行人工讀譜。用計算機處理即可給出目的基因的結(jié)構(gòu)或表達信息。掃描一張10cm2的芯片大概需要2-6分種的時間。目前專用于熒光掃描的掃描儀根據(jù)原理不同大致分為兩類:一是激光共聚焦顯微鏡的原理, 是基于PMT(photomultiplier tube,光電倍增管)的檢測系統(tǒng)(另文介紹);另一種是CCD(charge-coupled devices,電荷偶合裝置)攝像原理檢測光子。CCD一次可成像很大面積的區(qū)域,而以PMT為基礎(chǔ)的熒光掃描儀則是以單束固定波長的激光來掃描,因此或者需要激光頭,或者需要目的芯片的機械運動來使激光掃到整個面積,這樣就需要耗費較多的時間來掃描;但是CCD有其缺點:目前性能最優(yōu)越的CCD數(shù)字相機的成像面積只有16×12mm(像素為10μm),因此要達到整個芯片的面積20×60mm的話,需要數(shù)個數(shù)碼相機同時工作,或者也可以以降低分辨率為代價來獲得掃描精度不是很高的圖像。由于靈敏度和分辯率較低,比較適合臨床診斷用。
生產(chǎn)商業(yè)化掃描儀的公司包括:Genomic Solutions公司、Packard公司、GSI公司、Molecular Dynamics、Genetic Microsystems公司、Axon Instruments公司等。其中GSI Lumonics 公司ScanArray 系列一直是生物芯片掃描檢測系統(tǒng)中的領(lǐng)頭產(chǎn)品。2000GSI并入著名的Parkard公司后ScanArray的軟、硬件都得到進一步加強。
ScanArray利用其專利的激光共聚焦光學(xué)系統(tǒng),通過計算機控制,對生物芯片的熒光雜交信號進行全自動的掃描采集,并通過分析軟件對數(shù)據(jù)結(jié)果進行定量分析。
最高靈敏度高:<0.1熒光分子/μm
掃描精度可從5μm-50μm分級調(diào)整
全范圍掃描時間僅需5分鐘,快速方便
多達十種檢測濾光片,涵蓋所有生物芯片熒光染料的檢測,適用于多種熒光標(biāo)記探針
不同波長依次掃描避免交叉光污染
掃描后的圖像還需要進一步的處理,這要求一定的軟件支持,F(xiàn)有的分析軟件包括:Biodiscovery的ImaGene系列,Axon Instruments的GenePix系列,GSI的QuantArray等
3. 基因芯片上各克隆熒光信號的分析原理
用激光激發(fā)芯片上的樣品發(fā)射熒光,嚴(yán)格配對的雜交分子,其熱力學(xué)穩(wěn)定性較高,熒光強;不完全雜交的雙鍵分子熱力學(xué)穩(wěn)定性低,熒光信號弱(不到前者的1/35~1/5),不雜交的無熒光。不同位點信號被激光共焦顯微鏡,或落射熒光顯微鏡等檢測到,由計算機軟件處理分析,得用激光激發(fā)芯片上的樣品發(fā)射熒光,嚴(yán)格配對的雜交分子,其熱力學(xué)穩(wěn)定性較高,熒光強;不完全雜交的雙鍵分子熱力學(xué)穩(wěn)定性低,熒光信號弱(不到前者的1/35~1/5)(2),不雜交的無熒光。不同位點信號被激光共焦顯微鏡,或落射熒光顯微鏡等檢測到,由計算機軟件處理分析,得到到有關(guān)基因圖譜。美國GSI Lumonics 公司開發(fā)出專專業(yè)基因芯片檢測系統(tǒng)(ScanArray 系列),采用激光共聚焦掃描原理進行熒光信號采集,由計算機處理熒光信號,并對每個點的熒光強度數(shù)字化后進行分析。利用QuantArray軟件包對掃描的熒光信號進行分析,比
較每個克隆在不同組織間表達水平的差別。軟件具體分析步驟如下:
首先,同時導(dǎo)入同一區(qū)域兩個channel掃描的圖像文件;將兩個channel掃描的圖像用不同的顏色顯示并重疊;選擇擬分析的區(qū)域,輸入矩陣的行數(shù)及列數(shù)以及矩陣的個數(shù)等參數(shù);在計算機給出的該區(qū)域信號圖片上標(biāo)定網(wǎng)格,使得網(wǎng)格中所包含的橫線和豎線的交點個數(shù)同每個區(qū)域點樣的克隆數(shù)相同,調(diào)整網(wǎng)格,使每個交點均位于點樣克隆信號的中心;信號的中心確定后,計算機將自動以交點為中心,按照設(shè)定的半徑圈定各克隆,并將其內(nèi)部區(qū)域作為待分析的信號,同時在圈定的各克隆周圍再按照預(yù)設(shè)的值圈定一定范圍的區(qū)域,將該區(qū)域內(nèi)的信號作為背景噪音;計算機分析每個克隆扣除背景噪音后的信號強度,并按照不同的要求對數(shù)據(jù)進行分析;利用GenePie方式對兩個channel信號的進行定量比較分析,此時計算機根據(jù)各克隆兩個channel掃描的信號,以餅圖的形式給出兩個channel信號強度的相對比例,同時可以逐個克隆讀取計算機分析出的兩個channel信號的值及所占的比例,進而確定各克隆在兩種組織間的表達差異。
4. Microarray數(shù)據(jù)分析
Microarray數(shù)據(jù)分析簡單來說就是對Microarray高密度雜交點陣圖象處理并從中提取雜交點的熒光強度信號進行定量分析,通過有效數(shù)據(jù)的篩選和相關(guān)基因表達譜的聚類,最終整合雜交點的生物學(xué)信息,發(fā)現(xiàn)基因的表達譜與功能可能存在的聯(lián)系。
Microarray數(shù)據(jù)分析主要包括圖象分析(Biodiscovery Imagene 4.0\Quantarray分析軟件)、標(biāo)準(zhǔn)化處理(normalization)、Ratio值分析、基因聚類分析(Gene Clustering)。
1. 圖象分析:激光掃描儀Scaner得到的Cy3/Cy5圖象文件通過劃格(Griding),確定雜交點范圍,過濾背景噪音,提取得到基因表達的熒光信號強度值,最后以列表形式輸出。
2. 標(biāo)準(zhǔn)化處理(Normalization):由于樣本差異、熒光標(biāo)記效率和檢出率的不平衡,需對cy3和cy5的原始提取信號進行均衡和修正才能進一步分析實驗數(shù)據(jù),Normalization正是基于此種目的。Normalization的方法有多種:一組內(nèi)參照基因(如一組看家基因)校正Microarray所有的基因、陽性基因、陰性基因、單個基因。
3. Ratio分析(Ratio Analysis):cy3/cy5的比值,又稱R/G值。一般0.5-2.0范圍內(nèi)的基因不存在顯著表達差異,該范圍之外則認為基因的表達出現(xiàn)顯著改變。由于實驗條件的不同,此域值范圍會根據(jù)可信區(qū)間有所調(diào)整。處理后得到的信息再根據(jù)不同要求以各種形式輸出,如柱形圖、餅形圖、點圖、原始圖象拼圖等。將每個Spot的所有相關(guān)信息如位標(biāo)、基因名稱、克隆號、PCR結(jié)果、信號強度、Ratio值等自動關(guān)聯(lián)并根據(jù)需要篩選數(shù)據(jù)。每個Spot的原始圖象另存文件,可根據(jù)需要任意排序,得到原始圖象的拼圖,對于結(jié)果分析十分有利。
4. 聚類分析(Clustering Analysis):實際是一種數(shù)據(jù)統(tǒng)計分析。通過建立各種不同的數(shù)學(xué)模型,可以得到各種統(tǒng)計分析結(jié)果,確定不同基因在表達上的相關(guān)性,從而找到未知基因的功能信息或已知基因的未知功能。Gene Clustering就是根據(jù)統(tǒng)計分析原理,對具有相同統(tǒng)計行為的多個基因進行歸類的分析方法,歸為一個簇的基因在功能上可能相似或關(guān)聯(lián)。目前以直觀圖形顯示GeneCluster結(jié)果的程序已有人開發(fā)出來,可將抽象的數(shù)據(jù)結(jié)果轉(zhuǎn)化成直觀的樹形圖,便于研究人員理解和分析。
盡管基因芯片技術(shù)受到了廣泛關(guān)注,但在基因表達譜分析中起著關(guān)鍵作用的生物信息學(xué)卻沒能引起大家的足夠重視,認為簡單人工處理一下原始數(shù)據(jù)就可以得到有價值的生物學(xué)信息,大量有價值的信息就這樣被浪費和湮沒了?梢钥隙ǖ卣f,沒有生物信息學(xué)的有效參與,基因芯片技術(shù)就不能發(fā)揮最大效能。加大基因芯片技術(shù)中生物信息學(xué)的研究開發(fā)力度已成為當(dāng)務(wù)之急。國內(nèi)外已經(jīng)進行了有益的嘗試,初步開發(fā)出供芯片平臺管理實驗數(shù)據(jù)的軟件包,就目前實際情況來看,生物信息學(xué)在基因芯片研究開發(fā)中介入的程度已經(jīng)越來越深,主要涉及基因表達信息分析管理系統(tǒng)及其分析工具和分析方法,簡單概括為以下幾個方面:
基因表達數(shù)據(jù)庫
基因表達數(shù)據(jù)庫是整個基因表達信息分析管理系統(tǒng)的核心。Microarray數(shù)據(jù)庫起著數(shù)據(jù)儲存和查詢、各種相關(guān)信息的整合的作用。Microarray數(shù)據(jù)庫可以包含用戶的管理信息、原始實驗結(jié)果(圖象文件、信號強度值、背景平均值行列號、基因號等)、各種實驗參數(shù)(Plates/unigene/Sets/Clusters)、探針相關(guān)信息、 clone相關(guān)信息(基因名稱、基因序列、GenBank accession號、克隆標(biāo)志符(IMAGE和內(nèi)部)、代謝途徑標(biāo)志符、內(nèi)部克隆標(biāo)志符)、分析處理結(jié)果、芯片設(shè)計相關(guān)的資源和數(shù)據(jù),等等。
分析方法:
選擇分析方法的基本標(biāo)準(zhǔn):能夠簡化原始數(shù)據(jù),結(jié)果直觀,使研究者能在海量基因表達數(shù)據(jù)中解析出正確的基因表達譜和功能信息。一個理想的分析方法是建立在合理的算法基礎(chǔ)之上的,應(yīng)該能全面綜合并直觀地解析原始數(shù)據(jù),修正已有數(shù)據(jù),并從結(jié)構(gòu)、序列、功能之間找到新聯(lián)系。目前已有報道用于microarray數(shù)據(jù)分析的方法主要有以下幾種:
手工分類法(Manual classification Method)
該方法在Botstein 實驗室的Michael Eisen提出新的分析方法之前是唯一用來分析microarray數(shù)據(jù)的方法。其基本原理是通過對microarray的ratio值從大到小排序,篩出表達顯著性改變的基因。結(jié)果可直觀地從二維plot圖得到。優(yōu)點是能夠有效篩選潛在的腫瘤標(biāo)記基因和藥物靶位點;可以構(gòu)建多組基因誘導(dǎo)或抑制的時間表達譜。缺點是結(jié)論過于簡單;很難發(fā)現(xiàn)更高層次功能線索;處理耗時且不能充分利用數(shù)據(jù),也不能發(fā)現(xiàn)實驗錯誤。
非監(jiān)督聚類法(Unsupervised Clustering)又稱配對平均連鎖聚類分析(Pairwise average-linkage cluster analysis)。該方法是分層聚類的一種形式,非常類似系統(tǒng)發(fā)生分析。該方法是基于標(biāo)準(zhǔn)相關(guān)系數(shù)的計算。K -mean方法是unsupervised聚類法的一個變化,目前Stanford University 的Botstein實驗室和NHGRI的Trent實驗室都采用該分析方法。
混合聚類法(Hybrid clustering approach)該聚類方法通過將每一數(shù)據(jù)點傅立葉變換尋找那些表達呈周期性變化的基因,比如細胞周期涉及的基因。所謂混合聚類就是先unsupervised聚類再supervised聚類。優(yōu)點是可以整合以前手工聚類法得到的數(shù)據(jù);尤其適合確認細胞周期調(diào)控的特征性表達譜。
神經(jīng)網(wǎng)絡(luò)方法(Neural network approach)運用自組織圖(Self organizing maps)并結(jié)合supervised法進行聚類。優(yōu)點是分類標(biāo)準(zhǔn)明確;優(yōu)化的次序好于其它聚類法;用一種次序風(fēng)格處理大量數(shù)據(jù)易于被生物學(xué)家接受。