精品午夜理论片在线播放_欧美日韩亚洲熟女_综合天天人人国产欧美_一区在线观看神马久久_国产午夜精品理论片俄罗斯_原神女角色吃旅行者的小坤坤_美女视频黄免费_国产麻豆永久视频


GEO數(shù)據(jù)整合挖掘


簡介

通過多組 GEO 數(shù)據(jù)集看差異基因的交集情況,對應(yīng)差異基因?qū)?yīng)的生物學(xué)功能,特定生物學(xué)功能相關(guān)基因的差異情況。

分析內(nèi)容:

1、 GEO 數(shù)據(jù)集預(yù)處理,包含歸一化,過濾低表達(dá),PCA,樣本聚類等

首先對數(shù)據(jù)預(yù)處理:歸一化處理(quantile 法),過濾低表達(dá),PCA分析(看樣本是否離群)。

需要根據(jù)根據(jù)數(shù)據(jù)產(chǎn)生的方式(芯片還是測序)選擇適合的歸一化方法。


上圖是樣本間的PCA圖,先預(yù)判樣本間的一致性以及是否有離群樣本


2. 如果是多個GEO數(shù)據(jù),對不同的GEO數(shù)據(jù)的一致性進(jìn)行評估

   適用于:>=3GEO數(shù)據(jù)集

   可以通過heatmap 的方式來展示數(shù)據(jù)間的一致性

  這張圖需要ps 處理

圖中每行代表每個數(shù)據(jù)集,每列代表一個基因。可以清晰看出每個數(shù)據(jù)集基因表達(dá)的一致性。

3.     差異基因篩選

根據(jù)數(shù)據(jù)產(chǎn)生的方式(芯片還是測序)選擇適合的方法計算基因在組間差異的pvalue值。對差異倍數(shù)(Fold Change)以及pvalue設(shè)置合適的閾值篩選差異基因。

4.     差異基因 venn

兩組差異基因 venn

5.     對差異基因做功能注釋

GO 數(shù)據(jù)庫包含了基因參與的生物過程,所處的細(xì)胞位置,發(fā)揮的分子功能三方面功能信息。在基因 表達(dá)譜分析中,GO 常用于提供基因功能分類標(biāo)簽和基因功能研究的背景知識。 利用 GO 的知識體系和結(jié)構(gòu)特點(diǎn),旨在發(fā)掘與基因差異表達(dá)現(xiàn)象關(guān)聯(lián)的單個特 征基因功能類或多個特征功能類的組合。

注:(A)GO富集分析。點(diǎn)的顏色漸變代表的是Pvalue的大小,點(diǎn)的大小根據(jù)該GO分類差異基因數(shù)量漸變(B)KEGG通路富集。黃色線條表示該位置的pvalue=0.05。Up:上調(diào),Down:下調(diào)。數(shù)字左側(cè)為差異表達(dá)基因數(shù)量,數(shù)字右側(cè)為該KEGG通路中差異基因的總數(shù)量。


6.     特定生物學(xué)相關(guān)差異基因篩選。

以特定的關(guān)鍵詞從 GO Pathway及其他相關(guān)數(shù)據(jù)庫篩選對應(yīng)的基因,看這些基因在各個數(shù)據(jù)集中的差異情況。

以上僅描述了一種GEO數(shù)據(jù)整合的方法。通常可以根據(jù)課題的需要設(shè)計分析方案。


參考文獻(xiàn):

【1】Jin Wook Yi  et.al. Genomic evidence of reactive oxygen species elevation in papillary thyroid carcinoma with Hashimoto thyroiditis,2015