• <del id="qqie6"><sup id="qqie6"></sup></del>
  • <tfoot id="qqie6"></tfoot>
  • <ul id="qqie6"></ul>
  • 藍景科信河北生物科技有限公司
    中級會員 | 第5年

    15632249798

    WGCNA分析流程及內容解讀

    時間:2024/12/6閱讀:854
    分享:

    文章標題:通過 WGCNA 和機器學習識別和驗證與免疫和氧化應激相關的糖尿病腎病診斷標記物

    發表年限:2023

    期刊:Frontiers in Immunology

    影響因子:5.7

    WGCNA分析流程及內容解讀

    研究背景:

    糖尿病腎病(DN)以蛋白尿、高血壓和腎功能進行性減退為特征,是發達國家終末期腎病最常見的病因,造成了嚴重的社會和經濟負擔。研究表明,隨著全球糖尿病發病率的上升,DN患者的人數也在不斷增加,預計在未來20年左右的時間里,全球糖尿病發病率將從5.37億人上升到7.83億人。與此相反,目前的治療方案強調腎素-血管緊張素系統阻斷、血壓管理和血糖控制。因此,DN診斷和治療迫切需要新的靶點。近年來,隨著生物信息學的發展,其研究技術已被積極用于探索包括DN在內的多種疾病的靶點。

    研究結果:

    本文中,作者使用R軟件包"WGCNA"構建了WGCNA,以識別與糖尿病腎病患者免疫細胞相關性最高的模塊。 具體來說,首先對樣本數據進行了預處理,并剔除了異常值。隨后,"WGCNA"軟件包構建了相關矩陣。選擇最佳軟閾值將相關矩陣轉換為鄰接矩陣,并根據鄰接矩陣創建拓撲重疊矩陣(TOM)。利用基于TOM的相異性度量,采用平均關聯分層聚類將具有相似表達模式的基因歸類為基因模塊。與免疫細胞相關性較強的兩個模塊被選為關鍵模塊,用于后續分析。

    WGCNA分析流程及內容解讀


    該研究中軟閾值功率校準為0.85(圖B)。最后,WGCNA分析顯示了11個模塊的總和(圖C)。其中,綠色模塊和品紅色模塊分別與T細胞CD4幼稚亞群和γ δ 亞群有很強的正相關性。由于綠色模塊和品紅色模塊與免疫浸潤細胞有重要關聯,因此考慮對這兩個模塊進行進一步研究。

    從上述文章中可以看出,WGCNA分析可用于識別高度相關的基因模塊,總結模塊之間的相互聯系以及與外部樣本性狀的關聯,并識別候選生物標記物或治療靶點。

    WGCNA,全稱為weighted gene co-expression network analysis,即加權基因共表達網絡分析。它是一種分析多個樣本基因表達模式的分析方法,可將表達模式相似的基因進行聚類,并分析模塊與特定性狀或表型之間的關聯關系,在研究表型性狀與基因關聯分析等方面的研究中被廣泛應用。

    1.數據輸入、清洗和預處理

    使用R"WGCNA“進行分析,輸入數據一般為fpkm表達量數據,推薦5組(或者15個樣品)以上的數據,數據的行為基因,列為不同樣本的基因表達量。

    WGCNA分析流程及內容解讀

    2.使用goodSamplesGenes檢查缺失值和識別離群值(異常值)

    WGCNA分析流程及內容解讀

    如果gsg$allOK的結果為TRUE,證明沒有缺失值,可以直接下一步。如果為FALSE,則需要用以下函數進行刪除缺失值。

    WGCNA分析流程及內容解讀

    對所有樣本進行聚類,觀察是否有離群值或異常值,如果有離群值則要刪去離群的樣本。

    WGCNA分析流程及內容解讀

    3. 讀入樣本信息并進行篩選,得到表型數據與表達量數據二者共有的樣本數據,并重新構建聚類樹。

    WGCNA分析流程及內容解讀

    顏色越深,代表這個表型數據與這個樣本的基因表達量關系越密切。將此步驟的數據進行保存,命名為file1

    4.對匹配后的樣本基因表達量數據和表型數據進行分析,選擇合適的軟閾值構建網絡,并繪制層次聚類樹。


    WGCNA分析流程及內容解讀

    5. 選擇合適的軟閾值構建自動化網絡和檢測模塊,使用sft$powerEstimate查看推薦的軟閾值。

    WGCNA分析流程及內容解讀

    WGCNA分析流程及內容解讀

    6.為了更清晰地反映出樣本基因的聚類關系,我們將這些基因劃分成了若干個模塊,每個模塊至少存在30個基因,每一個顏色代表一個模塊,將劃分后的模塊和樣本基因的層次聚類樹一起顯示,如下圖所示:

    WGCNA分析流程及內容解讀

    保存模塊信息:file2

    7.載入file1file2,將性狀信息和模塊信息相關聯,并繪制模塊與性狀之間的相關性熱圖。

    WGCNA分析流程及內容解讀

    圖中紅色為正相關,藍色為負相關,顏色越深則相關性越強。

    8.加權網絡可視化

    可視化加權網絡的方法之一是制作熱圖。熱圖的每行每列代表一個基因,淺色代表低鄰接;深色代表高鄰接,基因之間的鄰接程度低意味著基因之間的度量值較小,即他們之間之間的相似性較低,這可能表示它們在表達模式、功能或調控方面存在較大的差異。相反,鄰接程度高表示基因之間的度量值較大,即它們之間的相似性較高。這可能表示它們在表達模式、功能或調控方面存在相似性。由于樣本的基因數量較多,我們從中隨機選取了400個基因進行繪圖,圖片如下所示:

    WGCNA分析流程及內容解讀

    9.此外,可以使用分析結果針對特定模塊繪制相關性網絡圖,還可以將數據導入到相關軟件中(如:Cytoscape)進行相關性網絡的可視化。

    WGCNA分析流程及內容解讀

    參考文獻:

    [1] Xu M, Zhou H, et al. Identification and validation of immune and oxidative stress-related diagnostic markers for diabetic nephropathy by WGCNA and machine learning. Front Immunol. 2023 Feb 22;14:1084531.

    [2] Langfelder P, Horvath S. WGCNA: an R package for weighted correlation network analysis. BMC Bioinformatics. 2008 Dec 29;9:559.

    WGCNA分析流程及內容解讀





    會員登錄

    ×

    請輸入賬號

    請輸入密碼

    =

    請輸驗證碼

    收藏該商鋪

    X
    該信息已收藏!
    標簽:
    保存成功

    (空格分隔,最多3個,單個標簽最多10個字符)

    常用:

    提示

    X
    您的留言已提交成功!我們將在第一時間回復您~
    撥打電話
    在線留言
    主站蜘蛛池模板: 欧洲成人午夜精品无码区久久| 成人影院久久久久久影院| 国产v精品成人免费视频400条| 四虎成人免费网站在线| 久久成人国产精品一区二区| 欧洲国产成人精品91铁牛tv| 在线观看国产成人AV天堂| 国产成人av一区二区三区在线观看 | 亚洲在成人网在线看| 中文国产成人久久精品小说| 成人毛片一区二区| 国产成人 亚洲欧洲| 成人无遮挡毛片免费看| 亚洲欧洲国产成人精品| 成人国产永久福利看片| 亚洲国产成人精品无码区花野真一| 成人欧美一区二区三区视频| 久久久久亚洲AV成人无码网站| 国产成人精品永久免费视频| 69堂国产成人精品视频不卡| 国产成人精品久久| 成人影院在线观看视频| 欧美成人久久久| 日韩国产成人精品视频| 78成人精品电影在线播放| 午夜在线观看视频免费成人| 国产成人av一区二区三区在线观看 | 成人看片黄a免费看| 亚洲国产成人久久一区二区三区| 成人字幕网视频在线观看| 久久成人福利视频| 四虎精品成人免费观看| 国产成人亚洲综合| 国产婷婷成人久久av免费高清| 国内外成人免费视频| 国产麻豆成人传媒免费观看| 国产成人综合色视频精品| 国产成人精品综合在线观看| 国产成人av一区二区三区在线| 午夜电影成人福利| 久久国产成人精品国产成人亚洲 |