百趣代謝組學文獻分享,結直腸癌(Colorectal cancer, CRC)為癌癥死亡率第二的疾病,其發病率一直處于上升趨勢,可能與生活方式和環境因素的改變相關。近年來,生活方式和環境因素對腸道菌群影響的研究被不斷報道,且發現了腸道菌群在CRC中的改變,但是功能方面的研究仍缺乏,也沒有基于“多界”微生態的系統研究。
上海交通大學醫學院王慧教授與同濟大學朱瑞新教授、中科院上海營養與健康研究所張國慶教授、復旦大學陳興棟教授、中山大學附屬第六醫院朱立新教授團隊合作,在Nature Microbiology(IF=30.964)上發表了題為“Multi-kingdom microbiota analyses identify bacterial–fungal interactions and biomarkers of colorectal cancer across cohorts”的研究成果。
圖1. 人群隊列分布
代謝組學分享—結果
1.與CRC相關的菌變化
結合MMUPHin和PERMANOVA分析發現 ,CRC人群的α多樣性顯著降低;β多樣性表明菌群的組成不僅與疾病有關,在不同人群間也有顯著差異。代謝組學文獻分享,對不同人群物種組成的MaAsline2分析發現與CRC相關各界菌的變化,同時也發現部分差異細菌(如Alistipes onderdonkii, Parvimonas micra和Gemella morbillorum)和差異真菌(如Aspergillus rambellii和Trichophyton mentagrophytes)穩定存在于5個發現數據中,也有部分古菌和病毒在不同數據集中存在明顯差異。
代謝組學文獻分享,之后發現在CRC人群和對照人群中有顯著差異的88個細菌、108個真菌、38個古菌和115個病毒,其中有48個已報道過的細菌在CRC中升高(如F.nucleatum,P. micra, Porphyromonas asaccharolytica, Desulfovibrio desulfuricans和Akkermansia muciniphila),有益的產乳酸菌在CRC中降低(Clostridium butyricum和Roseburia intestinalis等)。
圖2. 微生物多樣性和差異組成結果
進一步的機器學習算法選出與CRC相關的重要菌(27個細菌,20個真菌,20個古菌和21個病毒);代謝組學文獻分享,建立的隨機森林模型發現,細菌panel對CRC的診斷能力最強(平均AUROC=0.80),其次為真菌(平均AUROC=0.77),古菌(平均AUROC=0.74)和病毒(平均AUROC=0.73);為探討基于各界panel建立的模型在不同數據集間的穩定性,又進行了cohort-to-cohort transfer和leave-one-cohort-out分析,進一步證實了建立模型的有效性。
圖3. 基于單界微生態的差異菌和模型結果
隨后又分別建立two-kingdom, three-kingdom和four-kingdom 微生物的multi-kingdom組合模型,發現multi-kingdom模型的診斷準確率優于single-kingdom模型,代謝組學文獻分享,其中有細菌和真菌features的模型效果更好,并通過four-kingdom微生物組合模型確定了前20個最重要的features (13個細菌,5個真菌,1個古菌和1個病毒)。代謝組學文獻分享,為進一步縮小核心菌群,通過隨機森林確定了包含11種細菌、4種真菌和1種古菌在內的16個features的multi-kingdom模型,該模型在不同隊列中均表現出較好的診斷效果(AUROC>0.82, 日本隊列中AUROC=0.73),在德國隊列中的AUROC高達0.92。此外,該模型也可用于CRC的早期診斷(AUROC=0.78)。
代謝組學文獻分享,接著又用3個數據集(中國,奧地利和美國)對16個features的multi-kingdom模型進行驗證,發現模型在中國和奧地利隊列中的AUROC分別為0.88和0.81,而在美國隊列中的AUROC為0.68,可能與該隊列樣本保存時間過長(>25年)有關。
代謝組學文獻分享,為驗證模型的特異性,又納入IBD(inflammatory bowel disease),T2D(type 2 diabetes)和PD(Parkinson’s disease)三種疾病的數據集進行驗證,結果發現模型的準確性大大降低,從而表明該模型在CRC診斷方面表現出有較高的特異性。
圖4. Multi-kingdom模型結果
代謝組學文獻分享,為進一步探究各菌間的相關性,基于各菌的豐度進行了co-abundance相關性分析,菌在CRC組中有更多的關聯,其中除了kingdom內顯著的關聯外,還發現了kingdom間(特別是細菌-真菌)的顯著關聯。
圖5. 相關性結果
2.微生物介導的功能變化和相關基因驗證
為進一步探索微生物介導的功能變化,基于KEGG進行KO和pathway水平的功能分析,發現了1,053個差異KO基因和49個差異pathways,與碳水化合物代謝相關的pathways(如:丁酸,抗壞血酸和醛酸代謝)和與氨基酸代謝相關的pathways(D-精氨酸和D-鳥氨酸代謝)在CRC中升高,支鏈氨基酸和脂質代謝相關的pathways在CRC中減低;通過HAlla分析也發現了不同代謝通路與菌有一定的相關性。
對與D-精氨酸,D-鳥氨酸代謝相關基因oraE和oraS及與丁酸代謝相關的基因bdhA/B的PCR定量檢測分析發現,在CRC中這幾個基因顯著升高。
該研究還進一步探索了multi-kingdom微生物之間的相互作用以及微生物介導的功能變化,發現了細菌-真菌相互作用通過上調D-精氨酸、D-鳥氨酸以及刺激丁酸代謝通路促進結直腸癌發病的機制。代謝組學文獻分享,同時,該研究還基于功能基因構建了CRC診斷模型,也具有較高的準確率(平均AUC為0.86)。最后,基于EggNOG基因、KO基因和通路水平建立模型。有趣的是,基于EggNOG基因的診斷模型的準確率高達0.86,優于菌species水平建立的模型。
圖6. 與CRC相關的功能變化和基于KO基因建立模型結果
代謝組學分享—總結
該研究是迄今為止樣本量最大、最全面的基于宏基因組測序技術對CRC腸道菌群進行研究的多中心隊列,首次繪制了全球CRC人群隊列的“4K”微生態圖譜,建立了基于多界組合的微生物組的CRC診斷模型,驗證了由微生物介導功能相關基因的變化,為結直腸癌早期診斷和預后評估及潛在的治療靶點提供了基于微生物及其功能標志物的新方法和新思路。