91成人国产网站在线观看_久久久久亚洲av成人毛片韩_国产偷窥真人视频在线观看_乳揉みま痴汉电车中文字幕_欧美日韩精品一区二区三区_九色视频网站

English | 中文版 | 手機版 企業登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > clustree算法助力單細胞聚類結果更有生物學意義

clustree算法助力單細胞聚類結果更有生物學意義

瀏覽次數:1587 發布日期:2023-3-15  來源:本站 僅供參考,謝絕轉載,否則責任自負

聚類算法廣泛用于分析大型數據集,以將具有相似屬性的個體聚類在一起。這在單細胞測序結果分析中尤為關鍵。合適的細胞聚類分群結果有助于細胞類型鑒定等下游數據分析工作。然而,聚類的算法多種多樣,且算法中參數的改變都會影響最終的細胞分群結果。因此,在細胞聚類分析時需要方法幫助研究者找到具有生物學意義的聚類分群結果。這里介紹一種名為“clustree”的算法,以樹狀圖形式展示不同聚類分辨率對細胞聚類分群的影響,并能顯示細胞的移動軌跡,從而指導研究者們確定合適的分辨率參數,獲得有生物學意義的細胞分群結果。

 

01

單細胞轉錄組clustree結果解讀

單細胞轉錄組測序可以幫助研究者獲得組織或體液中單個細胞的基因表達模式。而聚類算法可以將細胞按照表達模式的相似性進行聚類分群,不同細胞群之間的基因表達差異可以用于推斷細胞的身份和功能。然而,通常情況下研究者并不知道細胞類型的數量,若分辨率較低,會導致一個細胞群中包含多種細胞類型,而分辨率過高又會導致過分群的情況出現。因此,決定使用哪種分辨率參數是單細胞轉錄組整個分析流程的關鍵。

用10x Genomics公司提供的PBMC單細胞轉錄組測序結果(包含2700個外周血單核細胞,包含一系列免疫細胞類型)進行Seurat分析,并用clustree展示分辨率從0到5的聚類樹結果,如圖1A所示。在聚類樹結果中,每行代表在某個分辨率下的細胞聚類結果,而分辨率大小則用每個點的顏色表示。點的大小代表該cluster包含的細胞數目,細胞越多點越大。當分辨率增加時,細胞會按照箭頭方向移動到新的cluster里,箭頭的顏色代表沿箭頭移動的細胞數目,通過圖注可知箭頭越接近黃色,則說明箭頭包含的細胞數越多。此外,箭頭具有不同的透明度,代表箭頭中的細胞數與其指向cluster里細胞數的比值。比值越大,說明這個箭頭對其指向cluster的重要性更高,箭頭的透明度越小。而比值越小,說明這個箭頭對其指向cluster的重要性更低,箭頭的透明度越大,同時可以設置比值的閾值,隱藏低于閾值的箭頭。

Fig.1 2700個PBMC細胞單細胞轉錄組數據集的聚類樹

(A)分辨率從0-1的Seurat聚類結果,0.1時得到4個主要分支,0.4時分支繼續分裂。(B)分辨率從0到5,分辨率為5時看到很多透明箭頭,說明此時的cluster結果不穩定。

 

02

1. 如何利用clustree結果選擇合適的分辨率

通常情況下,為了決定合適的聚類分辨率,可使用以下兩種策略:1.選擇透明箭頭出現較少的分辨率聚類結果

聚類算法得到的cluster數目隨分辨率增加而增多,但當得到的cluster數目多于單細胞轉錄組結果實際存在的聚類數時,新的cluster會從已有的cluster中形成,許多cluster會在不同的分支中切換,出現較多的透明箭頭,不穩定的cluster也可能出現后消失。通過查看哪些cluster是穩定的以及出現透明箭頭的區域,我們可以推斷出聚類樹的哪些區域可能是真實的cluster或者是過度分群造成的。如圖1B所示,當算法被迫產生比該數據集中可能真正存在的更多的cluster時,隨著過度聚類的發生,可以看到更多的透明箭頭和由多個上一層cluster形成的新cluster。這些區域是不穩定的,且這些新生成的cluster不太可能代表數據集中的真實cluster。

2. 基于marker基因表達選擇有生物學意義的分辨率聚類結果

基于先驗知識可選用已知的marker基因來識別特定cluster的細胞類型,將基因表達信息疊加到聚類樹上,獲得新的聚類樹,可指示何時形成包含純細胞群的cluster。如圖2所示,該聚類樹是在圖1A結果基礎上增加marker基因的表達信息。CD19是B細胞的marker基因,在最右側的分支中高表達。CD14是單核細胞的marker之一,其表達隨著分辨率增大在某一個分支中高表達,暗示這條分支的cluster可能是這種細胞的純群體。CD3D是T細胞的marker,在最左側的分支中都有表達,當分辨率增加到0.7時出現兩條細分支,且這兩條分支中CCR7的表達存在明顯差異,從而將記憶T細胞和初始T細胞區分開。通過添加已知的細胞類型marker基因,可以確定這些cluster是否具有生物學意義。

 

Fig.2 2700個PBMC細胞單細胞轉錄組數據集的聚類樹,增添已知marker基因表達信息

(A)CD19,識別B細胞;(B)CD14,顯示單核細胞;(C)CD3D,T細胞marker基因;(D)CCR7,區分記憶和初始T細胞。

 

03

結語

單細胞轉錄組測序結果通常數據龐大且存在背景噪音,包含未知數量的細胞類型和聚類數。因此,clustree算法在指導單細胞轉錄組數據集聚類分群時的重要性不言而喻。該算法以聚類樹的方式提供了包含多種信息的可視化結果,可以有效地評估cluster可靠性并鑒定其類型,為單細胞轉錄組的下游分析奠定基礎。

參考文獻:Zappia, Luke, and Alicia Oshlack.“Clustering trees: a visualization for evaluating clusterings at multiple resolutions.”GigaSciencevol. 7,7 (2018): giy083.

發布者:上海生物芯片有限公司
聯系電話:400-100-2131
E-mail:marketing@shbiochip.com

用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網 電話:021-64166852;13621656896 E-mail:info@bio-equip.com
主站蜘蛛池模板: 一道本啪啪 | 亚洲色av天天天天天天 | 综合狠狠开心 | 亚洲AV无码A片在线观看蜜桃 | 午夜大尺度福利视频 | www.99爱| 国产免费福利在线观看 | 国产麻豆aⅴ尤物网站尤物 中国少妇XXXX做受 | chinese国产xxxx实拍 | 日韩精品久久久久 | 成人性生交A片免费看V | 人人天天操 | 日本国产一区二区 | 性一交一乱一伧老太 | 久草视频在线资源 | 午夜久久久精品一区二区三区 | 色综合久久久无码中文字幕 | 无码99久热这里只有精品视频在线 | 极品少妇ⅩXXXⅩ护士 | 国产69久久精品成人看动漫 | 国产伦理精品 | 成人免费午夜视频69影院 | jizzjizzjizz日本老师 | av毛片在线观看地址 | 麻豆国产在线播放 | 法国性迷宫1997未删减 | 国产成人亚洲精品无码影院BT | 曰本人做爰大片免费观看 | 久色视频在线播放 | 亚洲精品2 | 稀缺小u女呦精品呦免费 | 三人交free性欧美 | 最近免费中文字幕中文高清 | 国产真实伦在线观看 | 国产中文字幕第一页 | 国产女人喷潮视频在线观看 | 亚洲精品视频一区 | 在线视频一区二区三区 | 麻豆.蜜桃.91.天美入口 | 日韩精品中文有码 | 99热这里只有精品99 |