單細胞定序分析介紹 (八): CellChat 細胞交互作用
原創文章 引用請註明出處
單細胞實驗設計讓我們可以更迅速且準確的掌握每個細胞涵蓋的訊息,把實驗做好做滿之外,如何解讀實驗設計並完整闡述一個故事,又是後期分析的另一項大考驗。近期有不少 paper 提到 Cell-Cell communication (Ligand-Receptor)[1-5],透過 Ligand-Receptor 推測「細胞群」之間的互動關係。以下簡述這種分析在已發表文獻[1]的應用:
已有文獻證明受病毒感染的上皮細胞分泌 chemokines 能夠在感染部位活化並募集(recruit)免疫細胞[6]。然而,控制病毒在人體當中的傳播,雖需仰賴上皮細胞與免疫細胞的互動,但是免疫細胞如果過度活化又會造成組織損壞;有研究證實許多嚴重的新冠病毒患者,最終可能不是病毒清不乾淨,而是因為免疫系統遭到過度活化。為了回答這個問題 Chua 等人做了研究,將病人分為三組:控制組(control), 中度患者(moderate), 重度患者(critical),他們發現 moderate 組比起 control 組表現較多的 chemokine-ligand encoding genes,而 critical 組又比 moderate 組表現更多 chemokine and chemokine receptor,並且有更強烈的上皮細胞與免疫細胞互動,有可能最終會導致上皮細胞加劇死亡。
下圖輔助說明上述:critical 組的病人相較於 moderate,會有較多的 epithelium-immune cell interaction (其值計算為 log-scaled ligand–receptor interaction counts)。
很新穎吧!原來在新冠肺炎當中理解細胞群之間的互動幫助也是很大的。然而,這樣子的 cell-cell communication 計算有幾件事情值得思考:
1. 「蛋白質-蛋白質」與「基因-基因」的關係?Ligand-Receptor 是指 proteome 層面的關係,而單細胞實驗後我們得到的是 transcriptome 層面的訊息,如何做合理的轉換?
3. 細胞群在這整個 Ligand-Receptor 網路,哪些有相似的 pattern?
以上幾個問題可以透過 CellChat [7]這個套件來回答。CellChat 相比其他套件,多了幾個優點:
(1)考慮多種subunits/ cofactors/ 聚合物等 (2)附帶註釋database並支援可視化結果圖 (3)支援物種為人/鼠
CellChat的計算步驟:
自定義細胞群作為組別,這邊會如此設定是因為假設一個「細胞群」就是一種 cell type(必定是因為某種相似性才聚類在一群),找出某個細胞群的 DEG,即是為了假設這些 DEG 造就所謂的cell state-specific communications。
(3) Ligand-Receptor 網路連線
- Soluble (考慮蛋白質的可溶性 soluble):
Law of mass action,Ligand 及 Receptor 表現量即視為濃度。
- Physical (考慮 Protein-Protein interaction):
CellChat 使用隨機行走網路傳播技術(random walk based network propagation technique)[8, 9],將 transcriptome 資料投射到 STRINGdb[9, 10]蛋白質交互網路(PPI, protein-protein interaction)。如何定義 i 群細胞是否連線到 j 群細胞(權重),則遵從以下的機率計算公式。
- Li:ligand L在細胞群 i 當中的表現量,而其受到 co-factor 的調控(costimulatory ligand LA, co-inhibitory ligand LI, and co-ligands);另外,m1 指的就是 subunits 數目。
- Rj:receptor R 在細胞群 j當中的表現量,其調控計算同上面 Ligand (Li) 敘述。
- AG:agonist 的表現量,AGi 為 AG 在 i 群細胞的表現量,AGj 為 AG 在 j 群細胞的表現量。
- AN:antagonist 的表現量,ANi 為 AN 在 i 群細胞的表現量,ANj 為 AN 在 j 群細胞的表現量。
- Kh:符合 hill function 的常數(hill function 的基礎模型可參考 Michaelis-Menton Equation),依據 Half maximal effective concentration (EC50)設定為 0.5
- ni:細胞群i當中的細胞數
- nj:細胞群j當中的細胞數
※ 數據維度:一個訊號傳遞路徑(Signaling Pathway)可能由多組 Ligand-Receptor 組成,所以最終一個訊號傳導路徑機率會是三維矩陣P(K, K, N),K 是細胞群(組別)數,N 是 Ligand-Receptor 配對數。
(4) 統計顯著性
Permutation test 測試隨機發生的狀況與上述 P 所得結果是否相近
CellChat結果解讀:
- 細胞群扮演的角色
細胞群經過前面的計算,在每一個訊號傳遞路徑會構成一個 weighted-directed network,因此可以計算 in-degree / out-degree / betweeness / centrality 藉此定義細胞群在該訊號傳遞路徑扮演分別為:接受者(Receiver)/ 傳送者(Sender)/ 中間媒介(Mediator)/ 重要影響者(Influencer)。
- 分泌訊號傳導物質的方式
分泌傳導物質的方式主要可以分為 autocrine(自分泌)/ paracrine(旁分泌)。每個顏色的點就代表一個細胞群,實心代表 Source、空心代表 Target,每一條線的粗細代表連結強度。如果Source/ Target 顏色同,自己連到自己且無其他連出去的路徑則可能代表是 autocrine,而若連到很多別的顏色則可能代表傳導路徑當中是 paracrine的形式傳遞物質(如果不易理解可參考Circel Plot,若有線繞回自己,則表示該群細胞可能是 autocrine。)另外,因為一個訊號傳導路徑可能包含多組 L-R pair,所以可以參考這些 L-R pair當中,哪些對於 TGFb 呈現結果的貢獻度較大。
- 有相似訊號傳導的細胞群
CellChatDB 把訊號傳導分為三大類:(1) Secreted Signaling, (2) Extracellular Matrix (ECM) receptor interactions, (3) Cell-Cell contact interaction,因此可以看細胞群在這三類當中的訊號傳導分別相似 pattern。
下圖 Outgoing 表示計算出的 Cell-Cell communication 有向網路中做為 secreted 傳出,Incoming 則是 target。左圖可以看到 MYL 類型的細胞大部分具有一樣的 pattern,而這些pattern 是因為這幾個 TGFb/ IL1/ CSF/ TNF/ RANKL 可能有類似的輸出;右圖同理。
- 細胞群對所有訊號傳導路徑當中的貢獻程度
這邊點的大小就是細胞群在每個對應的訊號傳導中,參與的比例。下圖Outgoing表示計算出的 Cell-Cell communication 有向網路中做為 secreted 傳出,Incoming 則是 target。
以上是CellChat的介紹。
哎呀,我想知道更多!來來來~前面我們分享許多單細胞研究文章,回顧一下吧!
10x Genomics 新知分享-單細胞定序平台在COVID-19研究上的相關應用
單細胞定序分析介紹 (七): 細胞的命運PHATE or Fate
單細胞定序分析介紹(六): 細胞標記 SingleR介紹
單細胞定序分析介紹 (五): 細胞標記 Cell type annotation
單細胞定序分析介紹 (四): 單細胞研究資料庫
單細胞定序分析介紹 (三): Batch Effect
單細胞定序分析介紹 (二): Seurat
單細胞定序分析介紹 (一): Cell Ranger
人體版的Google Map-人類細胞圖譜計畫
10x Genomics 讓“腸識”變成“常識”
10x Genomics? CD player? 傻傻分不清楚?
3. Chan, I.S., et al., Cancer cells educate natural killer cells to a metastasis-promoting cell state. Journal of Cell Biology, 2020. 219(9).
4. Wang, Y., et al., iTALK: an R Package to Characterize and Illustrate Intercellular Communication. 2019: p. 507871.
5. Efremova, M., et al., CellPhoneDB: inferring cell–cell communication from combined expression of multi-subunit ligand–receptor complexes. Nature Protocols, 2020. 15(4): p. 1484-1506.
6. Newton, A.H., A. Cardani, and T.J. Braciale, The host immune response in respiratory virus infection: balancing virus clearance and immunopathology. Semin Immunopathol, 2016. 38(4): p. 471-82.
7. Jin, S., et al., Inference and analysis of cell-cell communication using CellChat. 2020: p. 2020.07.21.214387.
8. Ronen, J. and A. Akalin, netSmooth: Network-smoothing based imputation for single cell RNA-seq [version 3; peer review: 2 approved]. 2018. 7(8).
9. Cowen, L., et al., Network propagation: a universal amplifier of genetic associations. Nature Reviews Genetics, 2017. 18(9): p. 551-562.
10. Szklarczyk, D., et al., STRING v11: protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Res, 2019. 47(D1): p. D607-d613.