第二十七章 信息生命體(七)
5.集群
我們和其他小組最近的一些研究,強(qiáng)調(diào)了在與環(huán)境的因果互動(dòng)和內(nèi)部信息處理中適應(yīng)性和魯棒性之間的平衡(Walker et al. 2016),已知信息處理特性表現(xiàn)出從穩(wěn)定階段(以信息存儲(chǔ)為主)到混沌階段(以信息傳遞為主)之間臨界轉(zhuǎn)變距離的強(qiáng)烈依賴性。眾所周知,臨界系統(tǒng)具有生物系統(tǒng)的兩個(gè)基本特征:對(duì)各種不同環(huán)境條件的適應(yīng)性和魯棒性。我們期望基因調(diào)控中的臨界性普遍存在,這將為生物網(wǎng)絡(luò)獨(dú)特的信息處理和控制特性研究提供參考。
Control kernel 控制核
復(fù)雜系統(tǒng)研究的主旨之一是理解并理預(yù)測(cè)出系統(tǒng)涌現(xiàn)的全局動(dòng)態(tài),例如動(dòng)態(tài)軌跡或最終狀(Barabási 2016)。這些代表系統(tǒng)集群行為的全局狀態(tài)可以通過施加外部因果干預(yù)來改變。引導(dǎo)整個(gè)系統(tǒng)從初始狀態(tài)到達(dá)期望的最終狀態(tài)。這為許多領(lǐng)域應(yīng)用都提供了強(qiáng)大的工具,包括從輿論動(dòng)態(tài)相關(guān)的問題到流行病,從細(xì)胞的分化到社會(huì)性昆蟲的巢穴選擇問題等等。
最近的研究發(fā)展了復(fù)雜網(wǎng)絡(luò)控制相關(guān)的數(shù)學(xué)基礎(chǔ),試圖通過理解因果結(jié)構(gòu)與各組成部分動(dòng)態(tài)的更新規(guī)則來尋找嚴(yán)格的控制機(jī)制。Liu 等人(2011)發(fā)展了他們的前瞻性框架,將具有線性動(dòng)態(tài)過程的有向復(fù)雜網(wǎng)絡(luò)可控性問題簡(jiǎn)化為一個(gè)圖論問題。利用他們的理論可以確定一組能夠完全控制整個(gè)網(wǎng)絡(luò)動(dòng)態(tài)的驅(qū)動(dòng)節(jié)點(diǎn)(driver nodes)。他們還發(fā)現(xiàn),所確定的驅(qū)動(dòng)節(jié)點(diǎn)往往是低度節(jié)點(diǎn),并且總數(shù)主要由網(wǎng)絡(luò)的度分布決定。
生物系統(tǒng)模型大多是非線性動(dòng)力學(xué)系統(tǒng),完全可控性既不可行也沒有必要。相反,找到一種特定的控制機(jī)制,能夠?qū)⒁粋€(gè)給定的系統(tǒng)從特定的初始狀態(tài)或軌跡引導(dǎo)到另一組期望狀態(tài)或軌跡集合,是更為現(xiàn)實(shí)的,往往也足夠的(Cornelius et al. 2013)。例如,控制基因調(diào)控網(wǎng)絡(luò)的主要目的之一是將系統(tǒng)引導(dǎo)到特定的細(xì)胞狀態(tài),而非任意的表達(dá)水平。這種表型控制通常被定位在整個(gè)網(wǎng)絡(luò)的一小部分中,以能驅(qū)動(dòng)系統(tǒng)到期望吸引子的控制核來定義。不過,控制核的大小通常比一般隨機(jī)網(wǎng)絡(luò)還要更大(Liu et al. 2011; Kim et al. 2013; Gates &Rocha 2016; Choo et al. 2018)。這表明生物系統(tǒng)的可控性程度可能存在一定的范圍,可以通過控制核的大小來量化。因此我們會(huì)將可控性程度視為生物系統(tǒng)信息架構(gòu)的基本特征(Walker et al. 2016; Kim et al. 2015),以區(qū)別于所有非生物集群。
Causal emergence 因果涌現(xiàn)
識(shí)別復(fù)雜系統(tǒng)中的因果關(guān)系是理解其涌現(xiàn)行為最基本的方法之一。然而這卻是一項(xiàng)艱巨的任務(wù):不僅因?yàn)閺?fù)雜系統(tǒng)中的因果結(jié)構(gòu)很復(fù)雜(坦率地講它們確實(shí)很復(fù)雜),而且因?yàn)橐蚬Y(jié)構(gòu)可以在多個(gè)時(shí)空尺度上進(jìn)行分析,往往讓我們搞不清楚哪種尺度是分析的首選(如果有的話)。長(zhǎng)期以來,人們一直認(rèn)為主因結(jié)構(gòu)只能在最低(微觀)尺度上定義,更高尺度上的因果結(jié)構(gòu)是有用的,但只是對(duì)主因結(jié)構(gòu)的粗略描述。即認(rèn)為微觀層面的因果關(guān)系確定了所有更高層次的因果結(jié)構(gòu),更高(宏觀)層次的因果并沒有實(shí)際上的因果貢獻(xiàn)(Kim 1993,2000)。
這種觀念下的還原論方法在科學(xué)各領(lǐng)域取得了廣泛的成功,包括物理學(xué)和化學(xué)的重大發(fā)展。盡管如此,因果涌現(xiàn)的另一種可能——宏觀尺度是因果結(jié)構(gòu)的重要驅(qū)動(dòng),被一再提出來,因?yàn)樗軐?duì)各種類型的生物集群行為提供更簡(jiǎn)單的解釋:從表觀遺傳學(xué)到蟻群的群體決策,再到大腦中的心理狀態(tài)等等。以往對(duì)這種因果涌現(xiàn)的研究大多局限于定性論證,而最近 Hoel 等人(2013)和 Hoel(2017)所做的定量研究表明,在一些系統(tǒng)中,因果結(jié)構(gòu)可能無法完全被微觀尺度結(jié)構(gòu)捕獲,相反宏觀層面的因果結(jié)構(gòu)會(huì)更有效、具有更豐富的信息。
如上所述,我們認(rèn)為尋找一種復(fù)雜系統(tǒng)的控制機(jī)制,可以成為研究不同層次因果結(jié)構(gòu)的有用工具,它能從局部(微觀)層次因果深入洞悉驅(qū)動(dòng)節(jié)點(diǎn)對(duì)全局(宏觀)系統(tǒng)動(dòng)態(tài)轉(zhuǎn)向的影響。
生物集群系統(tǒng)信息架構(gòu)與因果結(jié)構(gòu)之間的耦合關(guān)系
如上節(jié)所討論,在以往研究中已經(jīng)暗示了生命系統(tǒng)信息架構(gòu)與因果結(jié)構(gòu)之間的關(guān)系。然而它們之間是否存在有意義的關(guān)系、若存在是否能夠區(qū)分不同生物集群行為,這些問題卻仍然是模糊、沒有定論的。在這里我們提供了一個(gè)定量的例子,基于經(jīng)驗(yàn)數(shù)據(jù)集建立了一個(gè)生物網(wǎng)絡(luò)的動(dòng)力模型,其規(guī)模較小故允許進(jìn)行統(tǒng)計(jì)分析。由于系統(tǒng)生物學(xué)中高通量技術(shù)和數(shù)據(jù)驅(qū)動(dòng)方法的出現(xiàn),細(xì)胞生物通路的布爾網(wǎng)絡(luò)模型是滿足這一必要條件的最佳候選之一。
基于最近 Daniels 等人(2018)提供的迄今為止最全面的臨界性調(diào)查,對(duì)從細(xì)胞集群數(shù)據(jù)庫(Helikar et al. 2012)中獲得的67個(gè)細(xì)胞調(diào)控布爾網(wǎng)絡(luò)進(jìn)行了研究,顯示所有網(wǎng)絡(luò)都接近臨界狀態(tài)。另一方面,Kim 等(2013)分析了各種生物分子的調(diào)控布爾網(wǎng)絡(luò),并確定了控制核——控制細(xì)胞網(wǎng)絡(luò)達(dá)到預(yù)期狀態(tài)所必需的最小節(jié)點(diǎn)集。研究表明,對(duì)于大多數(shù)網(wǎng)絡(luò)而言,控制核只是網(wǎng)絡(luò)組件的一小部分。因此,利用同類生物分子的調(diào)控布爾網(wǎng)絡(luò)來研究生物系統(tǒng)、并將信息架構(gòu)與其因果機(jī)制結(jié)合起來,是我們自然的選擇。
在這里,我們以粟酒裂殖酵母(S.pombe,F(xiàn)ission Yeast)的細(xì)胞周期過程為案例,展示了如何在生物系統(tǒng)中研究信息架構(gòu)與因果機(jī)制之間的關(guān)系(Walker al. 2016;Kim al. 2015),并作為生物中心功能體現(xiàn)的一個(gè)簡(jiǎn)單實(shí)例。
裂殖酵母細(xì)胞周期的布爾模型描述
以布爾網(wǎng)絡(luò)對(duì)裂殖酵母的細(xì)胞周期進(jìn)行建模(圖5),共有9個(gè)關(guān)鍵蛋白組成(Davidich & Bornholdt,2008),通過被稱為 G1-S-G2-M 四個(gè)步驟的細(xì)胞功能進(jìn)行控制:從細(xì)胞生長(zhǎng)到DNA復(fù)制,再到細(xì)胞分裂成兩個(gè)子細(xì)胞。在網(wǎng)絡(luò)中,每個(gè)代表蛋白質(zhì)的節(jié)點(diǎn)都有一個(gè)0或1的布爾值,分別表示其缺失或存在,每個(gè)節(jié)點(diǎn)狀態(tài)的組合集被稱為網(wǎng)絡(luò)狀態(tài)或網(wǎng)絡(luò)配置。單個(gè)節(jié)點(diǎn)的狀態(tài),是與其它節(jié)點(diǎn)生化作用狀態(tài)的函數(shù),類型包括交互、抑制和激活。
將局部動(dòng)力規(guī)則應(yīng)用于每個(gè)節(jié)點(diǎn),以模擬系統(tǒng)一個(gè)時(shí)間步長(zhǎng)的演化。在對(duì)應(yīng)細(xì)胞周期起點(diǎn)的特定網(wǎng)絡(luò)配置上重復(fù)進(jìn)行時(shí)間演化,從而以準(zhǔn)確的順序再現(xiàn)生物過程各個(gè)階段序列。從512種可能的網(wǎng)絡(luò)狀態(tài)中的每一種開始生成網(wǎng)絡(luò)狀態(tài)空間,即所有可能時(shí)間演化的動(dòng)力學(xué)軌跡,其景觀就代表了裂變酵母細(xì)胞周期布爾網(wǎng)絡(luò)的全局動(dòng)態(tài)。網(wǎng)絡(luò)狀態(tài)空間包括13個(gè)吸引子、一個(gè)或一組多個(gè)網(wǎng)絡(luò)狀態(tài),其中任意時(shí)間演化軌跡都會(huì)收斂。由于動(dòng)力特性是確定性的,根據(jù)每個(gè)網(wǎng)絡(luò)狀態(tài)收斂到哪個(gè)吸引子,整個(gè)網(wǎng)絡(luò)狀態(tài)空間可以劃分為13個(gè)不相交的子群。其中,約74%網(wǎng)絡(luò)狀態(tài)結(jié)束所在的主吸引子是唯一具有生物功能的吸引子(Davidich & Bornholdt 2008)。
Kim 等人(2013)最近關(guān)于控制這些生物調(diào)控布爾網(wǎng)絡(luò)的時(shí)間演化軌跡的研究表明,存在一個(gè)控制核——能通過改變所有吸引子狀態(tài)景觀收斂到主吸引子,從而決定整個(gè)系統(tǒng)命運(yùn)節(jié)點(diǎn)的最小子集。對(duì)于裂殖酵母細(xì)胞周期網(wǎng)絡(luò),研究表明整個(gè)網(wǎng)絡(luò)中有4個(gè)蛋白是控制核——即當(dāng) Rum1、 we1、 Ste9 和 Cdc25 的狀態(tài)固定為1、1、1、0 ,與它們所在生物功能主吸引子中的狀態(tài)相同時(shí),從每種可能網(wǎng)絡(luò)配置開始的所有時(shí)間進(jìn)化軌跡都會(huì)趨于生物功能吸引子。
信息傳遞與控制核的關(guān)系——以裂變酵母細(xì)胞周期網(wǎng)絡(luò)為例
在最近的工作中(Kim et al. 2015),我們通過計(jì)算網(wǎng)絡(luò)中每一對(duì)節(jié)點(diǎn)之間的傳遞熵來量化裂變細(xì)胞周期網(wǎng)絡(luò)的信息架構(gòu),從結(jié)果中識(shí)別出生物學(xué)的特有的模式,并通過控制核證明它與控制機(jī)制之間的密切關(guān)系。為了區(qū)分生物系統(tǒng)表征的信息模式,我們將傳遞熵的分析結(jié)果與對(duì)隨機(jī)網(wǎng)絡(luò)集成進(jìn)行的相同分析進(jìn)行了比較,這些網(wǎng)絡(luò)被構(gòu)建為與每個(gè)酵母網(wǎng)絡(luò)共享某些相同拓?fù)涮卣?,但不?zhí)行相同的生物功能。
為了進(jìn)行比較,我們利用了 Erds-Rényi (ER)和無標(biāo)度(SF)兩種類型的隨機(jī)網(wǎng)絡(luò)集成。ER隨機(jī)網(wǎng)絡(luò)與裂變酵母網(wǎng)絡(luò),除了網(wǎng)絡(luò)大小外沒有共同的結(jié)構(gòu)偏向。相比之下,SF隨機(jī)網(wǎng)絡(luò)集成與細(xì)胞周期網(wǎng)絡(luò)一樣,每個(gè)節(jié)點(diǎn)保持相同數(shù)量的激活和抑制連接,這使得SF與生物網(wǎng)絡(luò)有相同的拓?fù)涠确植?。我們將單個(gè)網(wǎng)絡(luò)處理的總信息定義為其中所有節(jié)點(diǎn)對(duì)之間傳遞熵的總和。結(jié)果顯示,酵母細(xì)胞周期網(wǎng)絡(luò)處理的信息量比任何集合中大多數(shù)隨機(jī)網(wǎng)絡(luò)都多(圖6a)。這是一個(gè)直接測(cè)量結(jié)果,支持了與信息處理和臨界點(diǎn)相關(guān)的假設(shè),即在生物系統(tǒng)中臨界點(diǎn)附近存在著信息傳輸?shù)膬?yōu)化,不像以前沒有基于經(jīng)驗(yàn)數(shù)據(jù)集的定性或一般模型的研究,在這里這點(diǎn)被定量地清楚展示了出來。
通過根據(jù)每對(duì)節(jié)點(diǎn)傳遞熵的測(cè)量值分析縮放標(biāo)度,我們還研究了處理后的信息在各個(gè)網(wǎng)絡(luò)中的分布。標(biāo)度關(guān)系表明,與隨機(jī)網(wǎng)絡(luò)相比,生物網(wǎng)絡(luò)具有明顯異常的值(圖6b),生物管理信息最顯著的特點(diǎn)是,生物網(wǎng)絡(luò)中信息被處理得更加均勻。標(biāo)度模式還表現(xiàn)出了統(tǒng)計(jì)學(xué)上獨(dú)特的高-中等級(jí)節(jié)點(diǎn)對(duì)范圍,與隨機(jī)網(wǎng)絡(luò)中相應(yīng)尺度的節(jié)點(diǎn)相比,生物網(wǎng)絡(luò)的傳遞熵明顯更大。并且我們發(fā)現(xiàn),這種生物學(xué)上獨(dú)特的范圍是由控制核節(jié)點(diǎn)和非控制核節(jié)點(diǎn)之間的信息處理主導(dǎo)的(圖6c)。
細(xì)胞周期網(wǎng)絡(luò)在信息結(jié)構(gòu)上表現(xiàn)出與隨機(jī)網(wǎng)絡(luò)相區(qū)別的特征模式,控制核節(jié)點(diǎn)通過控制有關(guān)結(jié)構(gòu)的全局因果(狀態(tài)轉(zhuǎn)換圖中的因果流),在網(wǎng)絡(luò)信息傳遞中起主導(dǎo)作用,調(diào)節(jié)著系統(tǒng)全局狀態(tài)轉(zhuǎn)換。
圖5:裂殖酵母細(xì)胞周期調(diào)節(jié)的布爾網(wǎng)絡(luò)模型。節(jié)點(diǎn)代表調(diào)控蛋白,邊緣表示節(jié)點(diǎn)之間的兩種生化作用:激活(以箭頭結(jié)尾)和抑制(以條形結(jié)尾)。其中紅色節(jié)點(diǎn)是控制核,當(dāng)固定在特定值時(shí),它可以調(diào)節(jié)網(wǎng)絡(luò)的全局行為。該圖根據(jù) Davidich 和 Bornholdt(2008)和 Kim 等人(2013)的數(shù)據(jù)重新生成。
圖6:裂變酵母細(xì)胞周期網(wǎng)絡(luò)中的信息架構(gòu)和因果結(jié)構(gòu)。a ER(綠色)和 SF(藍(lán)色)網(wǎng)絡(luò)集成處理總信息的分布。每個(gè)數(shù)據(jù)點(diǎn)表示在x軸上,傳輸?shù)慕o定信息總量的各個(gè)集合中的單個(gè)網(wǎng)絡(luò)的數(shù)量。b 裂變酵母細(xì)胞周期中成對(duì)節(jié)點(diǎn)間傳遞熵的標(biāo)度,ER和SF網(wǎng)絡(luò)分別用紅色、綠色和藍(lán)色表示。對(duì)于1000個(gè)網(wǎng)絡(luò)的樣本,計(jì)算每個(gè)隨機(jī)網(wǎng)絡(luò)集合的平均值和標(biāo)準(zhǔn)差。虛線之間的區(qū)域表示裂變酵母的信息標(biāo)度在生物學(xué)上獨(dú)特的范圍。c 裂變酵母細(xì)胞周期網(wǎng)絡(luò)信息傳遞的標(biāo)度關(guān)系。CK 表示控制核節(jié)點(diǎn),而 NCK 則是一組不包含在控制核內(nèi)的節(jié)點(diǎn)。所示數(shù)據(jù)與中間面板中裂變酵母?jìng)鬟f熵的標(biāo)度模式相同。根據(jù)一對(duì)中每個(gè)節(jié)點(diǎn)是在CK還是在NCK中,標(biāo)度模式被分為四類信息傳輸。這些數(shù)字來自 Kim 等(2015)(在線彩色圖)