Hi-C (High-through chromosome conformation capture) 是以整個細胞核為研究對象,利用高通量測序技術,結合生物信息分析方法,研究全基因組范圍內整個染色質DNA在空間位置上的關系,獲得高分辨率的染色質三維結構信息以及染色質調控元件相互作用圖譜。Hi-C可以與RNA-seq、ChIP-seq、ATAC-seq和WGBS(全基因組甲基化測序技術)等數(shù)據(jù)進行聯(lián)合分析,從基因調控網(wǎng)絡和表觀遺傳網(wǎng)絡來闡述生物體表型形成的相關機制。而其中ATAC-seq技術是繼FAIRE-seq、MNase-seq、DNase-seq目前最火熱的研究染色質開放性的新技術,自2013年后,文章的發(fā)表量逐年攀升。百邁客已做好承接各種組織類、細胞類樣本的HiC互作和ATAC-seq的準備,成功案例和項目經驗還缺您的一把火,年底大促銷等您快快來咨詢哦!
英文名稱:Acute depletion of CTCF rewires genome-wide chromatin accessibility
雜志名稱:Genome Biol.
影響因子:13.583
發(fā)表日期:2021年8月24日
摘要
CCCTC-結合因子(CTCF)是一種高度保守的含鋅指轉錄因子,被稱為“基因組編織大師”。它是研究最廣泛的三維(3D)染色質結構調控因子。研究發(fā)現(xiàn)在CTCF急性衰竭細胞模型和其他基因敲除模型中,CTCF在全基因組TAD和TAD內部loop環(huán)的形成中是不可或缺的。為了更好地理解CTCF結合占用率如何促進轉錄調控,本文系統(tǒng)地進行了多組學研究,特別關注染色質可及性。通過系統(tǒng)整合了ATAC-seq、RNA-seq, WGBS, Hi-C, Cut&Run和CRISPR-Cas9基因篩選技術,以及深度蛋白質組學和磷酸化蛋白質組學分析,用以研究CTCF蛋白急性耗竭對細胞的影響。
材料方法
實驗材料:人B細胞淋巴母細胞白血?。˙-ALL)細胞系SEM(DSMZ),3個單細胞克隆(clones 27, clones35和clones42)分別用IAA處理24 h和48 h誘導CTCF退化。
ATAC-seq:有無IAA處理的三個克隆細胞樣本,一式兩份。
全基因組甲基化測序(WGBS):IAA處理24h或無IAA處理的clone27。
蛋白質組和磷酸化蛋白質組分析:CTCFAIDSEM細胞,分為4個組:no IAA,+IAA 12h,+IAA 23h和+IAA 48h,一式三份。
RNA-seq:有無IAA處理24h或48h的DSMZ。(前期研究)
Hi-C:有或者無IAA處理的clone27和clone35。(前期研究)
Cut&Run實驗:有或者無IAA處理的clone35和clone42,選用CTCF抗體進行富集。(前期研究)
一、急性CTCF耗竭改變了染色質的可及性
前期研究已經通過將雙等位基因miniAID-mClover3標簽導入人的內源性CTCF位點,并產生了三個CTCFAID細胞的克隆。在強力霉素和生長素(IAA)處理下,強制表達與Skp1/Culin/F-box (SCF)泛素連接酶組分連接的OsTIR1,快速降解CTCF融合蛋白(圖1A)。當強力霉素和IAA完全從培養(yǎng)基中洗脫后,這種降解是可逆的。通過對三個單細胞來源的克隆進行IAA處理24小時的免疫印跡實驗,證實了CTCF能夠有效降解(圖1B),類似于之前在48h處理條件下的研究結果。
為了研究CTCF耗竭對全基因組染色質可及性的影響,對有或無IAA處理的CTCFAID細胞進行了ATAC-seq,同時野生型SEM細胞和通過CRISPR敲除兩個不相關靶點USF1和USF2的SEM細胞作為對照??偟膩碚f,共發(fā)現(xiàn)了8876個顯著降低的差異可及性區(qū)域(DARs), 8042個可及性顯著增加的DARs。熱圖和峰值信號強度結果都證實了DARs具有高度重現(xiàn)性(圖1C, D)。正如預期的那樣,這些DARs在熱圖中的聚類效果顯示出與CTCF耗竭相互一致的趨勢,但在USF1/2敲除的SEM細胞中保持不變,表明這些DARs具有依賴CTCF的特征。
接下來分析這些DARs與它們最近的CTCF motif之間的物理距離。結果表明,可及性減弱的DARs更接近于最近的CTCF motifs。相比之下,可及性增強的DARs與CTCF motif的距離顯著高于可及性減弱的DARs,但顯著低于對照組(圖1E)。
圖1 急性CTCF耗竭會改變染色質的可及性
二、急性CTCF耗竭后染色質可及性特征發(fā)生變化
前面綜合分析了在CTCF耗竭后,隨著染色質可及性的改變,轉錄因子的占用情況。接下來通過查看motif數(shù)據(jù)庫TRANSFAC中所有帶注釋的TF motif,在三類區(qū)域中計算他們的富集頻率:減弱的DARs、增強的DARs和對照區(qū)域。發(fā)現(xiàn)在減弱的DARs中最富集的TFs是CTCF和黏連蛋白(SMC3和RAD21)(圖2A)。Tn5插入位點的foot-printing分析證實,它們的motifs在motif中心受到保護(圖2C)。這些結果表明,減弱的DARs反映了CTCF耗竭產生的影響。
增強的DARs也富集到了CTCF motif,與之前的CTCF-motif距離分析一致(圖1E)。然而,最富集的TF不是CTCF motif。相反,有許多是與活性轉錄相關的一般轉錄因子(GTFs)(圖2B, D)。這些數(shù)據(jù)說明DARs的調控作用很可能和CTCF的抑制功能相關。
雖然CTCF和黏連蛋白的motifs在增強和減弱的DARs中都富集到了,但它們在增強的DARs中的foot-printing分析表現(xiàn)出不同的模式特征。與減弱的DARs中Tn5保護的motif中心相比,這些motif周圍的近端側翼區(qū)域更受保護,這與活性啟動子和增強子相關的串聯(lián)CTCF motif(2xCTSes)一致。結果發(fā)現(xiàn),8042個區(qū)域中有1244個(15.4%)的DARs與2xCTSes重疊,比對照區(qū)域和減弱DARs區(qū)域更富集。而這些2xCTSes被認為調節(jié)染色質loop環(huán),觀察到的DARs可能與染色質loop環(huán)直接相關。
接下來,將這些loop環(huán)分成三組,并用不同的標準繪制它們的正常染色質接觸數(shù)。與增強的DARs重疊的loop環(huán)展現(xiàn)出更多的染色質內接觸,而與減弱的DARs重疊的loop環(huán)展現(xiàn)出更少的染色質內接觸。三組的染色質內接觸均在CTCF耗竭后減少。然而,重疊于減弱的DARs的loop環(huán)減少的觸點顯著多于重疊于對照NFRs區(qū)域和增強的DARs的loop環(huán)(圖2E)。總的來說,loop環(huán)的形成可能只反映CTCF的結合狀態(tài),而不是直接調控染色質可及性。然而,較弱的遠端環(huán)似乎更容易失去CTCF。
最后嘗試探索這些DARs是否與TAD邊界有關,發(fā)現(xiàn)對照的ATAC-seq峰和減弱的DARs到TAD邊界的距離分布相似,而增強的DARs總體上出現(xiàn)在遠離TAD邊界的地方(圖2F)。已知TAD邊界在CTCF結合位點和轉錄活性基因(包括管家基因)中富集。CTCF占據(jù)的物理位置似乎與其轉錄調控密切相關。
圖2 急性CTCF耗竭后染色質可及性的特征變化
本文假設急性CTCF耗盡的細胞模型最適合于確定全基因組DNA甲基化的即時反應。
令人驚訝的是,當用WGBS生成DNA甲基化譜時,并沒有觀察到急性CTCF耗盡后全基因組DNA甲基化的變化。與ATAC-seq和CTCF Cut&Run的分析結果不同,DARs周圍的DNA甲基化水平在對照組和CTCF耗竭組之間沒有發(fā)現(xiàn)有差異性(圖S9A)。接下來分析差異甲基化區(qū)域(DMRs),發(fā)現(xiàn)只有49個顯著差異區(qū)域(圖S9B)。進一步檢查這些增強的DMRs富集的motif,并沒有發(fā)現(xiàn)CTCF或黏連蛋白(圖S9C),表明這些DMRs與CTCF占用沒有直接關聯(lián)。總之,研究結果表明,急性CTCF耗竭不會影響SEM細胞中全基因組DNA甲基化。
圖S9 急性CTCF耗竭不影響全基因組DNA甲基化
三、依賴CTCF的染色質可及性通過啟動子或增強子-啟動子loop環(huán)調節(jié)基因表達
雖然CTCF在某些位點的基因調控中不可或缺,如H19-IGF2、β-血紅蛋白、原鈣粘蛋白簇和TP53等,但目前尚不清楚這種轉錄調控是否由CTCF直接作用,或者染色質可及性是否也發(fā)揮了作用?;鹕綀D顯示增強的DARs中基因啟動子數(shù)比減弱的DARs中的更多(圖3A)。接下來計算DARs中的基因數(shù),發(fā)現(xiàn)這些基因在IAA處理后的細胞的RNA-seq數(shù)據(jù)中也表現(xiàn)轉錄差異。更多減弱的DARs往往與下調的基因相關,而更多的增強的DARs通常與基因表達增多相關。
對于表現(xiàn)出一致變化的基因,進一步檢查它們啟動子的ATAC-seq信號,并確認模式與預期一致(圖3B)。還使用基因表達水平和ATAC-seq信號z-score制作了熱圖,確認了可重復的模式(圖3C)?;谂琶罡叩幕蚣M行了基因集富集分析(GSEA),結果表明減弱的DARs與基因下調相關,而增強的DARs與基因上調相關。因此得出結論,與DARs相關的轉錄變化特征直接響應CTCF的急性耗竭。
CTCF基因啟動子的染色質可及性在CTCF耗竭時也有所增加(圖3D),這一點通過定量PCR (Q-PCR)進一步得到驗證(圖3E)。這些數(shù)據(jù)表明CTCF可以抑制自身以保持最*表達水平。對于CTCF耗竭后被下調的基因,如MYC,并沒有在啟動子區(qū)域檢測到有統(tǒng)計學意義的染色質可及性變化。因此,當啟動子區(qū)域保持開放時,遠端增強子區(qū)域的染色質景觀變得更難以接近,再加上CTCF耗竭,可能在控制能調控MYC轉錄的遠端增強子-啟動子loop環(huán)的形成中發(fā)揮作用。
圖3?啟動子或增強子-啟動子環(huán)調節(jié)基因表達
四、綜合分析假定的絕緣子CTCF結合位點
本文通過綜合分析建立了一個框架來識別假定的CTCF介導的絕緣子元件。將ATAC-seq結果中的3490個峰和有CTCF結合的峰取交集,共有716個增強的ATAC-seq峰。接下來,將它們與RNA-seq結果中上調的基因進行比對,判斷TSSs是否位于距離DARs區(qū)域2-50 kb的范圍。綜上所述,有67個基因符合這些標準(圖(Fig 4A)。這67個基因中有20個基因的附近有染色質loop環(huán)。例如,在BLCAP基因上游約7 kb處觀察到一個假定的抑制性CTCF結合峰,該峰位于Hi-C數(shù)據(jù)所示的染色質絕緣loop環(huán)中(圖4B )。在未經過IAA處理的對照CTCFAID細胞中,CTCF與該motif結合導致染色質可及性受到抑制,這在ATAC-seq數(shù)據(jù)中信號的缺失很明顯。然而,在急性CTCF耗竭時,ATAC-seq峰值信號和BLCAP mRNA表達明顯增加(圖4C)。
圖 4 綜合分析假定的絕緣子CTCF結合位點
五、CTCF抑制BLCAP表達的功能驗證
為了進一步驗證預測的假定絕緣子的作用,將慢病毒表達的引導RNA感染表達Cas9的SEM細胞中,然后進行抗生素選擇。Sanger基因組測序(Inference of CRISPR edit, ICE)在目標人群中檢測到約61%的總indel頻率(圖5A),與非靶向導向對照組(sgNT)相比,導致BLCAP mRNA表達顯著增加(圖5B)。用IAA處理CTCFAID細胞24和48小時,然后洗脫IAA進行CTCF修復。通過RNA-seq分析和Q-PCR驗證,驗證急性CTCF蛋白耗竭時BLCAP mRNA的表達(圖5C)。不出所料,生長素處理24或48 h后CTCF蛋白急性耗竭,BLCAP表達水平顯著升高。更重要的是,洗脫生長素后,其表達水平恢復到親本細胞的水平(圖5D)。綜上所述,這些數(shù)據(jù)有力地支持了CTCF在BLCAP調控區(qū)域的占用充當了控制BLCAP表達的功能絕緣體。

圖 5 CTCF在抑制BLCAP表達方面的作用的功能驗證
六、多組學聯(lián)合揭示CTCF共同調控因子
為了進一步研究急性CTCF耗竭對基因表達的影響,本文系統(tǒng)探索了CTCF介導的下游蛋白組和磷酸化蛋白組水平的基因表達,并將其與ATAC-seq和RNA-seq數(shù)據(jù)聯(lián)合分析(圖6A)。總的來說,將24小時治療組與無IAA治療組比較,確定了2550個差異表達蛋白質和1895個差異表達磷酸肽(圖6B)。雖然觀察到整體蛋白質組和轉錄組之間存在合理的相關性(圖6C),但只有488個DE mRNA。與免疫印跡和Q-PCR結果一致,基于質譜(MS)的蛋白質組學和RNA-seq分析證實,急性CTCF耗竭后,在蛋白水平上CTCF表達顯著減少,在mRNA水平上表達增加。這些數(shù)據(jù)表明,盡管mRNA水平的變化并不明顯,急性CTCF耗竭誘導了下游響應的大量中斷。
本文開發(fā)了一種多組學聯(lián)合的方法來定義CTCF共調控轉錄因子,總共鑒定了40個CTCF共同調控因子,這些TF在急性CTCF耗竭時在mRNA和/或蛋白質水平上顯著影響其下游靶基因的表達(圖6D)。正如預期的那樣,這40個CTCF共調控因子中的大多數(shù)也在CTCF介導的DARs中有共同定位,證實了它們與CTCF有著潛在的直接共同調控作用。
此外,我們還研究了CTCF的共調控模式,并選擇了候選的TF包括 ZBTB7A和YY1,同時DUX作為陰性對照來觀測。與對照和增強的DARs相比,這兩個motif的絕大多數(shù)距離減弱的DARs更近,這表明CTCF的耗竭可能會影響相鄰的開放染色質可及性,導致與其他TFs結合的缺失(圖6E,F)。而DUX4和CTCF motif距離分布均勻(圖6G)??傊?本文系統(tǒng)地揭示并驗證了CTCF介導和招募的主要共調控因子,通過編織和改變染色質可及性來實現(xiàn)下游轉錄調控,并證明了多組學分析方法是強大的,可以識別不具有明顯表達變化的隱藏主調控因子。
圖6 多組學分析CTCF調節(jié)下游基因表達的主共調控因子
討論
使用急性CTCF退化系統(tǒng)和豐富的可用數(shù)據(jù)集提供了直接證據(jù),表明CTCF調控染色質可及性,但不調控DNA甲基化。CTCF可能在串聯(lián)CTCF結合位點維持染色質可及性,從而招募CTCFL到附近的基因并啟動轉錄。雖然CTCF的急性耗竭會深刻地干擾整個染色質相互作用和可及性,但轉錄水平通常不會有顯著改變。這些發(fā)現(xiàn)表明在CTCF急性耗竭后蛋白質翻譯和翻譯后修飾過程中發(fā)生了潛在的全局變化??傊珻TCF的急性耗竭改變了染色質相互作用和可及性,需要進一步的研究來更好地理解CTCF的耗竭如何導致蛋白質和翻譯后修飾的巨大變化。
如果您對HiC&ATAC-seq測序技術感興趣,歡迎點擊下方按鈕聯(lián)系我們,我們將免費為您設計文章思路方案。