新研究揭開脊椎動物長非編碼RNA保守性之謎揭開脊椎動物長非編碼RNA保守性之謎 二維碼
發表時間:2024-01-25 16:54 人類基因組不僅編碼蛋白質基因,還包含數以幾十萬計的長非編碼RNA(lncRNA)基因,被稱為生命“暗物質”。lncRNA的發現和表征是過去幾十年分子生物學領域的重大進展。已有研究成果表明,lncRNA在發育、腫瘤等多種生理和疾病過程中發揮重要調控作用。分析基因在不同物種中的同源性和保守性,是研究和理解基因的基礎功能和進化的重要手段。但是,與蛋白質基因相比,lncRNA的序列保守性極低,傳統的序列比對方式只能鑒定出極少的不同物種間同源的lncRNA(圖1)。例如,在斑馬魚和人類上萬的lncRNA基因中,通過序列比對只能找到十幾個序列保守的同源lncRNA。然而,已有的案例表明,即使是序列保守性很低的lncRNA,不同物種中的相關lncRNA仍然具有功能上的保守性。顯然,lncRNA的保守性具有不同于蛋白質基因保守性的特征和要素,“這些特征和要素究竟是什么”是當前lncRNA領域亟需解開的一個謎團。 1月9日,清華大學生命科學學院張強鋒副教授,北京大學未來技術學院汪陽明教授、席建忠教授研究團隊合作在Nature genetics上發表題為“Computational prediction and experimental validation identify functionally conserved lncRNAs from zebrafish to human”(計算預測和實驗驗證鑒定人類和斑馬魚之間功能保守的長非編碼RNA)的研究論文。該工作開發了一套新的算法,在包括人類、小鼠、斑馬魚在內的8種脊椎動物中鑒定保守的同源lncRNA,同時開發了基于CRISPR的基因敲除和回補篩選系統,通過一系列實驗驗證了所鑒定的同源lncRNA在不同物種中的功能保守性,為該領域的研究提供了新的思路。 算法開發:該團隊首先開發了一套鑒定不同物種之間同源lncRNA的計算方法(lncHOME)。lncHOME計算方法通過比較基因組和機器學習的人工智能方法,在8種脊椎動物中鑒定出了一類在不同物種中具有保守基因組位置及保守RNA結合蛋白(RBP)結合位點模式的lncRNA(圖2)。這些不同物種中潛在同源的lncRNA被命名為coPARSE-lncRNA 【lncRNA with conserved genomic locations and patterns of RNA binding protein (RBP) binding sites】。lncHOME計算方法鑒定了570個在斑馬魚中具有同源基因的人類coPARSE-lncRNA,與之相比,通過傳統的序列比對的方式僅能鑒定出17個序列保守的同源lncRNA。相比于非同源的lncRNA,這些coPARSE-lncRNA基因富集了更多疾病相關突變,更傾向于在癌癥組織中異常表達,預示著coPARSE-lncRNA可能具有重要的生理或病理功能。 功能鑒定:該團隊深入探究了所鑒定的同源lncRNA的功能保守性。首先,通過建立CRISPR-Cas12a介導的大片段基因敲除篩選系統,該團隊鑒定出了75個能促進癌癥細胞增殖的coPARSE-lncRNA,其中37個在HeLa細胞中起重要作用。隨后,該團隊進一步開發了一個基于CRISPR-Cas12a的敲除和回補系統,發現通過回補預測的斑馬魚同源lncRNA片段可以挽救其中4個人類coPARSE-lncRNA的敲除所導致的HeLa細胞增殖的缺陷。更有意思的是,在斑馬魚胚胎中敲低這四個斑馬魚的coPARSE-lncRNA會導致嚴重的胚胎發育延遲,而這些表型又可以通過回補人類的同源lncRNA進行挽救。以上結果說明這些同源lncRNA具有很強的功能保守性。 機制解析:lncHOME算法得到的同源lncRNA必然具有保守的RBP結合位點模式。根據這一條件推測,coPARSE-lncRNA具有相似的RBP結合圖譜。針對其中兩條coPARSE-lncRNA,該團隊通過RNA沉降結合質譜實驗驗證了這一假設。對于上面所描述的可以挽救細胞增殖或胚胎發育缺陷的同源lncRNA片段,如果突變其中某些RBP(例如NONO和IGF2BP2)的結合位點,所得到的新的片段無法起到挽救效果。這些突變實驗進一步證明了RBP結合位點對于coPARSE-lncRNA的功能的重要性。 該團隊的研究提供了一套基于機器學習的計算分析方法,在脊椎動物中鑒定得到數目眾多的潛在同源的lncRNA,并通過基因敲除、敲低、回補實驗和結合蛋白質譜等實驗驗證了同源lncRNA的功能保守性。雖然這些同源lncRNA在進化過程中序列保守性逐漸消失,但是卻保留著保守的RBP結合模式(圖3)。該工作極大地擴展了當前脊椎動物中保守的lncRNA庫,為研究lncRNA的進化、功能及作用機制的解析提供了新視角和新資源。 清華大學生命科學學院黃文澤博士、熊團林博士及北京大學未來技術學院趙雨亭博士為論文的共同**作者。張強鋒、汪陽明和席建忠為論文的共同通訊作者。中國科學院動物研究所劉峰研究員、衡鑒博士,清華大學生命科學學院韓鴿博士、王鵬飛博士生,北京大學趙志華博士、李娟博士、石銘和汪家震博士生、吳怡霞為論文工作作出了重要貢獻。 該成果為研究lncRNA的保守性揭開了新的一頁,但其重要性仍有待考驗。這些資源和方法究竟能為lncRNA在其他生理病理過程中的功能提供多少借鑒仍有賴領域內科學家們的共同努力。此外,這些方法仍需要進一步完善,整合RNA結構和大模型,或者加入其他重要序列和特征(如小RNA結合位點、RNA修飾與編輯位點),有可能進一步完善lncRNA保守性的預測方法,從而提供全新的生物學洞見。分析更多物種(特別是非脊椎動物)的lncRNA數據,將會提供一個更為完整的lncRNA進化圖譜,讓我們一探占人類基因組絕大部分的“暗物質”的前世、今生和未來。
本網站所有轉載文章系出于傳遞更多信息之目的,轉載內容不代表本站立場。不希望被轉載的媒體或個人可與我們聯系,我們將立即進行刪除處理。 |
|