新研究,利用FUN-PROSE預測真菌基因的反應

利用FUN-PROSE預測真菌基因的反應

 二維碼
發表時間:2023-11-22 16:53

來自環境的信號引發一系列變化,以不同的方式影響不同的基因。因此,傳統上很難研究這些信號如何影響生物體。在一項新的研究中,研究人員開發了一種名為FUN-PROSE的機器學習方法來預測基因對不同環境條件的反應。

不管生物體是什么,細胞都會利用mRNA對周圍環境進行微調。首先,他們使用一種叫做轉錄因子的蛋白質來感知變化,然后將其與基因前面的DNA序列(稱為啟動子)結合。這種附著既可以阻止基因形成mRNA,也可以增加mRNA的數量。然后mRNA作為模板在細胞中產生負責各種功能的蛋白質。這種機制允許細胞快速重新分配資源,以維持生存。

研究啟動子如何被控制是基因組學中最古老的挑戰之一,但研究人員仍在繼續努力解決這個問題。**的問題是不同的轉錄因子可以結合到相同的啟動子序列,并且在不同的環境條件下以不同的排列方式結合。此外,雖然有一些證據表明轉錄因子傾向于與啟動子中的特定序列基序結合,但并非所有這些都得到了廣泛的研究。近年來,研究人員轉向人工智能來幫助他們解決這些挑戰。

生物工程和物理學教授Sergei Maslov (CAIM的***/CABBI):“基因有平均的表達水平,以前的機器學習模型無法測量在不同條件下這些水平是如何變化的。”“我們感興趣的是了解特定基因對pH值、溫度和營養變化的反應。

研究人員開發了一種名為條件特異性表達真菌啟動子”(FUN-PROSE)的模型,用于預測面包酵母(釀酒酵母)和研究較少的真菌粗神經孢子菌和Issatchenkia orientalis對環境變化的反應。

為了建立這個模型,研究人員首先必須確定這三個物種的啟動子序列和轉錄因子。然后,他們訓練模型來了解哪些啟動子基序在不同條件下被轉錄因子識別。

馬斯洛夫研究小組的研究生阿南森·納姆比亞(Ananthan Nambiar):“草棘球菌和東方棘球菌的轉錄因子不像葡萄球菌那樣廣為人知,所以我們必須推斷出哪些基因可以通過這些物種的轉錄因子來識別。維羅妮卡·杜賓金娜(Veronika Dubinkina)是馬斯洛夫小組的前研究生,現在是格萊斯頓研究所的博士后研究員,她說,這個過程涉及到一種常用的方法,即掃描已知與DNA結合的蛋白質區域。

最后,該模型學會了如何整合所有信息,以計算在特定條件下與mRNA的平均水平相比產生了多少mRNA。然后,研究人員將FUN-PROSE獲得的結果與RNA-seq數據進行了比較,RNA-seq數據測量了所有三種真菌的mRNA水平波動。每個生物體都有超過4000個基因和180個轉錄因子,這些轉錄因子在12-295個條件下被測量,這取決于對它的研究程度。

預測在一系列條件下哪些基因是重要的一直是一個難題。然而,我們發現我們的模型非常接近于預測這些生物體實際發生的情況,”Nambiar說。

除了評估其性能外,研究人員還闡明了該模型如何進行預測。馬斯洛夫研究小組的前本科生西蒙·(Simon Liu):“即使它有黑箱的性質,我們也能夠理解我們的模型是如何看待啟動子的,并發現它已經學會了搜索已知的序列。”“能夠解釋經過訓練的模型對于驗證其邏輯以及使用它來發現新的監管知識至關重要。

然而,這種模式確實在與以前從未遇到過的推廣者作斗爭。Nambiar:“這個模型在新的條件下很好,但是如果你給它一個新的基因或啟動子序列,它就會出錯。

根據馬斯洛夫的說法,這些錯誤是由于可用的數據有限。機器學習是一個黑匣子,你需要好好訓練它,這樣你才能學習生物學,他說。如果我們能獲得更多的數據,這個模型將有更多的模式可供學習,并將做出更準確的預測。

研究人員現在有興趣在其他生物體上測試他們的模型。原則上,我們的技術沒有任何限制——它應該適用于任何生物體。然而,以動物為例,基因以更復雜的方式控制,這將需要模型結構的重大改變和更多的訓練數據。”Maslov說。不過,看看這種模式能有多好,還是很有趣的。

本網站所有轉載文章系出于傳遞更多信息之目的,轉載內容不代表本站立場。不希望被轉載的媒體或個人可與我們聯系,我們將立即進行刪除處理。


相關閱讀
最新動態
產品目錄
常見技術問題

細胞培養進口胎牛血清

辦公地址: 北京市朝陽區萬紅西街2號中關村電子城.IC創新中心C1座206室

QQ客服:1258888686
郵箱:servicebj@viansaga.com 市場合作:13810524913
友情鏈接:
月子中心加盟
說明書下載
微信客服:diyishengwu
產品咨詢:400-166-8600

干細胞培養基

支原體祛除試劑進口

食品微生物檢測

ABUIABACGAAgxOLjmgYotvHX_AUwggI4ggI

關注官方公眾號