2月3日,國際學(xué)術(shù)期刊Nature Communications在線發(fā)表了中國科學(xué)院分子細胞科學(xué)卓越創(chuàng)新中心(生物化學(xué)與細胞生物學(xué)研究所)吳立剛研究組的最新研究成果,題為 “An absolute quantification atlas of small non-coding RNAs across diverse mammalian tissues and cell lines”。該研究開發(fā)了深度測序新方法4NBoost,實現(xiàn)了對microRNA(miRNA)和PIWI相互作用RNA(piRNA)等非編碼小RNA(簡稱小RNA,sncRNA)的高精度絕對定量,在此基礎(chǔ)上,團隊構(gòu)建了覆蓋多種哺乳動物組織、擬南芥組織以及常用細胞系的小RNA定量圖譜,并進一步搭建了數(shù)據(jù)庫SmRNAQuant (http://wulg-lab.sibcb.ac.cn/SmRNAQuant/),為科研人員提供便捷、可靠的小RNA高精度表達圖譜查詢服務(wù),支持公開使用與深入挖掘。
大量研究表明miRNA、piRNA和小干擾RNA(siRNA)等小RNA在生殖、發(fā)育、表觀遺傳及腫瘤發(fā)生等生命過程中發(fā)揮了極為重要的調(diào)控作用。小RNA的調(diào)控活性與其細胞內(nèi)表達濃度密切相關(guān),高豐度的小RNA通常能夠更有效地抑制靶基因表達;另外,雙鏈小RNA前體的鏈選擇性對于小RNA發(fā)揮功能也至關(guān)重要。因此,絕對定量對于解析小RNA的功能具有重要意義,而小RNA的定量偏差不僅極大地影響基礎(chǔ)研究的準(zhǔn)確性,也阻礙了疾病標(biāo)志物的發(fā)現(xiàn)和精準(zhǔn)治療的發(fā)展。
近年來快速發(fā)展的二代測序技術(shù)有力推動了小RNA研究的深入和拓展,但目前主流測序文庫構(gòu)建依賴于 T4 RNA 連接酶進行接頭連接,該酶因其固有的RNA結(jié)構(gòu)依賴性,會引入顯著定量偏差,導(dǎo)致部分小RNA表達水平被系統(tǒng)性高估或低估,從而影響功能解析。為減少這一偏差,研究者已開發(fā)出多種改進策略,例如引入隨機接頭或提高 PEG濃度,代表性方法包括4N-seq、AQ-seq、IsoSeek和NEXTflex。然而,這些方法主要針對3′端為2′-羥基(2′-OH)的小RNA優(yōu)化,對普遍攜帶2′-O-甲基修飾(2′-Ome)的piRNA及植物miRNA效果較差,且多數(shù)方法未引入分子標(biāo)簽(UMI)以校正PCR擴增偏好,難以實現(xiàn)小RNA的絕對定量。此外,現(xiàn)有小RNA數(shù)據(jù)庫(如miRBase、MirGeneDB、miRmine和DIANA-miTED)均基于存在系統(tǒng)偏差的測序數(shù)據(jù)構(gòu)建,缺乏定量準(zhǔn)確的小RNA參考數(shù)據(jù)庫。
針對上述挑戰(zhàn),研究團隊開發(fā)了4NBoost測序技術(shù),通過引入隨機接頭并優(yōu)化建庫體系,最大限度降低連接偏差,同時利用已知濃度的外源RNA spike-in建立標(biāo)準(zhǔn)曲線,實現(xiàn)文庫中小RNA分子的精準(zhǔn)絕對定量。利用該技術(shù),研究團隊系統(tǒng)分析了20種小鼠組織、18種食蟹猴組織、24種常用細胞系以及4種擬南芥組織中的小RNA表達圖譜,構(gòu)建了目前涵蓋范圍最廣泛的哺乳動物小RNA絕對定量參考圖譜數(shù)據(jù)庫。與現(xiàn)有小RNA數(shù)據(jù)相比,該圖譜在小RNA豐度評估、鏈選擇性分析及組織特異性表達解析等方面均表現(xiàn)出更高準(zhǔn)確性。
傳統(tǒng)小RNA測序數(shù)據(jù)規(guī)模龐大,蘊含過去二十多年對不同物種、組織、細胞和疾病研究中積累的大量小RNA表達圖譜信息,是極為珍貴的巨大資源庫,如何利用上述資源更好地服務(wù)基礎(chǔ)研究和轉(zhuǎn)化醫(yī)學(xué)領(lǐng)域的小RNA研究是一項重大挑戰(zhàn)。因此,研究團隊引入機器學(xué)習(xí)方法,對既有數(shù)據(jù)中存在的系統(tǒng)偏差進行建模與校正,從而實現(xiàn)直接將傳統(tǒng)測序數(shù)據(jù)轉(zhuǎn)化為定量更為準(zhǔn)確的表達圖譜。這一策略有效提升了歷史數(shù)據(jù)的利用價值,避免了重復(fù)測序帶來的資源消耗。進一步,基于4NBoost產(chǎn)生的無偏定量數(shù)據(jù),團隊構(gòu)建了SmRNAQuant數(shù)據(jù)庫,并整合偏差校正模型,為科研人員提供便捷的小RNA高精度表達圖譜查詢與分析平臺。
綜上,該研究通過建立4NBoost技術(shù)、偏差校正模型及SmRNAQuant數(shù)據(jù)庫,共同構(gòu)建了一個功能完整的一體化研究體系,為推動小RNA基礎(chǔ)機制研究及臨床轉(zhuǎn)化應(yīng)用提供了重要的工具與平臺,同時也標(biāo)志著小RNA研究從“相對表達時代”邁入“絕對定量時代”。
分子細胞卓越中心博士后肖穩(wěn)、博士研究生鄭玉麗、副研究員張宏道和高級實驗員徐蓓英為該論文的共同第一作者。分子細胞卓越中心吳立剛研究員和張宏道副研究員為該論文的共同通訊作者。該研究獲分子細胞卓越中心動物實驗技術(shù)平臺、生物信息學(xué)平臺和高性能計算存儲與網(wǎng)絡(luò)服務(wù)中心大力支持,同時獲國家自然科學(xué)基金委、科技部、中國科學(xué)院和上海市經(jīng)費支持。
文章鏈接:https://www.nature.com/articles/s41467-026-68812-7

4NBoost方法(左)實現(xiàn)偏差最小化、高精度絕對定量的小RNA測序?;谠摷夹g(shù),繪制涵蓋20種小鼠組織、18種食蟹猴組織、24種常用細胞系及4種擬南芥組織的小RNA絕對定量圖譜(中)。以上數(shù)據(jù)整合為SmRNAQuant在線數(shù)據(jù)庫(右),為科研人員提供便捷、可靠的小RNA絕對表達查詢、比較與分析平臺