數學與統計學學院張曉飛教授團隊在空間轉錄組學領域取得重要進展-大众娱乐

  • 大众娱乐

    學子·學者·學術

    數學與統計學學院張曉飛教授團隊在空間轉錄組學領域取得重要進展

    日期:2023-12-26 作者:張曉飛 點擊量:

    華大在線訊(通訊員 張曉飛)近日,數學與統計學學院張曉飛教授領導的課題組在空間轉錄組學領域研究中取得了重要進展,在《Genome Biology》期刊發表了題為“ENGEP: advancing spatial transcriptomics with accurate unmeasured gene expression prediction”的研究論文(https://doi.org/10.1186/s13059-023-03139-w)。張曉飛為該論文的通訊作者,2022級博士研究生楊詩童為該論文的第一作者,大众娱乐為該項研究的獨立完成單位。

    在單細胞測序技術中,由於細胞在測序過程中的解離,導致無法獲取細胞空間位置的相關信息,從而製約了我們對多細胞生物中細胞協調情況的深入理解。為了克服這一困境,空間轉錄組技術應運而生,為研究人員提供了一種能夠同時捕捉細胞的基因表達和位置信息的新途徑。然而,盡管基於成像的空間轉錄組方法具備高分辨率和高靈敏度,但它卻麵臨著同時測量目標基因數量較少的挑戰。

    為了解決基於成像的空間轉錄組方法中目標基因數量有限的問題,張曉飛教授團隊開發了一款名為ENGEP的計算方法。該方法利用k近鄰加權回歸和集成學習策略,能夠準確預測空間轉錄組中未測基因的表達。ENGEP利用多個參考數據集、各種相似性度量和不同的近鄰數量生成多個基礎預測結果,並通過加權集成這些結果,形成了一致性的最終預測結果(圖a)。這一策略不僅提升了預測的準確性和方法的穩健性,還避免了繁瑣的參數選擇過程,使用戶更易於操作。

    研究評估了ENGEP在三個使用不同技術生成的空間轉錄組數據集上的性能,並將其與五種前沿方法進行了比較。結果顯示,ENGEP在準確預測基因表達方麵顯著優於其他方法,同時能夠校正低質量基因的表達。此外,ENGEP還能夠準確預測空間未測基因的表達模式,對增強空間轉錄組學數據具有重要意義(圖b)。研究還揭示了在預測的未測基因中存在新的空間表達模式,為理解大腦、腫瘤等複雜組織的功能結構提供了新的洞見(見圖c)。

    圖為ENGEP增強空間轉錄組學數據。a:ENGEP算法工作流程。b: ENGEP準確預測空間未測基因的表達模式。c:ENGEP揭示新的空間表達模式。ISH圖片來自Allen Mouse Brain Atlas (http://mouse.brain-map.org/

    總體而言,ENGEP成功解決了空間轉錄組學數據中未測基因較多的問題。相較於現有方法,ENGEP的獨特之處在於不依賴於單一的參考數據集或方法,而是整合了多樣性的結果,克服了以往方法的局限性,實現了更一致和準確的預測。其集成學習策略為參考數據集的選擇、批次差異的校正以及相似性度量的選擇提供了新的思路。此外,相對於其他方法,ENGEP在運行時間和內存使用效率上也表現出色,使其能夠輕鬆應對大規模數據集的分析。該工作得到了國家自然科學基金的資助。

    (審讀人:王海 郭玉勁)

    大眾娛樂