科學家開發出基于拉曼組與機器學習的微藻種質挖掘新技術

微藻是地球上代謝功能較爲多樣化的生物類群,在全球碳循環中發揮關鍵作用,也是生物技術産業中重要的一類光合細胞工廠。但微藻的種質鑒定和代謝功能檢測繁瑣,且自然界大部分微藻難以培養。近日,中國科學院青島能源研究所單細胞中心發表了首個微藻拉曼組數據庫,并結合機器學習示範了單細胞精度、快速的微藻種類鑒定和代謝功能表征。該技術爲微藻細胞工廠的高效挖掘和篩選提供了一個免培養、高通量的強有力手段,相關研究成果發表在《分析化學》上。

  微藻是在自然界中廣泛存在的單細胞光合自養生物,可将空氣中的二氧化碳高效轉化爲油脂、碳水化合物、蛋白質和色素等高附加值産品,應用于第三代生物燃料、飼料、食品和保健品等。因此,“微藻細胞工廠”有望成爲服務“碳中和”和“碳達峰”的低碳制造解決方案之一。這一前景的前提和基礎是微藻種質資源的快速鑒定和代謝功能檢測,然而,傳統上“先養後篩”的種質篩選策略面臨着諸多瓶頸。

  爲此,中科院青島能源所單細胞中心Mohammadhadi Heidari Baladehi等人開發出基于拉曼組的藻類細胞快速辨别與代謝功能快檢技術。拉曼組是一個細胞群體的單細胞拉曼光譜的總稱,代表着可以在單細胞精度快速、低成本、高通量獲取的細胞群體實時代謝狀态。首先,針對已獲純培養的藻種,研究人員采集了色素分子拉曼光譜(PS)和微藻細胞自身拉曼光譜(WS)這兩張譜圖,構建了首個藻類拉曼組數據庫。該數據庫包含了在不同生長期(穩定期和指數期)、分屬27個微藻種屬的超過9000個單細胞的拉曼光譜。該團隊開發的機器學習算法,通過PS和WS的聯用辨别待測單細胞的藻種和生長狀态,準确率可達97%。其次,針對環境中難培養的藻類細胞,研究人員借助前期發明的單細胞拉曼分選技術來捕獲活性藻類單細胞,采集其PS和WS這兩張拉曼譜圖,進而結合下遊單細胞測序,建立了環境中微藻單細胞代謝表型組和基因型的關聯。該方法不需分離培養,即可構建環境中任何微藻細胞的拉曼光譜數據庫,進而基于機器學習,支撐尚難培養藻種的快速鑒定和代謝功能檢測。此外,除了種質辨别,單細胞拉曼光譜還能揭示微藻利用二氧化碳後的碳源存儲形式(如油脂、澱粉、蛋白、色素等),及其含量和化學性質(如油脂的不飽和度等)。這些代謝表型信息,對于快速評估微藻種質的培養工藝、經濟價值和應用潛力十分重要。

  與傳統上依賴于培養的“先養後篩”的策略不同,這一基于拉曼組的種質篩選策略無需培養與擴繁細胞,節約了大量時間和人工,并能挖掘和篩選尚難培養的微藻細胞。針對每個微藻細胞,拉曼光譜的采集通常僅需數秒的時間,且無需破壞細胞,故而步驟簡潔、分析通量高、易于實現自動化,還能在單細胞精度同時探測從代謝表型組到基因組的全面信息。因此,該技術将加速微藻細胞工廠及其代謝産物的挖掘與利用。

  此次首個微藻拉曼組數據庫及其機器學習手段的發表,将加速新一代微藻資源信息平台的構建和共享,促進藻類爲“雙碳行動”做出貢獻。研究工作得到科技部、國家自然科學基金委員會、中科院、山東能源研究院、青島海洋科學與技術試點國家實驗室等的支持。

  拉曼組機器學習加速微藻種質挖掘、服務“雙碳行動”

  來源:中國科學院青島生物能源與過程研究所

 

Related Posts

Write a comment