董莎萌:用大數據“治療”馬鈴薯癌癥
“太慘了,馬鈴薯葉子和莖稈上布滿了病斑,約2000畝的農田可能顆粒無收,罪魁禍首就是晚疫病,該病又被稱為馬鈴薯癌癥。”前不久,貴州省貴陽市息烽縣南撟村馬鈴薯田的“遭遇”,讓董莎萌十分憂心。
為緩解“疫情”,這位南京農業大學植物保護學院教授、博士生導師和他的學生連夜對“患病”馬鈴薯進行采樣分析,破解了致病菌的基因組,并篩選出兩款抗病性較好的馬鈴薯,推薦給當地農民。“明年,那里的農民就可以種這些抗病品種了。”董莎萌說。
這只是董莎萌接手的眾多“病例”之一。38歲的董莎萌像一位植保界的“外科醫生”,“追”著疫情跑遍全國的馬鈴薯晚疫病疫區;他又像一位植保界的“碼農”,開發出馬鈴薯晚疫病大數據監控系統,研究我國晚疫病發病與流行規律。
日前,董莎萌在國際上首次在三維水平,對海量作物病菌信息實現了提取、運算與分析,并對病菌的致病型進行了高精度預測和模擬。
死磕3年繪成基因組圖譜
打開南京農業大學馬鈴薯晚疫病卵菌菌株生化培養箱,一個個布滿菌絲的培養皿映入眼簾。在這個資源庫里,保存著450多份具有代表性的晚疫病菌株,這是董莎萌所在團隊用12年收集來的。它們有的來自英國、荷蘭、法國,有的則來自我國黑龍江、福建、安徽、貴州等馬鈴薯主產區。
“中國的馬鈴薯產量世界第一,且國家推行了馬鈴薯主糧化戰略,而晚疫病是馬鈴薯的頭號‘殺手’,若弄清了我國晚疫病的發病與流行的規律,就可讓農民少打農藥,指導他們精準選育、豐產豐收了。”穿著白大褂,行走在實驗室里的董莎萌腳步飛快。
由于對晚疫病的原有認知不足,研究工具又很有限,至今我國學者對晚疫病的致病和成災機制,還不是十分清楚。但2017年夏天的一個夜晚,董莎萌迎來了高光時刻。
那晚10點多,董莎萌和學生繪制的國際首個三維晚疫病表觀基因組圖譜問世。此前,他們就此研究了近3年。
這張圖譜,源于董莎萌2014年開始設計集成的一款晚疫病基因組的三維大數據監控系統。“以往國內外科研人員分析晚疫病菌脫氧核糖核酸(DNA)時,只能以二維視角監測基因序列是否發生變異。但三維系統,能看到每個基因序列的空間和結構信息。”他說。
跨越生物學和計算科學兩個領域進行研究,這曾一度讓董莎萌陷入至暗時刻。“2015年前后,我感到非常痛苦,團隊都是做生物研究的,而進行大數據分析需要懂算法。”董莎萌說。
為惡補算法短板,董莎萌開啟“學霸模式”,每天十幾個小時泡在實驗室,一邊自學編程、算法,一邊四處給專家、同行寫信求助,“但吃了不少閉門羹”。即便到了半夜12點,董莎萌辦公室的燈還常亮著。
最終,他將傳統計算機20多天才能完成的晚疫病致病型數據分析,壓縮到了2天。如今,實驗室的數據庫里,已存儲了70余張我國菌株的2維基因組圖譜,三維的晚疫病菌表觀基因組圖譜已增至15張。
一聽說有疫情就奔赴疫區
戶外鞋、沖鋒衣、GPS定位儀、大量的采樣袋……這些東西堆滿了董莎萌的辦公室。一旦聽說哪里出現晚疫病疫情,他帶著這些“神器”,說走就走。
“我們趕病害的,拖拖拉拉就可能錯過最佳采樣時機了。”有一次,他上午10點接到電話,下午4點就出現在安徽省界首市的地頭上。
在我國,馬鈴薯晚疫病的發病率接近40%,由此每年造成的損失超過70億元。晚疫病,已日漸成為制約我國馬鈴薯產業發展的主要瓶頸。
這些年,為了采集盡可能多的菌株,董莎萌先后來到黑龍江、內蒙古、福建、安徽、云南、貴州、重慶、陜西、甘肅、寧夏、浙江等馬鈴薯產區。
晚疫病病情暴發的疫區,大多分布在山溝里。有一次,董莎萌帶著學生去寧夏省固原市采樣,下了飛機趕大巴再擠農機車,跟雞鴨擠在一起,折騰了快兩天,最終才抵達晚疫病疫區。
更糟糕的情況是,采集到的晚疫病菌株未能被分離成功,采集結果無一有效。今年5月在湖南,團隊上下連續4天進行田間采樣,可最終還是失敗了。
“遇到不順,只能硬扛。”無助的時候,董莎萌說,自己會獨自一人去操場上散步減壓,“最痛苦的一次,從下午4點走到晚上9點,腦中不停地分析失敗的原因”。
脆弱的一面,董莎萌會小心“藏”好,在學生眼中,“董老師總是充滿熱情,只要他認準的事,就會堅持到底”。最讓大家津津樂道的,就是他曾歷時4年、輾轉30多家機構,找到2008年導致我國西南地區馬鈴薯晚疫病暴發的菌株樣本。
- 標簽:
- 編輯:王麗
- 相關文章