趙陽沒有立刻給出答覆,他表情嚴肅地看著幕布上的基因表達調控網路圖,此時他的大腦正在飛速運轉。
在179智商的推演下,結合他LV5的數學和資訊學等級,很快,他腦海中構建出了幾種處理這種高維度生物資料的數學模型。
「常規的負二項分佈模型處理這種帶有大量重複序列的資料,必然會導致方差估計不準。」 伴你讀,.超貼心 ,提供給你,的閱讀體驗
沉默了一會兒之後,趙陽看著顧明教授和周圍的眾人,緩緩說出了自己的分析。
「這種農作物本身的基因組過於龐大,市麵上現成的商業生信分析軟體,底層的統計演演算法大多是基於普通的二項分佈或者泊鬆分佈。在麵對海量重複序列和測序深度不均時,極其容易將背景噪音放大,這就是你們得出幾萬個假陽性差異基因的根本原因。」
會議室裡的眾人都安靜地聽著。兩個研二的學長連連點頭,他們這幾天被這些假陽性資料折磨得痛不欲生。
「我來吧,教授。你把測序的原始資料檔案全部拷貝給我。」
趙陽看著顧明教授,直接給出了最終的解決方案。
「我回去重新寫一個比對和定量演演算法。不用現成的軟體,我直接在底層用隱馬爾可夫模型(HMM)和多維主成分分析(PCA)結合的方式,對你們的表達量矩陣進行重新聚類。」
趙陽的語氣裡帶著絕對的自信。
「隱馬爾可夫模型可以通過觀察到的測序序列序列狀態,推斷出隱藏的真實基因表達狀態,最大程度濾除測序儀產生的物理噪音。然後用PCA降維,剝離次要因素。」
「我會儘可能地將假陽性的範圍壓縮到一百個基因以內。然後結合加權基因共表達網路分析,找出連線度最高的Hub基因。最多兩天時間,我給你們一個個位數的候選基因列表。你們直接拿去打抗體或者做qPCR驗證就行了。」
會議室裡安靜了下來。
周圍眾人眼神之中都帶著不可思議的目光看著趙陽。
兩天?
那兩個學長麵麵相覷,都從對方的眼裡看到了震驚。
這裡麵的原始測序資料可是以TB來計算的!光是把這幾個TB的FASTQ檔案在電腦裡解壓讀取一遍,普通的伺服器都需要十幾個小時。
自己寫底層演演算法?還要在兩天內跑完資料,輸出最終的個位數靶點列表?
兩天時間也太短了。這在傳統的生物資訊學分析流程裡,是絕對不可能完成的任務。
「兩天時間夠嗎?」
顧明教授也有些遲疑地看著趙陽。他知道趙陽在數學和計算機上極強,但這畢竟是龐大的資料。
「我們這個實驗倒也是沒有那麼急,距離結題還有一段時間,你可以多花點時間穩妥處理……」
「夠了。」
趙陽笑著搖了搖手,打斷了顧明教授的話。
「不過就是洗資料改演演算法的事情。底層的數學邏輯我剛才已經在腦子裡建構完了,剩下的隻是敲程式碼和讓CPU跑運算的物理時間。兩天時間足夠了。」
「真不愧是數學天才!計算機天才!真厲害啊!」
顧明教授興奮地說道,雙手用力搓了搓。
「咱們實驗室要是能把這個耐旱的核心基因敲定下來,絕對能再發一篇高水平的《Nature Communications》或者子刊。這對於咱們生科院來說也是大成績!」
兩個學長也是滿臉佩服地看著趙陽。別人看著頭皮發麻的TB級資料,在趙神嘴裡,就像是做一道普通的初中數學應用題一樣輕鬆。這就是智商上的絕對碾壓。
「行,那今天下午你們先把資料整理一下拷進移動硬碟裡。後續如果有需要做凝膠電泳、PCR或者提質粒的濕實驗操作,我也會參與。」
趙陽說道。他沒有忘記自己來實驗室的根本目的。做真實的生化實驗是可以獲取生物學經驗的,趙陽絕對不會放過這些刷經驗的機會。
「沒問題。濕實驗這塊讓顧青帶你熟悉流程,她現在是咱們實驗室這批人裡手法最穩的。你跟著她學,上手最快。」
顧明教授直接安排道。
組會開得很短,也很高效。確定了方向和分工後,大家便散會了。
趙陽跟著顧青走出了會議室,回到了實驗室外部的操作檯前。
「那幾個TB的測序資料都在那台資料伺服器的硬碟裡,檔案太大,拷貝出來大概需要兩個多小時。」
顧青指了指角落裡的一台主機。
「趁著拷貝資料的這個時間,我先帶你熟悉一下目前的實驗流程和最近的一批樣本吧。」
「好。」
趙陽點點頭,順手從旁邊的衣架上拿了一件嶄新的白色實驗服穿上,將釦子扣好。
顧青看著穿上白大褂的趙陽。平時一向清冷的她,此時嘴角忍不住揚起了一個極其微小的弧度。
趙陽來了以後,她整個人都顯得開心了很多。有趙陽在實驗室,她感覺原本枯燥的實驗此時都顯得格外有趣了。
「這是我們昨天剛從溫室裡取下來的、經過四十八小時重度乾旱脅迫處理的植株葉片。取樣後第一時間就投入了液氮中,一直儲存在裡麵防止RNA降解。」
顧青戴上厚重的防凍手套,走到牆角的液氮罐前。
開啟罐蓋,一陣濃烈的白煙瞬間湧了出來,周圍的溫度驟降。
顧青用一把長柄鑷子,熟練地從底部的凍存架上夾出一個貼著標籤的凍存管,放在實驗台的冰盒上。
「我們需要把這些葉片在液氮的低溫下研磨成極其細微的粉末,然後加入Trizol試劑提取總RNA。這個過程非常容易發生外源RNase汙染和自身降解,所以動作要快,而且研磨缽和研磨棒必須全程保持極低的溫度。」
顧青一邊熟練地將液氮倒入白色的陶瓷研磨缽中進行預冷,一邊極其耐心地給趙陽講解著每一個步驟的注意事項、試劑的配比以及背後的生化原理。
趙陽站在她旁邊,認真地看著。
雖然他之前在實驗室待過一段時間,跟著做過一些基礎的PCR擴增,但畢竟RNA提取這個課題他還沒有親手做過。每一個課題的實驗流程和試劑特性,都會有細微的區別。
液氮在研磨缽裡劇烈沸騰。顧青將凍存管裡的葉片迅速倒入研磨缽中,拿起研磨棒開始用力研磨。
「來,你試一下手感。注意不要讓粉末飛濺出來。」
顧青研磨了幾下,將研磨棒遞給趙陽。