看人工智能如何玩轉科研
尋找新粒子的蹤跡
早在上世紀80年代末,粒子物理學家就開始“擺弄”人工智能。當然,他們的領域很適合人工智能和機器學習算法“大展拳腳”,因為幾乎每項實驗都需要在粒子探測器獲取的海量類似數據中找出微小的空間模式,而這正是人工智能的強項。在無數科學家的努力下,人工智能已“躋身”物理學研究的必備工具之列。
粒子物理學家力圖使帶有巨大能量的亞原子粒子相互碰撞以釋放出獨特的新物質微粒,從而理解宇宙的內在運行邏輯。例如,2012年,科學家們利用大型強子對撞機(LHC)發現了希格斯玻色子,這種粒子可以解釋所有其他基本粒子如何獲得質量。
不過,這些奇異粒子并非自帶標簽。在LHC,約10億次對撞才出現1個希格斯玻色子。與此同時,它會在十億分之一皮秒(1皮秒=萬億分之一秒)內衰變成光子對或μ介子等其他粒子。而且,碰撞中會產生很多不相關粒子,使得“重現”希格斯玻色子愈發艱難。
費米國家實驗室物理學家普西帕拉薩·巴特介紹說,神經網絡等算法的優勢就在于從背景中篩選出信號。在粒子探測器中,光子通常會在電磁量能器中創建粒子束,電子和強子雖也如此,但它們的束流與光子的稍有不同。機器學習算法可通過發現描述束流的多個變量之間的相關性,將它們區別開來。此類算法還能將希格斯玻色子衰變產生的光子對與隨機光子對區別開來。
當然,目前物理學家仍然主要依靠對基礎物理的理解來發現新粒子和現象的“蛛絲馬跡”,但勞倫斯伯克利國家實驗室的計算機專家保羅·卡拉費拉表示,人工智能的重要性與日俱增。到2024年,研究人員將升級LHC,使其碰撞率提高10倍,屆時,機器學習將在應對數據洪流方面發揮重要作用。
探尋自閉癥的基因根源
對于遺傳學家們來說,自閉癥是一項棘手的挑戰。遺傳定律表明,它擁有強大的遺傳因素。然而,已知在自閉癥中起作用的基因變體只能解釋約20%的病例,尋找可能導致自閉癥的其他變體,需要從與2.5萬個其他人類基因及周圍DNA有關的數據中尋找線索。對于研究人員來說,這是一項艱巨的挑戰。有鑒于此,普林斯頓大學計算生物學家奧爾加·特洛楊斯卡婭與紐約西蒙斯基金會合作,希望從人工智能那兒獲取支持。
特洛楊斯卡婭將上百個數據集結合在一起,數據涉及哪些基因在特定人類細胞中活躍、蛋白如何相互作用、轉錄因子結合位點以及其他關鍵基因組特征位于何處等。隨后,她的團隊利用機器學習構建了基因相互作用的圖譜,并將已確認的自閉癥風險基因,同數千個與自閉癥有關的未知基因進行比對,希望找出它們的相似性。此項研究標記出了另外2500個可能與自閉癥相關的基因,相關成果去年發表在《自然—神經科學》雜志上。
不過,正如遺傳學家最近所意識到的,基因并非“單打獨斗”。它們的行為受附近數百萬個非編碼堿基的影響。這些非編碼堿基同DNA結合蛋白以及其他因素相互作用。確認哪些非編碼變體可能影響附近的自閉癥基因是一個更棘手的問題。特洛楊斯卡婭的研究生周健(音譯)正利用人工智能解決這一難題。
洞悉化學合成的秘密
德國明斯特大學的馬金·澤格勒和其他人則正在將人工智能引入他們的“分子廚房”。他們希望,人工智能可以幫助他們應對分子制造過程中的一個關鍵挑戰——從數百個潛在的基本模塊和數千種組合方法中找出最合適的方法。
于是,澤格勒和導師馬克·沃爾勒博士以及計算機學家麥克·普瑞斯博士求助人工智能。他們并沒有對化學反應規則編程,而是設計了一個深度神經網絡程序,可自學化學反應如何進行。隨著時間的推移,這個網絡學會了如何預測合成過程中某個特定步驟的最佳反應,最終它提出了從頭合成分子的“配方”。
這三位科學家利用40種不同的目標分子對程序進行了測試,并與傳統的分子設計程序進行比較。在兩個小時內,傳統方法提出了合成22.5%的分子合成方案;人工智能則完成了95%。澤格勒即將前往倫敦的一家制藥企業工作,他希望用這一方法改進藥物的生產過程。
美國斯坦福大學的有機化學家保羅·文德博士表示,現在判斷澤格勒的方法是否有效還為時過早,但他認為,這一方法“可能會產生深遠的影響”。
澤格勒說,人工智能就像化學領域的GPS導航系統,善于尋找路線,但不能自行設計并實現完整的合成過程,因而不會很快取代有機化學家。(記者 劉霞)
- 下一篇:移動支付 中國引領世界發展
- 上一篇:人工智能走進法院“判案子”