阿默斯特,大眾-由于從科研,空軍辦公室$ 1.95萬美元的贈款馬科斯Katsoulakis和呂克·雷伊-貝萊,在馬薩諸塞州阿姆赫斯特大學的數(shù)學和統(tǒng)計部門的兩位教授,以及保羅·杜普伊斯,布朗大學,將在接下來的四年里開發(fā)一種新的機器學習方法,超越對大數(shù)據(jù)的傳統(tǒng)依賴。
傳統(tǒng)的機器學習依賴于龐大的數(shù)據(jù)緩存,算法可以篩選這些數(shù)據(jù)以“訓練”自己完成任務,從而產(chǎn)生基于數(shù)據(jù)的數(shù)學模型。但是,如果數(shù)據(jù)很少,或者生成足夠多的數(shù)據(jù)成本高得令人望而卻步呢?一種可能的、緊急的補救措施——通常被稱為科學機器學習——是將多年的科學研究中獲得的專家知識融入算法中,以開發(fā)物理原理和規(guī)則。
人們對包括醫(yī)學、工程、制造和科學在內的各種應用領域和行業(yè)的科學機器學習非常感興趣,但關鍵挑戰(zhàn)之一是如何確保算法預測的可靠性。
這就是 Katsoulakis 和 Rey-Bellet 的用武之地,他們共同為科學機器學習帶來了新的視角,一個專注于“分歧”的視角。“‘發(fā)散’的數(shù)學概念,”Rey-Bellet 說,“是一種量化機器學習算法預測與實際實驗數(shù)據(jù)之間差距的方法。”他補充說,“分歧使研究人員能夠測試不同的機器學習算法并找到產(chǎn)生最佳結果的算法。”
該團隊提出了一類新的分歧,其中涉及兩個虛構的、相互競爭的代理——“玩家”——他們互相玩“游戲”。第一個玩家提出了一種新的機器學習模型,它模擬了一個真實的場景;如果模型的預測與可用的現(xiàn)實生活中的實驗數(shù)據(jù)不夠匹配,則其他參與者可以拒絕該提議。游戲繼續(xù)進行,直到玩家找到同時滿足他們的算法。但是這些玩家有一個技巧:“我們分歧中的一個關鍵的新數(shù)學特征允許玩家'了解他們的物理',”Katsoulakis說。“更聰明的玩家競爭更有效,相互學習得更快,訓練需要的數(shù)據(jù)更少,但仍然對學習新物理持開放態(tài)度。”