前言
在化工研發(fā)領域,為制造某種物質或材料,通常需要進行大量的化學實驗去以尋找一種合理高效的最佳合成路徑,而這些實驗中又涉及到多種實驗因素和工藝參數,如溫度、溶劑、催化劑種類、底物濃度等,由于進行實際化學實驗的成本極高(expensive to evaluate),需要消耗大量的實驗材料和資源,因此在巨大的搜索空間中對全量的實驗參數組合一一進行嘗試在經濟上是不切實際的。顯然,如何有效減少實驗嘗試次數,快速高效地得到可使指標達到理想范圍的實驗因素組合,成為化工行業(yè)從業(yè)人員日益關注的重要問題。
在該問題上,貝葉斯優(yōu)化(Bayesian Optimization)就是一種相對較好的解決方案,其是一種用于超參數搜索的方法,已在多個領域表現卓越。如圖1所示,當我們想要最大化某個指標時,隨著貝葉斯優(yōu)化方法的多輪迭代,其指標值整體呈現上升的趨勢,證明了算法的有效性。
圖1 單指標貝葉斯優(yōu)化算法效果展示
對于化學實驗優(yōu)化問題,貝葉斯優(yōu)化算法也可有效地縮短找到較優(yōu)實驗因素組合的進程。
但實際上,一方面,一個實驗需要優(yōu)化的并不僅僅是單個指標,而是會同時存在兩個或兩個以上的多指標(multi-objective),比如不僅要關注產物的收率,還要在此過程中盡可能地控制成本和預算,且很多時候指標之間甚至可以是相互矛盾的,這對于傳統的貝葉斯優(yōu)化來說是一個巨大的挑戰(zhàn),因其往往局限在對單個指標的優(yōu)化上,在指標數增多的情況下適用性降低;另一方面,不同領域不同行業(yè)之間的知識背景相差很大,因此照搬經典貝葉斯范式難以取得較好的效果,通常需要結合一定的專業(yè)領域內知識和方法,才能更好地發(fā)揮出貝葉斯優(yōu)化的優(yōu)勢。
綜上,現實情況的復雜性使得常規(guī)的貝葉斯優(yōu)化算法難以有效地實現需求。
國工算法優(yōu)勢
國工自研實驗優(yōu)化算法具備以下特點和優(yōu)勢:
多指標綜合優(yōu)化:傳統貝葉斯優(yōu)化往往局限在優(yōu)化單個指標,不適用于同時含有多個待優(yōu)化指標的復雜現實情境,國工自研算法在傳統貝葉斯優(yōu)化的基礎之上,緊跟國內外研究前沿,擴展了貝葉斯優(yōu)化的適用場景,能夠有效地支持多指標優(yōu)化任務。另外考慮到用戶對多個指標可能有著不盡相同的關注程度,因此算法也支持為各個指標分配不同的優(yōu)化權重,實現實驗信息個性化靈活配置;
支持離散實現數據:貝葉斯優(yōu)化通常在連續(xù)空間中表現良好,但離散或混合空間中欠佳,國工自研算法可以接受實驗因素的不同類型取值,連續(xù)型和離散型均可進行處理;
極值判斷:包括貝葉斯在內的許多優(yōu)化算法,常常存在著固有的對極值判斷的局限性,國工考慮結合計算化學領域的專業(yè)知識和方法(如勢能面構建)等,對合理的極值判斷加以支持。例如,當進行了200次或更多次的實驗后,發(fā)現其實在第100次時已然達到了最優(yōu)結果,但單純靠算法本身是無法知曉的,因此我們可以通過勢能面構建、能壘計算等計算化學的方法,與貝葉斯優(yōu)化算法相結合,更加高效地判斷到達極值的時點,從而將所需的嘗試次數進一步降低;
自動擬合修正:隨著實驗數據不斷積累,模型對于真實的概率分布也將擬合得越來越好,通過不斷修正更新先前的概率代理模型及采集函數,我們的算法將會推薦出更加合理有效的候選方案供用戶選擇;
總結:綜上所述,國工自研多指標實驗優(yōu)化算法能夠適用于多種復雜應用場景,顯著減少實驗人員進行嘗試的次數,節(jié)約時間和成本。
首先,打開國工智能數據大腦平臺,進入實驗優(yōu)化界面,對實驗信息進行配置。使用的指標分別是收率和成本,要求收率最大化及成本最小化,并可分配指標的權重,如圖2。
圖2 實驗指標配置
此外,還需對實驗因素進行配置,這里我們利用溫度、壓強、催化劑這三個因素,配置好各自可取的因素值以及單位,對于連續(xù)型值,用戶還可以按照范圍進行輸入。配置完因素后點擊完成配置按鈕即可,也可導入已有實驗配置信息。
其次,實驗信息配置完成后,即可開始進行算法優(yōu)化。在首輪沒有歷史數據的情況下,需要隨機從搜索空間中生成用戶指定個數的初始樣本,這里以5個為例,如圖3為輪次1的信息,這里的收率及成本實際值需要做實驗進行回填,用戶也可以根據自己的需求刪除一些樣本。
圖3 初始化歷史數據
將各方案指標值填充后,點擊方案推薦按鈕,算法會讀入輪次1的數據并推薦出用戶指定個數的方案,這里仍以推薦5個為例,如圖4,在輪次2中,算法提供了5組實驗因素組合,同樣的,用戶可做實驗對指標值進行回填。
圖4 算法推薦方案
最后,按照上述流程,將算法循環(huán)迭代多輪,對每輪推薦出的方案進行實驗回填,直至兩個指標均達到理想范圍或者已經枚舉出了所有的組合方案為止。為符合業(yè)務場景,我們還在算法內部增添了去重的功能,因此不會推薦出與歷史數據重復的方案,且每輪推薦完成后,還可以點擊實驗分析對推薦效果進行可視化,也可將方案導出為excel文件作其他用途。
下圖為本示例最終推薦效果的可視化展示,取出每輪推薦方案中指標值較優(yōu)的點繪制折線圖,雖有所波動,但收率整體上朝著最大化的方向進行優(yōu)化,同時成本也在逐漸最小化,并在第5輪推薦方案中二者均達到了可以接受的水平,證實了該算法的有效性。
圖5 多指標優(yōu)化算法效果
1.化工、材料、醫(yī)藥等領域需要進行大量實驗的工廠實驗室以及各大高校配備的實驗室等;
2.目前國工智能催化劑智能研發(fā)平臺GoCatal®已集成部署了多個功能模塊,可便捷地處理很多化工場景下的特定問題,該多指標貝葉斯實驗優(yōu)化算法可與其他組件協同,更好地實現客戶的需求。
專利證書
6月9日,第八屆煙臺國工智能科技有限公司AI研究院“AI課題文獻綜述分享茶歇會”成功舉辦。本次會議聚焦“基于遺傳算法的高分子配方設計方法”,通過前沿技術分享與案例解析,展現了國工智能在AI+材
精餾回收工藝是醫(yī)藥化工行業(yè)中的最為重要的典型單元操作之一,在原料藥、精細化工、輕工業(yè)等各個領域都有極其廣泛的應用。由于精餾過程的復雜性,精餾工藝過程的終點現階段仍需要生產工人每隔一定時間取樣送實驗室檢測,通過氣相色譜測定含量,卡爾費休滴定法
中秋節(jié)是中國傳統節(jié)日之一,也是一年中最重要、最盛大的節(jié)日之一。在這一天,以明亮的月亮和家人團聚為特點,承載著人們無盡的思念和美好的祝福。 國慶、中秋兩節(jié)遇, 合家團圓精神俱。 團團圓圓過中秋, 歡歡喜喜
2023年8月28日,國工智能與鎂伽科技舉行戰(zhàn)略合作簽約儀式,國工智能董事長柳彥宏與鎂伽科技創(chuàng)始人兼首席執(zhí)行官黃瑜清先生代表雙方簽訂正式戰(zhàn)略合作協議,標志著AI輔助化工研發(fā)領先者、智能自動化實驗室引領者開啟強強聯合發(fā)展之路。&n