作者:國(guó)工智能實(shí)施團(tuán)隊(duì)—左鵬
前言
近年來,數(shù)據(jù)挖掘引起了信息產(chǎn)業(yè)界的極大關(guān)注,其主要原因是企業(yè)在生產(chǎn)、運(yùn)營(yíng)過程中產(chǎn)生大量的數(shù)據(jù),迫切的需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識(shí)。獲取的信息和知識(shí)可以廣泛用于各種應(yīng)用,包括商務(wù)管理,生產(chǎn)控制,市場(chǎng)分析,工程設(shè)計(jì)和科學(xué)探索等。國(guó)工智能實(shí)驗(yàn)室LIMS系統(tǒng)融合了國(guó)工智能數(shù)據(jù)大腦平臺(tái),平臺(tái)內(nèi)提供上百種統(tǒng)計(jì)學(xué)相關(guān)算法及機(jī)器學(xué)習(xí)算法;通過這些算法對(duì)企業(yè)數(shù)據(jù)進(jìn)行分類分析、聚類分析、關(guān)聯(lián)分析、預(yù)測(cè)分析,挖掘數(shù)據(jù)潛在價(jià)值,探索人力無法探知的規(guī)律,提高企業(yè)產(chǎn)品附加值及行業(yè)競(jìng)爭(zhēng)力,助力企業(yè)快速發(fā)展。本次案例就雙樣本Poisson檢驗(yàn)與實(shí)驗(yàn)室LIMS系統(tǒng)相融合進(jìn)行探討及應(yīng)用舉例。
案例
某企業(yè)質(zhì)檢實(shí)驗(yàn)室需要檢驗(yàn)A、B兩種實(shí)驗(yàn)樣品的缺陷數(shù)量,在相同的檢驗(yàn)方案條件下分別用A、B兩種實(shí)驗(yàn)樣品進(jìn)行檢驗(yàn),得到的檢驗(yàn)結(jié)果如圖1所示,試分析在相同檢驗(yàn)方案情況下,A、B兩種實(shí)驗(yàn)樣品的缺陷出現(xiàn)率。
圖1 檢驗(yàn)結(jié)果
分析過程
使用國(guó)工數(shù)據(jù)大Excel讀取組件,將數(shù)據(jù)集映射到系統(tǒng)中。
圖2 Excel讀取
再通過拖拽的方式將雙樣本Poisson率檢驗(yàn)分析組件與Excel讀取鏈接到一起。使用集成好算法的雙樣本Poisson分析組件進(jìn)行數(shù)據(jù)的Poisson分析處理,對(duì)組件參數(shù)進(jìn)行設(shè)置,因素字段配置為factor,結(jié)果值配置為檢驗(yàn)結(jié)果result,顯著性水平設(shè)置為0.05,單擊運(yùn)行,從調(diào)試面板中查看分析結(jié)果。
圖3 雙樣本Poisson率校驗(yàn)分析組件及參數(shù)配置
分析結(jié)果
圖4 分析結(jié)果
從圖4中運(yùn)用雙樣本Poisson分析得出的結(jié)果可以看出,由于 p 值 0.157 大于顯著性水平(用 α 或 alpha 表示)0.05,因此分析員否定原假設(shè)并得出兩個(gè)樣本缺陷發(fā)生率不同的結(jié)論。95% 置信區(qū)間表明,樣本 B 的缺陷率可能高于樣本 A 的缺陷率。
與LIMS系統(tǒng)相融合
國(guó)工數(shù)據(jù)大腦平臺(tái)可直接獲取實(shí)驗(yàn)室LIMS系統(tǒng)中的實(shí)驗(yàn)數(shù)據(jù),直接將實(shí)驗(yàn)數(shù)據(jù)對(duì)接到創(chuàng)建好的雙樣本Poisson檢驗(yàn)?zāi)P椭校鶕?jù)得出的分析結(jié)果自動(dòng)對(duì)報(bào)告進(jìn)行判定,代替人工判定;并將存在缺陷顯著性差異的報(bào)告重點(diǎn)推送給相關(guān)領(lǐng)導(dǎo)引起重視。根據(jù)領(lǐng)導(dǎo)對(duì)存在顯著性差異報(bào)告的處理,可自動(dòng)觸發(fā)二次檢驗(yàn)流程等操作。
含義
實(shí)驗(yàn)室系統(tǒng)中的雙樣本Poisson檢驗(yàn)用于比較兩個(gè)遵循Poisson分布的總體的均值或發(fā)生率以確定它們是否存在顯著差異的假設(shè)檢驗(yàn)。Poisson分布可為時(shí)間在給定時(shí)間內(nèi)發(fā)生次數(shù)、面積、體積或其他觀測(cè)空間建模。
適用范圍
· 確定兩個(gè)組的總體發(fā)生率是否不同。· 計(jì)算可能包括總體率之間差值的值范圍。例如,實(shí)驗(yàn)員檢查 2 個(gè)批次(A 和 B)上每箱實(shí)驗(yàn)樣本的缺陷數(shù)量。一個(gè)樣品可能會(huì)有多個(gè)缺陷,對(duì)于批次 A,每箱包含 10 個(gè)樣本。實(shí)驗(yàn)員總共抽取 50 箱,共發(fā)現(xiàn) 122 個(gè)缺陷。對(duì)于批次 B,每箱包含 15 個(gè)毛巾。實(shí)驗(yàn)員總共抽取 50 箱,共發(fā)現(xiàn) 132 個(gè)缺陷。對(duì)于批次 A,總發(fā)生次數(shù)為 122,原因是實(shí)驗(yàn)員發(fā)現(xiàn)了 122 個(gè)缺陷。對(duì)于批次 B,此數(shù)字為 132,原因是實(shí)驗(yàn)員發(fā)現(xiàn)了 132 個(gè)缺陷。對(duì)于這兩個(gè)批次,樣本數(shù)量 (N) 均為 50,原因是實(shí)驗(yàn)員對(duì)于這兩個(gè)批次均抽取了 50 箱。為了確定每個(gè)樣本的缺陷數(shù),實(shí)驗(yàn)員對(duì)批次 A 使用觀測(cè)值長(zhǎng)度 10,原因是每箱有 10 個(gè)樣本。對(duì)于批次 B,檢查員使用觀測(cè)值長(zhǎng)度 15。對(duì)于批次 A,采樣率為(總發(fā)生次數(shù) / N)/(觀測(cè)值長(zhǎng)度)= (112/50) / 10 = 0.224。對(duì)于批次 B,采樣率為 (132/50) / 15 = 0.176。因此,批次 A 中每個(gè)樣本平均有 0.244 個(gè)缺陷,批次 B 中每個(gè)樣本平均有 0.176 個(gè)缺陷。由于實(shí)驗(yàn)員輸入的觀測(cè)值長(zhǎng)度不為 1,因此數(shù)據(jù)大腦也將計(jì)算樣本均值。對(duì)于批次 A,樣本均值為(總發(fā)生次數(shù) / N)= 112/50 = 2.24。對(duì)于批次 B,樣本均值為 132/50 = 2.64。樣本均值描述每箱的平均缺陷數(shù)。但是,由于各箱中含有不同數(shù)量的實(shí)驗(yàn)樣本,因此采樣率是更有用的統(tǒng)計(jì)量。
夏日的煙臺(tái),海風(fēng)送爽。在第十屆煙臺(tái)國(guó)工智能科技有限公司AI研究院“AI課題文獻(xiàn)綜述分享茶歇會(huì)”上,一場(chǎng)聚焦“人工智能與化工領(lǐng)域深度融合”的智慧盛宴成功舉辦。
6月9日,第八屆煙臺(tái)國(guó)工智能科技有限公司AI研究院“AI課題文獻(xiàn)綜述分享茶歇會(huì)”成功舉辦。本次會(huì)議聚焦“基于遺傳算法的高分子配方設(shè)計(jì)方法”,通過前沿技術(shù)分享與案例解析,展現(xiàn)了國(guó)工智能在AI+材
精餾回收工藝是醫(yī)藥化工行業(yè)中的最為重要的典型單元操作之一,在原料藥、精細(xì)化工、輕工業(yè)等各個(gè)領(lǐng)域都有極其廣泛的應(yīng)用。由于精餾過程的復(fù)雜性,精餾工藝過程的終點(diǎn)現(xiàn)階段仍需要生產(chǎn)工人每隔一定時(shí)間取樣送實(shí)驗(yàn)室檢測(cè),通過氣相色譜測(cè)定含量,卡爾費(fèi)休滴定法
中秋節(jié)是中國(guó)傳統(tǒng)節(jié)日之一,也是一年中最重要、最盛大的節(jié)日之一。在這一天,以明亮的月亮和家人團(tuán)聚為特點(diǎn),承載著人們無盡的思念和美好的祝福。 國(guó)慶、中秋兩節(jié)遇, 合家團(tuán)圓精神俱。 團(tuán)團(tuán)圓圓過中秋, 歡歡喜喜