前言
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是企业在生产、运营过程中产生大量的数据,迫切的需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。
国工智能实验室LIMS系统融合了国工智能数据大脑平台,平台内提供上百种统计学相关算法及机器学习算法;通过这些算法对企业数据进行分类分析、聚类分析、关联分析、预测分析,挖掘数据潜在价值,探索人力无法探知的规律,提高企业产品附加值及行业竞争力,助力企业快速发展。本次案例就双样本Poisson检验与实验室LIMS系统相融合进行探讨及应用举例。
案例
某企业质检实验室需要检验A、B两种实验样品的缺陷数量,在相同的检验方案条件下分别用A、B两种实验样品进行检验,得到的检验结果如图1所示,试分析在相同检验方案情况下,A、B两种实验样品的缺陷出现率。
图1 检验结果
分析过程
使用国工数据大Excel读取组件,将数据集映射到系统中。
图2 Excel读取
再通过拖拽的方式将双样本Poisson率检验分析组件与Excel读取链接到一起。使用集成好算法的双样本Poisson分析组件进行数据的Poisson分析处理,对组件参数进行设置,因素字段配置为factor,结果值配置为检验结果result,显著性水平设置为0.05,单击运行,从调试面板中查看分析结果。
图3 双样本Poisson率校验分析组件及参数配置
分析结果
图4 分析结果
从图4中运用双样本Poisson分析得出的结果可以看出,由于 p 值 0.157 大于显著性水平(用 α 或 alpha 表示)0.05,因此分析员否定原假设并得出两个样本缺陷发生率不同的结论。95% 置信区间表明,样本 B 的缺陷率可能高于样本 A 的缺陷率。
与LIMS系统相融合
国工数据大脑平台可直接获取实验室LIMS系统中的实验数据,直接将实验数据对接到创建好的双样本Poisson检验模型中,根据得出的分析结果自动对报告进行判定,代替人工判定;并将存在缺陷显著性差异的报告重点推送给相关领导引起重视。根据领导对存在显著性差异报告的处理,可自动触发二次检验流程等操作。
含义
实验室系统中的双样本Poisson检验用于比较两个遵循Poisson分布的总体的均值或发生率以确定它们是否存在显著差异的假设检验。Poisson分布可为时间在给定时间内发生次数、面积、体积或其他观测空间建模。
适用范围
· 确定两个组的总体发生率是否不同。
· 计算可能包括总体率之间差值的值范围。
例如,实验员检查 2 个批次(A 和 B)上每箱实验样本的缺陷数量。一个样品可能会有多个缺陷,对于批次 A,每箱包含 10 个样本。实验员总共抽取 50 箱,共发现 122 个缺陷。对于批次 B,每箱包含 15 个毛巾。实验员总共抽取 50 箱,共发现 132 个缺陷。
对于批次 A,总发生次数为 122,原因是实验员发现了 122 个缺陷。对于批次 B,此数字为 132,原因是实验员发现了 132 个缺陷。
对于这两个批次,样本数量 (N) 均为 50,原因是实验员对于这两个批次均抽取了 50 箱。
为了确定每个样本的缺陷数,实验员对批次 A 使用观测值长度 10,原因是每箱有 10 个样本。对于批次 B,检查员使用观测值长度 15。
对于批次 A,采样率为(总发生次数 / N)/(观测值长度)= (112/50) / 10 = 0.224。对于批次 B,采样率为 (132/50) / 15 = 0.176。因此,批次 A 中每个样本平均有 0.244 个缺陷,批次 B 中每个样本平均有 0.176 个缺陷。
由于实验员输入的观测值长度不为 1,因此数据大脑也将计算样本均值。对于批次 A,样本均值为(总发生次数 / N)= 112/50 = 2.24。对于批次 B,样本均值为 132/50 = 2.64。样本均值描述每箱的平均缺陷数。但是,由于各箱中含有不同数量的实验样本,因此采样率是更有用的统计量。
国工智能是一家专业为流程制造业提供人工智能决策控制整体解决方案及落地服务的国有参股高新技术企业,专注于利用人工智能、大数据等技术解决流程制造业海量数据下复杂场景的智能制造需求,为客户提供“IOT+AI+OR”智能制造人工智能整体解决方案。目前,公司已经成为化工新材料行业人工智能决策控制领域的领跑者。
作为一家国内专业的智能制造落地服务商,国工智能凭借深厚的内功和优秀的团队,自主研发了基于人工智能的数据大脑分析平台(MAI)、智能制造管理平台(MES)、物联网数据采集平台(SCADA)、实验室管理系统(LIMS)、双体系设备管理系统(EMS),均在行业内成功应用。
国工智能在化工、医药、食品、饲料、新材料等行业深耕已久,客户遍布全国,已成功为海大集团、华润三九药业、康缘药业、丰原集团、道恩集团、九目化学、蓝帆医疗、新时代健康产业集团、安然纳米集团等客户提供智能制造落地服务。
国工智能秉承“利于国,精于工”的企业发展理念,以高端IT技术服务于传统制造企业,推动国家制造业转型升级,以工匠精神为中国智造赋能!努力成为科技创新和产业革命的引领者,为中国实体经济崛起、实现中国制造2025贡献力量!
数据大脑通用的内容
国工数据大脑系统(MAI-CLI)是一个集数据调度,数据清洗,数据计算、数据可视化的数据分析平台。系统以简单易用拖动操作方式进行人机交互,屏蔽了数据分析预测业务的复杂性,大大降低了数据分析工作的技术门槛。
以计算流的方式构建整个数据分析业务。平台实现了对分散的数据进行统一调度,实现实验室设备、工业传感器、信息化系统接口多源数据整合。
平台提供上百个功能组件,包含方差、回归、聚类、分类、时间序列等算法组件,支持SPC、DOE、CPK、MSA等分析理念,平台拥有定时分析功能,可以同时监控上万的质量监控点。能实现自动化六西格玛实施落地。
(数据大脑部分组件列表)
应用场景
计划经理可以用来预测未来销售情况,并自动跟踪执行。
质量经理可以用来做SPC分析、取样差异、方差分析。
研发经理可以做配方优化预测、实验辅助设计、工艺分析、数据仿真。
设备经理可以用来做设备预测性维护、报警。
平台已经完成边缘计算封装,可以与设备进行互动。
同时所有算法对软件开发商开放调用,可以用来做底层算法平台。
(数据大脑同时提供算法商城服务,任何伙伴都可以使用多编程语言开发算法,由国工智能进行测试回购。)
数据大脑优势明显