多维数据分析是以数据库或数据仓库为基础的,其最终数据来自底层的数据库系统,多维数据分析更适合以数据仓库为基础的数据分析处理。这里结合生产领域中重要效率评价指标 OEE,研究如何用多维的思路和方法来分析。
多维数据分析是以数据库或数据仓库为基础的,其最终数据来自底层的数据库系统,多维数据分析更适合以数据仓库为基础的数据分析处理。这里结合生产领域中重要效率评价指标 OEE,研究如何用多维的思路和方法来分析。
概述
20 世纪 90 年代后,随着全员生产维护的开展,设备综合效率(Overall Equipment Effectiveness,OEE)作为全员生产维护衡量设备效能的标准得到广泛应用,并取得显著成效。Factorytalk、OEE、Toolkit 等 OEE 分析软件已经被广泛使用,另外在国内外的各种 MES 系统中也相应引入了 OEE 分析模块。
然而,不管是 OEE 分析专用软件还是带有 OEE 分析模块的 MES,都存在如下弊端:1)费用高昂;2)开发要求较高;3)在使用中会存在一定问题。 另外用常规通用的统计分析软件,虽然可以降低成本,但是对于海量的 OEE 数据,要高效准确得出结果却存在很大的难度。
另外在当前的数据分析领域中,多维数据分析作为一项新兴技术,受到广泛重视。利用多维数据分析以 OLAP(联机分析处理)作为平台,并且延伸到数据挖掘领域的综合分析数据系统,在人口信息、石油生产、医院信息等多个方面的数据分析都起到了积极作用。然而,针对生产领域中具体对于 OEE 的数据分析上,还鲜见多维数据分应用的实例。
在结合现有 OEE 分析系统特点的基础和基于多维数据分析的基本思想,本文提出了一种开发更简单 、使用更便捷的基于 OEE 的多维数据分析系统。
对海量 OEE 数据进行多维处理的必要性
OEE 基本计算方法
OEE 是用来说明实际的生产能力与理论产能的比例,它准确地告诉管理者:设备的效率如何,在生产的哪个环节有多少损失,以及可以进行哪些有针对性的改善工作。
OEE 的计算公式为:OEE = 时间开动率×性能开动率×合格品率×100%。
其中,时间开动率=实际工作时间 /计划工作时间;性能开动率 =理想周期时间 / (工作时间 /总产量 ) = (总产量 /工作时间 ) /生产速率;合格品率 =合格品 /总产量。
海量生产数据分析中存在的问题
企业在生产运营活动中会产生大量数据,可以对企业的生产活动提供有效的指导信息,然而这些数据在一定程度上也会对其自身的分析造成难度。对于包含大量信息的数据,用常规方法通常不能取得理想的效果。 大量数据对其自身分析的阻碍作用。主要在以下 3 个方面。
1)生产在时间序列上产生的大量数据需要处理的时间长。
2)多种数据产生的大量信息在多个方面用常规方法分析的灵活性不理想。
3)生产系统中不确定因素的负面影响。
多维数据处理对 OEE 分析的基本思路
多维数据处理方法基本思路:多维数据分析是对数据进行分析的新方法 。该方法对数据从多个角度即多个维度进行观察和分析,多维的分析操作是指通过对多维形式组织起来的数据进行切片 、切块、聚合、钻取 、旋转等分析操作,以求剖析数据,使用户能够从多种维度、多个侧面 、多种数据综合度查看数据,从而深入地了解包在数据中的信息和内涵。
针对生产数据的多维处理方法:对生产中总量大、信息维度多的各种数据而言,用多维数据处理的思想进行分析和整理有助于提高分析的效率和质量。
在生产记录数据表单中,包含了多种类型的数据,这类数据可以归结为:时间数据、产品数据、生产组织数据、工艺数据 、生产信息数据以及衍生数据这 6 个大类,其中前 5 个数据是报表中包含的数据,而衍生数据是已有数据在经过计算后所得出的数据。
根据这六大类数据,可以把报表中数据划分为 6 个维度,在各个维度的基础上,根据实际记录数据再划分为不同层次上的子维度。
在维度划分和层次划分的基础上可以就数据进行多维度及多层次子维度的分析,根据多维数据分析的基本思想和对 OEE 数据分析的基本要求,对操作进行如下定义。
1)切割:切割是对传统多维数据中切块和切片的整合操作,在对 OEE 进行数据分析中,选取包含 OEE 信息子维度的数据和其他维度上数据进行分析。其中选取的数据必然至少在 2 个或 2 个以上子维度数目,更多的是在 3 个或 3 个以上。
2)钻取:钻取操作主要应用在输出上,分为上钻和下钻。当切割完成并输出分析数据后,需要对数据再在宏观分析,就采取上钻的方式,即由下到上地进行汇总整理。 而下钻就正好相反,是在细节上对数据进行分析。
3)旋转:旋转是在选取的维度上,改变其位置,让在输出过程中,在不同角度上对数据进行分析。
OEE 多维数据分析系统设计思想
OEE 多维数据分析系统的基本结构
在 OEE 多维数据分析系统中,分为 2 个基本结构:一个是数据空间体系;另外一个是处理流程体系。
对数据空间体系而言,当数据从系统外部输入后,就保存在数据空间体系中。 在需要的时候,数据在空间体系中被调用,并且数据空间体系为调用的数据提供储存和计算的场所,数据从输入到输出都是在数据空间体系中进行的。数据输出是把所需数据在处理后由数据空间体系输出到系统外部 。
对处理流程体系而言,所有数据处理的操作规则都在其内部定义。 在处理流程体系中,规定了对数据如何输入、如何分析、如何输出的规则 。 对 OEE 分析系统的多维数据处理,处理流程体系也制定了严格的流程来保证数据分析各个环节的顺利进行。
数据空间体系结构
在数据空间体系中,分为 3 个层级来作为数据的储存和操作场所。从下到上分别是原始层、标准层以及应用层。
原始层作为原始数据输入到系统后储存的场所,当外部数据输入到系统中后,所有数据都作为原始数据储存在输入层中,而且对于原始数据,系统不会在输入层中对其进行定义和改动。
标准层是提取原始层中与分析有关的数据,在进行整理和按维度划分后的数据储存的场所,也是储存对各种数据定位的场所。 标准层有 3 个子层 :储存子层、定位子层 、映射子层。 储存子层是储存从原始层中导入的数据。 在储存子层中,所有数据在相应类别上都按前面提到的各个维度以及其内部的各个子维度进行定义。 定位子层是针对数据的定义信息,按照不同维度以及其下的子维度,分别储存子层中各种数据的位置。 当有数据要被提取的时候,通过定位信息查找并提取所需数据。映射子层是根据每次数据提取需求,整理出所需数据的维度和相应子维度,并且在其内部列出这些维度以及相应子维度。它的功能是通过在查找定位子层中这些子维度的定位,把所需维度的数据,映射到应用层中。
应用层是接受映射数据和进行分析处理的场所。当接受从标准层传输的数据后,其按输出要求对数据进行分析和处理,并且在完成分析处理后,把结果从 OEE 多维数据分析系统中输出。
OEE 分析系统的多维数据处理流程
根据 OEE 数据分析的特点和在数据输出时便捷直观的要求,把整个 OEE 的数据处理全程划分为 4 个主要处理环节,分别是输入环节 、处理环节、输出准备环节以及输出环节。
1.环节及输出环节工作模式
输入环节是数据从外部导入系统数据原始层的通道。 输出环节是将在数据应用层中的数据分析结果,以表格或者图表的形式,直观地向用户呈现出 OEE 以及相关数据的表现形式。 除此之外,在输出环节把结果输出后,用户也可以根据具体需要,对系统提出钻取和旋转要求,让输出准备环节根据反馈要求对数据进行钻取和旋转后,再次进行数据输出 。
2.处理环节工作模式
处理层的功能是提取数据原始层中输入的数据,并对其进行预处理,并且把预处理后数据导入到数据标准层中,以便高效无误地进行后面环节的工作。 预处理分为 3 个步骤:数据预计算、异常去除、维度整理 。
数据预计算是将由原始层提取的数据,按照 OEE 计算公式以及其它计算规则,计算出衍生数据。错误去除是指在完成预计算后,结合计算结果和导入的原始数据,筛除对后期数据分析会有影响的个别点位上的异常数据。
维度整理是根据去除异常数据后系统内数据所表达的各种信息,按照前面对生产数据划分规则,对现有数据中反映这些信息的数据按各个维度以及其下面各个层级子维度的关系进行标记。 还要把标记的数据,按标准的维度层次顺序分别依次导入到数据标准层中 。
处理环节有 2 个目的,一是为后期进行切割和钻取工作提供来源数据;是避免一些无用的数据进入到后期的分析活动中,加大分析复杂程度。
3.输出准备环节工作模式
输出准备环节是对最终结果的输出做好数据上的准备,是连接标准层数据、应用层数据以及输出数据的桥梁。在输出准备环节主要起 3 个作用,分别是抽取、整理和反馈处理。
抽取实际是把标准层中划分好维度的数据,按照输出要求用多维数据处理中切割的方式选取,并且导入到应用层中。整理是对应用层中的数据,按照输出要求进行统计和分析处理其它数据,以便输出直观的数据资料。
反馈是在输出完成后,再按照用户的要求,对输出数据进行重新处理。反馈处理包含 2 个方面:一个是多维数据分析中的旋转;另外一个是多维数据分析中的钻取。
输出准备环节在整个系统中有 3 个作用,一是把需要的维度数据用切割的方式抽出,供后面的分析使用;二是对抽出的数据,进行相应的统计计算,以便后面分析;三是实施输出层的反馈要求,对维度数据进行钻取。