400-623-8599
流程挖掘如何创造巨大商业价值—BPI Challenge 2019 Winner 深度分析(一)
Source: | Author:PROXVERSE | Published time: 2022-05-21 | 266 Views | Share:

流程挖掘在海外超大型企业中已广泛使用。但在国内,还处于市场早期,很多企业不理解流程到底是如何被挖掘,产生巨大的商业价值的。今天我们就以一个公开的经典案例做一个针对性的介绍。


这个案例是BPI Challenge 2019的Winner,BPI Challenge由IEEE TFPM于 2011 年首次组织,目的是让研究人员和从业者展示流程挖掘的工作成果。多年来,BPI Challenge 数据集已成为社区的重要基准。许多研究人员和学生已经详细研究了一些数据集,例如2012 年和2017 年的财务日志,而其他数据集则用于突出特定技术的有用性,例如concept drift 或discovery of multi-instance patterns。


2019年的场景是典型的Purchase To Pay,数据来源是一家经营涂料和油漆领域的大型跨国公司,包含60个子公司在2018年的采购订单数据。此客户希望通过流程挖掘解决如下问题:


1、实际流程模型,并获得良好的模型解释

2、发现流程合规性漏洞,避免潜在的资金损失

3、流程的吞吐性能,尤其是发票处理的性能,分析其根源原因和获得优化建议

4、有哪些流程偏差?这些偏差有多严重?产生偏差的根源原因是什么?

5、哪些客户因发票错误等原因产生大量返工?


需求非常明确,那么让我们看看Winner是如何一步步进行流程挖掘给出解答的


首先,我们需要对给出的数据进行流程挖掘之前的融合工作。


一是理解数据格式及其含义,整个日志包含1,595,923个event,属于251,734个case。每个case即对应单个采购订单item。每个item属于某个采购PO。每个PO可以由多个item组成。共有76,349个PO。


事件日志记录包括如下event级别字段:

– Case ID: 由PO ID和item ID组成的唯一标识符,

– Activity: 事件所指活动的名称

– Timestamp: Activity完成的时间戳

– User: the resources recording the activity. 


以及如下case级别字段:


– Company: 子公司ID 

– Name: 脱敏后的供应商名称, 包含如下:

图片


– Spend area text: 采购需求部门, 包含如下:

图片


– Cumulative net worth: 该采购item的金额, 

– Document type: 采购文件类型,包含如下

图片


– Item category: 发票处置方式,包含如下

图片


– Item type: 该采购item的类型,包含如下

图片


这里做了一些概要的统计分析:

图片


以及字段属性之间的关联分析,使用分类树,以便我们对于事件日志数据的整体情况形成一个概览。

图片


下一步,对Activity进行分析:


首先,我们可以得出每个采购item实际是通过item category对流程进行区分的,按照item category进行分别建模符合实际情况。


这里简单介绍下item category几个具体类型的含义,以便后续理解:


– 3-way match, invoice after goods receipt 

3-way match 指 供应商开具的invoice,PO以及收货文件都匹配,invoice记录和处理在收货之后


– 3-way match, invoice before goods receipt 匹配规则同上,但invoice可以在收货之前记录,在收货完成后打款

– 2-way matching 不需要收货文件即可

– Consignment  寄售在仓库,生产后再付款,invoice在其他流程处理


其次,收集除了正常流程之外的Activity(通常会影响流程性能),如:

–Changes:“change price”和“change quantity”等变更活动,可能导致返工,降低效率,因此,可以关注这里的流程改进。

–Cancellation and deletion:这些活动通常意味着浪费时间和资源。

–Release workflows:“release PO”和“reactivate PO”等Activity可能也会延长吞吐量时间并降低效率。

–消息:“order confifirmation”等事件和过期通知如“vendor creates debit memo”可能成为流程潜在的瓶颈


在数据融合阶段 还可以做一些数据噪声进行处理。


接下来,就针对处理好的数据进行流程重现,本案例基于如下步骤:


1、过滤掉人工开始和结束事件

2、过滤掉不完整的案例

3、过滤掉不常见的情况

4、使用流程挖掘算法

5、创建并检查Activity到Resource的映射

6、根据发现的模型设计BPMN流程图


这里使用流程挖掘相关工具即可完成,感兴趣的小伙伴可以咨询Proxverse,比较方便的就可以得到如下所示的BPMN流程图

图片

图片

图片


 在下一篇,我们将继续介绍如何针对这些流程进行深入分析,并进而开展一致性检测,性能分析,记得关注。