流程挖掘在海外超大型企业中已广泛使用。但在国内,还处于市场早期,很多企业不理解流程到底是如何被挖掘,产生巨大的商业价值的。今天我们就以一个公开的经典案例做一个针对性的介绍。
这个案例是BPI Challenge 2019的Winner,BPI Challenge由IEEE TFPM于 2011 年首次组织,目的是让研究人员和从业者展示流程挖掘的工作成果。多年来,BPI Challenge 数据集已成为社区的重要基准。许多研究人员和学生已经详细研究了一些数据集,例如2012 年和2017 年的财务日志,而其他数据集则用于突出特定技术的有用性,例如concept drift 或discovery of multi-instance patterns。
2019年的场景是典型的Purchase To Pay,数据来源是一家经营涂料和油漆领域的大型跨国公司,包含60个子公司在2018年的采购订单数据。此客户希望通过流程挖掘解决如下问题:
1、实际流程模型,并获得良好的模型解释
2、发现流程合规性漏洞,避免潜在的资金损失
3、流程的吞吐性能,尤其是发票处理的性能,分析其根源原因和获得优化建议
4、有哪些流程偏差?这些偏差有多严重?产生偏差的根源原因是什么?
5、哪些客户因发票错误等原因产生大量返工?
需求非常明确,那么让我们看看Winner是如何一步步进行流程挖掘给出解答的
首先,我们需要对给出的数据进行流程挖掘之前的融合工作。
一是理解数据格式及其含义,整个日志包含1,595,923个event,属于251,734个case。每个case即对应单个采购订单item。每个item属于某个采购PO。每个PO可以由多个item组成。共有76,349个PO。
事件日志记录包括如下event级别字段:
– Case ID: 由PO ID和item ID组成的唯一标识符,
– Activity: 事件所指活动的名称
– Timestamp: Activity完成的时间戳
– User: the resources recording the activity.
以及如下case级别字段:
– Company: 子公司ID
– Name: 脱敏后的供应商名称, 包含如下:
图片
– Spend area text: 采购需求部门, 包含如下:
图片
– Cumulative net worth: 该采购item的金额,
– Document type: 采购文件类型,包含如下
图片
– Item category: 发票处置方式,包含如下
图片
– Item type: 该采购item的类型,包含如下
图片
这里做了一些概要的统计分析:
图片
以及字段属性之间的关联分析,使用分类树,以便我们对于事件日志数据的整体情况形成一个概览。
图片
下一步,对Activity进行分析:
首先,我们可以得出每个采购item实际是通过item category对流程进行区分的,按照item category进行分别建模符合实际情况。
这里简单介绍下item category几个具体类型的含义,以便后续理解:
– 3-way match, invoice after goods receipt
3-way match 指 供应商开具的invoice,PO以及收货文件都匹配,invoice记录和处理在收货之后
– 3-way match, invoice before goods receipt 匹配规则同上,但invoice可以在收货之前记录,在收货完成后打款
– 2-way matching 不需要收货文件即可
– Consignment 寄售在仓库,生产后再付款,invoice在其他流程处理
其次,收集除了正常流程之外的Activity(通常会影响流程性能),如:
–Changes:“change price”和“change quantity”等变更活动,可能导致返工,降低效率,因此,可以关注这里的流程改进。
–Cancellation and deletion:这些活动通常意味着浪费时间和资源。
–Release workflows:“release PO”和“reactivate PO”等Activity可能也会延长吞吐量时间并降低效率。
–消息:“order confifirmation”等事件和过期通知如“vendor creates debit memo”可能成为流程潜在的瓶颈
在数据融合阶段 还可以做一些数据噪声进行处理。
接下来,就针对处理好的数据进行流程重现,本案例基于如下步骤:
1、过滤掉人工开始和结束事件
2、过滤掉不完整的案例
3、过滤掉不常见的情况
4、使用流程挖掘算法
5、创建并检查Activity到Resource的映射
6、根据发现的模型设计BPMN流程图
这里使用流程挖掘相关工具即可完成,感兴趣的小伙伴可以咨询Proxverse,比较方便的就可以得到如下所示的BPMN流程图
图片
图片
图片
在下一篇,我们将继续介绍如何针对这些流程进行深入分析,并进而开展一致性检测,性能分析,记得关注。