Process Mining学习笔记(二)

Event logs and process models

Event data 的来源有很多,如数据库系统,csv 文件,sap 系统等。

Event data 一般由caseid,activity name,timestamp, otherdata 等组成,我们要学会如何从一个 event data 中识别上述的各项。

Tranactional information: An event can represent 工
start,complete,suspend,resume,abort,etc

Process mining 过程中,经常使用xes 文件格式(extensible event system),它是一种专门应用于过程的文件格式。

Petri Nets

Petri Nets 用来展现过程,由圆的 place 和方形的transitions组成,places 可以保持okens,transitions用来生产或消费 tokens。

在 Petri Nets 中,状态称为marking,所以初始的状态就称为初始的 marking。

如果是可以达到的状态,就称为 reachable ,否则就是 unreachable。

当 transition 的每一个输入的 place 中,都包含一个 token 的时候,那么我们可以称Transation是enabled的。

一个 enabled 的 transation 可以 fire,它会消费每个输入的 place 中的一个 token,然后为每个输出的 place,各生产一个 token。

在并发的情况下,不同的 transation 可能执行的顺序不同,整个系统最终可能有多种不同的reachable状态。

不同的 transation 之间竞争 token,会造成不同的 final markings。

Reachability graph是一个 transation system,它有一个初始的状态,没有明确的结束状态。
Reachability graph的状态可能是无限的。

Transation systems and Petri Net Properties

Boundedness
Safeness
Deadlock
Liveness
Complete traces

Alpha algorithm

  • Direct succession: x>y, 如果 y 跟在 x 后面
  • Causality: x->y, 如果x>y,且不存在y>x
  • Parallel: x||y, 如果x>y,且y>x
  • Choice: x#y,如果不存在x>y,且不存在y>x.