本章是基于库存的商业模型,针对事实表做出了一些总结,以及对企业的价值链和企业总线做了介绍。
R Programming笔记(二)
R 语言的控制结构
R Programming笔记(一)
R 的基本介绍
R 语言基于 S 语言,是一种免费的用于数据分析的语言。
R系统从概念上分为两部分:
- 从 CRAN上下载的基础的R 系统;
- 其它
R 的功能基本上是由各种不同的 package 提供实现的:
Process Mining学习笔记(二)
Event logs and process models
Event data 的来源有很多,如数据库系统,csv 文件,sap 系统等。
Event data 一般由caseid,activity name,timestamp, otherdata 等组成,我们要学会如何从一个 event data 中识别上述的各项。
Tranactional information: An event can represent 工
start,complete,suspend,resume,abort,etc
Process Mining学习笔记(一)
课程名称是 《Process Mining: Data Science in Action》,以下是课后笔记整理。
Date Science and Big Data
当今的时代,海量数据不断地产生,在过去的10分钟产生的数据量,都超过了2003年之前人类历史上产生的所有数据。人类的各种活动,都会不断地产生一系列的event data(事件数据)。人类的事件数据形成了一个网,即Internet of Events。它的数据主要有4种来源:
数据仓库的设计(二)
书中以不同行业为背景,举了不同的例子来说明数据仓库设计中的各种问题。而且强烈建议读者把所有的内容都阅读一遍,无论是不是你感兴趣的行业。因为行业只是背景,在不同行业背景里的数据仓库,用到了不同的设计方法,只有全部阅读一遍,才能全面了解数据仓库的设计。
这一章,是零售行业的背景。
维度设计的过程
开始数据仓库的维度设计,需要进行以下四个步骤:
数据仓库的设计(一)
该系列文章是阅读Kimball的《The Data Warehouse Toolkit 3rd Edition》的笔记,做了一个整理。
Kimball的这本大作,是数据仓库领域的经典。从书中可以学习到很多关于数据仓库设计的道与术。虽然现在都在往大数据NoSQL方向挤,但NoSQL也是Not only SQL,可见,SQL所代表的关系型数据库,依然是整个数据世界的基石,而数据仓库的相关技术,也可以为我们进行大数据的结构设计时提供参考。
Hello World
你好,Github的世界!