Mooc -- 在线学习课程介绍(1)

MOOC是Massive Open Online Course的缩写。旨在让全球学习者在线参与分享全球著名高校的公开课程。MOOC与早些年MIT或Yale的公开课少许不同之处在于,在线学习者可以参与学习过程,例如完成编程作业或撰写报告等(而不是简单地看看或听听高校的视频讲解),通过自身努力获取结课认证或者高校认证的签名证书。个别高校还推出了针对某专业或热点的Specialization课程,比如Johns Hopkins大学推出的Data Science系列,Duke大学推出的Perception, Action and the Brain系列等等。

比较有名的MOOC在线学习网站有Coursera(课程种类最多,参与的在线学习人数最多),edx(课程多由MIT,Harvard等名校提供,参与在线人数仅次于Coursera),openlearning,慕课,好大学MOOC等。

首先推荐一门Coursera的在线经典课程,课程由Eindhoven University of Technology(埃因霍温理工大学)数据科学过程挖掘的‘God Father’ – Wil van der Aalst教授及其团队提供。

Process Mining: Data Science in Action
过程挖掘:数据科学实战
提供一个果壳网MOOC学院链接及Coursera网站课程介绍链接:
http://mooc.guokr.com/course/1830/Process-Mining--Data-Science-in-Action/

传统的数据挖掘方法不以过程为中心。数据挖掘输入的是典型的记录(records)集合,输出的是决策树(decision tree),集簇的集合(collection of clusters)或频繁模式(frequent patterns)。而过程挖掘是传统的基于模型的过程分析(如模拟商业业务流程管理技术)和数据导向分析(如机器学习和数据挖掘)之间的关键一环。过程挖掘从事件(events)开始,与输出相关联的是端对端过程模型(end-to-end process model)。

过程挖掘应用实例包括:分析医院的病人治疗过程;改善跨国公司的客户服务过程;了解客户使用预定网站的浏览行为;行李处理系统的失效分析;以及改进X光机的用户使用界面。这些应用的一个共同之处在于,各种动态行为与过程模型相关联,所以可以称以上各种应用分析为“数据科学实战”( “data science in action”)。

这门课2013年年底第一次开课,我有缘参与到2014年年底的第二次开课过程中,课程的全球反响出奇的好,以至于在众多同学的强烈要求下,原定于2015年年底第三次开课被提前至2015年4月1号(我估计此后该课程会一年开放两次)。

以下是一点个人学习心得:
实在是佩服当初建立出种种过程模型分析的人。
对于没什么基础的人来说,这课真得很难,习题很伤脑筋,做题时,反复看课件,细心计算是经常的。幸好习题的两次提交中,第一次提交后,会有些不全的提示,不过第二次习题尝试时部分习题题设会变更。
论坛非常值得参与,TA很Nice。
课程资料,授课团队成员们准备得很细致+精致。
考试提交只有一次,而且全面覆盖所学。
课程中你会用到过程挖掘开源软件ProM和由Fluxicon公司提供的过程挖掘商业软件Disco来完成Tool Quiz和Project。必须要耐心加细心,也只有一次提交机会。做Project前最好先做Tool Quiz来熟悉软件,Project后面稍有些难度不过不要放弃。
Review他人Project报告比较耗时,不过能借鉴他人的软件使用技能。
当初选这门课的原因在于,此课由专业领域领军人物教授并且过程挖掘的未来应用前景十分广泛(想想能提高政府机构的运行效率不是一点点呐)。还有一点,开头课程的课件上,能看到该领域的全球国家研究机构合作参与的分布,结果基本都在欧美,我国好像就清华,港台的大学有相关合作。

最后贴张认证证书