中心编著的教材《R数据分析》正式出版

2015-03-10 中心编辑

由方匡南、朱建平、姜叶飞编著的《 R数据分析-方法与案例详解》于2015年2月由电子工业出版社出版。该书编写历时4年,绝大部分内容是根据多年的授课讲义编写而成。同时,中心的博士生和硕士生欧阳汉、易煌迪、张声威、王秉权等参与了部分内容的编写和校正。为了提高阅读的体验,该书专门配套了插画,全书采用双色印刷,重点内容用蓝色标示出来,印刷精致。出版之后受到社会好评,在当当网、京东网等各大主要书店都有销售,在同类书籍中销售量名列前茅。

该书内容循序渐进、深入浅出,每个知识点都尽量从实际的应用案例出发,以问题为导向,在解决问题中学习统计方法、R语言的基本使用以及编程技巧。本书的定位是为业界数据分析人员、经济管理类和医学类的学生提供方法和程序上的参考,在写作过程中尽量删去比较理论的数学原理。该书的姐妹书,会讲解更为高深的统计方法,涉及聚类分析、分类分析、关联规则、时间序列等问题,更注重在互联网、金融、企业营销、基因分析等领域的应用,目前暂定书名为《R数据挖掘——方法与案例详解》。

R语言是由新西兰奥克兰大学的Ross Ihaka与Robert Gentleman一起开发的一个面向对象的编程语言,因两人的名都是以R开头,所以命名为“R”。R是“GNU S”,一个免费开源、能够自由有效地用于统计计算和绘图的语言和环境,可以在UNIX、Windows和Mac OS系统运行,它提供了广泛的统计分析和绘图技术,包括回归分析、时间序列、分类、聚类等方法。2009年,《纽约时报》发表了题为 “Data Analysts Captivated by R’s Power”的社评,集中讨论了R语言在数据分析领域的发展,并引发了SAS和R用户广泛而激烈的争论。文章认为让R变得如此有用和如此快地广受欢迎是因为统计学家、工程师、科学家们在不断精炼代码或编写各种特具体的包。而且现在R软件增添了很多高级算法、作图颜色、文本注释,以及为与数据库链接等提供了挖掘技术。2010年,美国统计协会(American Statistical Association)将第一届 “统计计算及图形奖” 授予R语言,用于表彰其在统计应用和统计研究广泛的影响。

厦门大学数据挖掘研究中心