中心“大数据系列丛书”之二:《Excel在大数据挖掘中的应用》正式出版

2016-06-03 管理员

21世纪是大数据的时代,又是“互联网+”时代,借助于计算机存储和分布式计算带来的便携使得信息呈爆炸式增长,各行各业时刻都在生成、收集并处理大量的数据,依赖大数据分析技术的时代悄悄来临。从谷歌推出的流感预测,到百度的市场物价预测以及春运的迁徙动态图,能察觉到大数据分析已深入我们的生活,数据挖掘作为大数据分析的核心技术,面对这些繁杂又冗余的大数据,其性能、速度、可视化程度都受到了时代的挑战。

厦门大学管理学院MBA中心和数据挖掘研究中心为了能更好地将理论与实践相结合、研究与应用相融合,开拓大数据应用领域,共同规划了“大数据系列丛书”。由谢邦昌、朱建平、王小燕著《Excel在大数据挖掘中的应用》由厦门大学出版社正式出版。

Excel是当前使用最普遍、入门极快的电子表格软件,它能轻易地完成大量数据的统计分析、处理与制图,不仅功能强大,还操作简单。最新版本Microsoft Office Excel 2013是Excel发展历程中一个里程碑级的产品,对比Excel 2010,它非常适应于“大数据”和“互联网+”时代下的数据挖掘工作。它提供了数项让人眼前一亮的新功能,包括Power Query,Power View,Power Map和PowerPivot。

本书的编写以统计原理为主线,以数据挖掘模型的应用为目的。全书共19章,基本内容和特点体现为:

第1篇概述了数据挖掘在大数据时代的重要性,包含第一章至第四章,详细总结常用的数据挖掘理论和技术的一般概念、方法技术,并总结了常用的数据挖掘软件和工具的特点和适用性。使读者获得清晰的数据挖掘观念。

第2篇详细地阐述了数据挖掘加载项的配置要求和安装过程,包含第五章至第十七章,从理论、操作、实例展示三个方面重点阐述了数据挖掘加载项的9种数据挖掘模型的使用,包括决策树、贝叶斯概率分类、关联规则、聚类分析、时序聚类、线性回归、Logistic回归、神经网络聚类、时间序列分析,涵盖了目前学术界和实业界主要的数据挖掘技术和方法。同时,通过实例操作介绍多种数据挖掘辅助技术,包括关键影响因素、类别检测、示例填充、预测、异常值检测、应用场景分析。

第3篇为实例篇,包含第十八、十九章,以台湾房屋信用贷款数据和台湾健康食品行业数据为例,应用第2篇中多种数据挖掘方法,在Excel 2013数据加载项上展开实例分析,通过详细的操作演示和结果解释,读者可获得实际的数据挖掘经验,并能迅速在自己的学习和工作中加以应用。

最后为附录部分,通过详细的操作示范,讲述了Excel 2013的四大特色数据分析功能,包括Power Query,Power View,Power Map和PowerPivot。

本书适合多层次多专业的读者如数据、统计、经济金融、管理类等专业的本科生、研究生学习,也适合非统计类从事数据分析工作的人员阅读。

厦门大学管理学院MBA中心

厦门大学数据挖掘研究中心