|
|
|
|
移动端

前言

《大数据分析:数据挖掘必备算法示例详解》本书详细介绍了大数据分析,尤其是数据分类相关算法的原理及实现 细节,并给出了每个算法的编程实例。本节为前言。

作者:张重生来源:机械工业出版社|2017-12-13 15:51

技术沙龙 | 6月30日与多位专家探讨技术高速发展下如何应对运维新挑战!


前言

大数据分析,尤其是数据分类与预测是数据挖掘中最重要的分支领域,也是企业需要最 多且应用最广泛的技术。本书专注于大数据分析和数据分类技术。本书的目标有三:

一是成为我国 “最接地气的”、最实用的、最完整、最专业的数据分析专著,成为数据挖 掘爱好者、研究生、科研人员、工程师在解决数据分类和大数据分析相关问题时的首选之作。

二是成为理论与实践并重的专业书籍。本书的特点是采用示例驱动的方式讲解原理和相关实验。在讲解算法原理时,本书通过举例子的方式,详解算法的每个步骤及对应示例的结果,使得一些晦涩的公式和原理变得直接、具体、易理解。笔者翻阅了很多数据挖掘和机器学习专著,鲜有书籍能做到在原理部分示例驱动。而且,本书十分注重对于算法的应用的实战能力的培养,在讲解算法原理之后,给出具体例子,引导读者进行相关的实验,获得实践 能力、解决实际问题的能力。

三是成为传播大数据分析和数据分类技术的重要媒介、培养大数据人才的首选教材。最近几年,国内外的大数据人才供不应求,其薪资通常是普通 IT从业人员的两倍以上。而绝大多数国内高校在培养大数据人才时,都遇到了各种瓶颈和问题。究其原因,合适中文教材的匮乏是极为重要的一个原因。因为,大数据人才不能只是泛泛地了解数据挖掘的相关原理介绍,他们更应该深入理解算法的原理且掌握解决实际数据挖掘问题的动手能力和实战经验。而现有的教材大多是泛泛教授数据挖掘相关原理的书籍。

本书采用平民化、“接地气”的原理讲解方式,及原理与应用实践并重的思路。普通读者(本科及以上学历的读者,甚至是大三以上的学生)很容易理解、掌握本书介绍的相关算法的原理,并切实掌握相关的应用开发技能和解决实际问题的能力。这对于大数据分析、数据分类技术在我国的广泛传播,对于大数据分析人才的大规模培养,具有重要意义。

全书共 21章,可以分为六个部分:第一部分包括第 1~11章,此部分将讲述 12个主流的数据分类算法;第二部分包括 12~15章,此部分讲述从二分类 (只能对两类数据进行分类)到多分类的三种主流技术及其实验对比分析;第三部分包括第 16章,主要讲述若干集成学习相关的算法;第四部分包括第 17~18章,主要讲述属性选择相关的原理和算法;第五部分包括第 19~20章,主要讲述数据选择和不均衡数据分类相关的原理和技术;第六部分包括第 21章,主要讲述大数据分析相关的平台与开发技术。

研究生毕瞡君、刘畅畅、张愿承担了本书相关实验部分的程序实现与撰写的工作。

针对数据挖掘领域的初学者,建议选择第 1~7章、第 12章、第 16~17章、第 19章、第 21章作为主要学习内容。如果读者是数据挖掘方向的专家、工程师、研究生、科研人员,则建议通读全书。在遇到具体问题时,请仔细阅读、理解相关章节,必要时,可以去查阅参考文献中列出的原始英文论文,进行深入的推敲和探究。

由于笔者水平有限,书中错谬之处在所难免,如蒙读者赐教,本人将感激之至。

张 重 生

2016年 10月

于河南大学


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码

 

51CTO读书频道活动讨论群:365934973
【责任编辑:book TEL:(010)68476606】

回书目      下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

SUN Solaris 9/10系统管理员认证指南

本书专门根据SUN官方的SCSA for Solaris 9&10考试大纲撰写而成,全面覆盖了SCSA for Solaris 9/10的认证考点,除此之外本书还有大量的非考...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊