干净的数据: 数据清洗入门与实践
一键收藏,随时查看,分享好友!
干净的数据: 数据清洗入门与实践    任政委 译
本书主要内容包括:数据清洗在数据科学领域中的重要作用,文件格式、数据类型、字符编码的基本概念,组织和处理数据的电子表格与文本编辑器,各种格式数据的转换方法,解析和清洗网页上的HTML文件的三种策略,提取和清洗PDF文件中数据的方法,检测和清除RDBMS 中的坏数据的解决方案,以及使用书中介绍的方法清洗来自Twitter和Stack Overflow的数据。
本书适合任何水平的数据科学家以及对数据清理感兴趣的读者阅读。
出版社:人民邮电出版社 出版日期:2016年5月 ISBN:978-7-115-42047-3 定 价:49.00元
关键字: 数据清洗  干净的数据: 数据清洗入门与实践  
免责声明:图书版权归出版社和作者所有,51CTO.com 仅提供试读
随便说两句
留言共
匿名发表 验证码: (点击进行更换)
作译者简介
任政委 译
  本书由任政委译,原作者为:Megan Squire:依隆大学计算科学专业教授,主要教授数据库系统、Web开发、数据挖掘和数据科学课程。有二十年的数据收集与清洗经验。她还是FLOSSmole研究项目的领导者,致力于收集与分析数据,以便研究免费软件、自由软件和开源软件的开发。
本作者其他图书
相关图书
   作者:傅杰 赵磊 卢学裕 译
  这是一本Hadoop实用手册,主要针对实际问题给出相应的解决方案。本书特色是以实践结合理论分析,手把手教读者如何操作
·从零开始学Storm
·Storm源码分析
·Hadoop权威指南(第3版)
·Hadoop权威指南(中文版)
·深入浅出MySQL——数据库开发、优化
相关技术专题

51CTO旗下网站

领先的IT技术网站 51CTO 领先的中文存储媒体 WatchStor 中国首个CIO网站 CIOage 中国首家数字医疗网站 HC3i 51CTO学院