|
|
|
|
移动端

2.1.3 不可能绕过的第三方库

《精通数据科学:从线性回归到深度学习》第2章Python安装指南与简介:告别空谈,本章介绍数据科学中最常用的IT工具:Python以及相关第三方库。本节为大家介绍不可能绕过的第三方库。

作者:唐亘来源:人民邮电出版社|2018-05-24 09:12

技术沙龙 | 6月30日与多位专家探讨技术高速发展下如何应对运维新挑战!


2.1.3 不可能绕过的第三方库

表2-1列举了在数据科学中最常用的Python库。

表2-1



数据预处理
NumPy
 
科学计算基础库。它提供高效的N维数组和向量运算
 
SciPy
 
科学计算库。它依赖与NumPy,提供高效的数值计算,以及用于函数最优化、数值积分等任务的模块
 
pandas
 
数据结构和数据分析库。包含高级数据结构和类SQL语句,让数据处理变得快速、简单
 
数据可视化
 
Matplotlib
 
数据可视化库。它提供大量专业数据图形制作工具
 

标准模型库
scikit-learn
 
标准机器学习库。它主要用于分类、回归和聚合等,依赖于NumPy、SciPy、Matplotlib
 
Statsmodels
 
标准统计模型库。它主要用于假设检验和参数置信区间分析
 
Spark ML
 
分布式机器学习算法库。它可在分布式集群上,如Hadoop,对大量数据建模。Spark ML由Scala开发,但提供Python API
 
TensorFlow
 
成熟的深度学习算法库。它提供GPU运算模块
 

后面的章节会陆续用到这些库,读者到时就可以更加直观地感受它们的“威力”。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

计算机病毒分析与防治简明教程

本书全面翔实地介绍了各种病毒的原理,以操作系统的发展为主线,结合病毒的发展过程来综合分析病毒。在分析工具上,较多地利用了脚本语言、...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊