Python语言与数据科学?

By 数商 at 2019-03-05 • 0人收藏 • 52人看过

Python语言能够很好地完成数据科学全流程上各个环节的任务。


一 数据探索和分析


包括:pandas,Numpy,Scipy,Python标准库的帮手。


二 数据可视化

获取数据并将其变成丰富多彩的东西。

包括:Matplotlib,Seaborn,Datashader等


三 经典的机器学习

可以看作为任何非深度学习的监督或者无监督学习任务。

Scikit-learn是实现分类,回归,聚类和降维的首选工具;虽然Statsmodels开发欠积极,但是任然具有许多有用的功能。

包括:scikit-learn, statsmodels等


机器学习.png


四 深度学习

机器学习的一个子集,人工智能的常用技术。

包括:Keras, tensorflow等。


五 数据存储和大数据框架

大数据最好定义为数据实际上太大而无法驻留在单个机器上,或者在没有分布式环境的情况下无法处理。

Python与Apache的大数据项目融合,可以发挥出更大作用

包括:Apache Spark; Apache Hadoop; HDFS; DASK; h5py / pytables等


六 其它

自然语言处理,计算机视觉等

包括:nltk; Spacy; OpenCV/cv2; scikit-image; Cython


您有什么想法或者见解,请留言。


参考资料:

1 Python与数据科学教程


登录后方可回帖

信息栏
数据人网是数据人学习、交流和分享的平台,专注于从数据中学习,努力发觉数据之洞见,积极利用数据之价值
Loading...