(1) 标准IDE: IDLE (内置,方便小巧)
https://www.python.org/
(2) 集成开发平台: Anaconda (支持多种操作系统,集成了主流的科学计算包,推荐初学者先安装这一个,后期需要其他第三方库再用pip等方式安装)
https://www.continuum.io/downloads
(3) 其他可自由选择PyCharm或Jupyter Notebook等
2.Python参考书籍和网站
(1) Python Crash Course: A Hands-On, Project-Based Introduction to Programming(Python编程 从入门到实践), 埃里克·马瑟斯 著
(2) SciPy科学计算ecosystem: https://www.scipy.org/
(3) Wes McKinney, Python for Data Analysis. 东南大学出版社. (英文影印本,中译版名为《利用Python进行数据分析》)
3.重量級的資料科學相關套件
Numpy 科學計算
重量級的資料科學相關套件(例如:Pandas、SciPy、Scikit-learn 等)都幾乎是奠基在 Numpy 的基礎上。因此學會 Numpy 對於往後學習其他資料科學相關套件打好堅實的基礎。
https://blog.techbridge.cc/2017/07/28/data-science-101-numpy-tutorial/
http://www2.nkfust.edu.tw/~shanhuen/PythonTutorialHtml/NumPy/NumPy1.html
Pandas 用於Excel
是一個基於Numpy的package,在處理數據方面非常的好用簡單,在學習pandas之前我們要先知道pandas的兩種特有的資料結構DataFrame與Series。
Matplotlib 用於繪圖
是Python的繪圖工具,你可以使用這些工具創建各種圖形,包括簡單的散點圖、直方圖,甚至是三維圖形,將你的資料轉成圖表,在python的數據分析中會經常使用Matplotlib完成數據可視化的工作!
SciPy
是以Numpy為基礎做科學、工程的運算處理的package,包含統計、優化、整合、線性代數、傅立葉轉換圖像等較高階的科學運算。