Google Code Prettify - 輕量級的語法上色工具

星期五, 3月 15, 2019

Python 資料分析: Pandas 資料型態 Series & DataFrame

# -*- coding: utf-8 -*-
"""
在學習pandas之前我們要先知道pandas的兩種特有的資料結構DataFrame與Series。
Series格式就是一個一維陣列的資料:
DataFrame就像是我們在使用的excel表格一樣,是一個二維的數據有index和column,可以透過index和column來找到我們要的某一筆資料。
"""
print(__doc__)

import pandas as pd
pd.__version__
# a = List
a=[1,2,3]
print(type(a))
print(a)

print('======Series資料結構')
my_obj = pd.Series([4, 7, -5, 3])
print(type(my_obj))
print(my_obj)
print(my_obj.values)
print(my_obj.index)

seriesObj = pd.Series(range(10),index=['a', 'a', 'b', 'b', 'b','c','c','c','c','c'])
seriesObj['c']

print(seriesObj)
print('======改變Index')
my_obj2 = pd.Series([8,9,10,11], index=['a','b','c','d'])
print(type(my_obj2))
print(my_obj2)
print(my_obj2.values)
print(my_obj2.index)
print('a' in my_obj2)
print(my_obj2['a'])

print('======DataFrame資料結構')
data = {'name': ['Bob', 'Nancy','Amy','Elsa','Jack'],
        'year': [1996, 1997, 1997, 1996, 1997],
        'month': [8, 8, 7, 1, 12],
        'day':[11,23,8,3,11]}
myframe = pd.DataFrame(data)
print(type(myframe))
print(myframe)