機器學習——Pandas庫
開啟掘金成長之旅!這是我參與「掘金日新計劃 · 12 月更文挑戰」的第27天,點擊查看活動詳情
目錄
二、Pandas庫數據結構——Series, DataFrame
2.DataFrame——索引index, columns,值 values
1.Series 索引與切片 Index索引/數字索引/布爾值索引
一、Pandas庫
import numpy as np
import pandas as pd
二、Pandas庫數據結構——Series, DataFrame
a = pd.Series([1, 2, 3, 4, 5])
編輯
data = np.array([[95, 96, 97], [80, 85, 86], [56, 65, 70]])
frame = pd.DataFrame(data)
frame
編輯
我們不難看出來Series, DataFrame的區別:DataFrame更加好看哈哈,接受矩陣數據
詳細見:
pandas中的兩種數據類型Series和DataFrame區別_jolingcome的博客-CSDN博客_series和dataframe區別
1.Series——索引 index,值 values
a = pd.Series([1, 2, 3, 4, 5], index = ['a', 'b', 'c', 'd', 'e'])
a
編輯
2.DataFrame——索引index, columns,值 values
frame = pd.DataFrame(data, index=['xiaoming', 'xiaohong', 'xiaohei'],
columns=['yuwen', 'yingyu', 'shuxue'])
frame

編輯
指定或修改索引方法
創建時:
index, columns 指定索引,已經有索引可以按索引重新排序
創建後:
reindex方法,重新建立索引或指定索引排序
rename 修改索引
``` frame_.rename(index={"xiaohong":"damao","xiaoming":"ermao","xiaohei":"Nicolas Cage"}, columns={"yingyu":"English", "yuwen":"Literature", "shuxue":"Maths"})
Series.index = [] DataFrame.columns = [] ```
三、Series, DataFrame運算
1.基本運算
按照索引位置進行計算
data = {"English":[80,70,60],
"Literature":[70,70,85],
"Maths":[80,90,50],
"Music":["A","B","C"]}
df = pd.DataFrame(data,index = ["alpha", "beta","theta"])
df * 2
編輯
DataFrame、Series “相加”時,按照DF的columns(列)進行匹配
``` data1 = {"English":[80,70,60], "Literature":[70,70,85], "Maths":[80,90,50],} df1 = pd.DataFrame(data1,index = ["alpha", "beta","theta"]) add_ = {'Maths':10,'English':10,'Literature':20,'Gym':"A"} add_ = pd.Series(add_)
df1 + add_ ```
編輯
2.矩陣運算、通用函數
df.T
編輯
3.基本統計方法
查看數據的一些
df.describe()
編輯
四、Series, DataFrame 索引與切片
1.Series 索引與切片 Index索引/數字索引/布爾值索引
add_ = {'Maths':10,'English':10,'Literature':20,'Gym':"A"}
add_ = pd.Series(add_)
add_['Maths']
編輯
2.DataFrame 索引與切片
``` Index索引 列:df['Maths'] 行:df.loc[‘alpha’]
數字索引 df.iloc[] 特別的行可以直接用數字切片索引
布爾值索引 ```
五、Series, DataFrame 刪除操作
1.Series刪除操作 pop/drop/del
① del方式:就地刪除
``` x = pd.Series([10,23,31,16],index=list("abcd")) display(x)
刪除了某個索引後,對應的值也就刪除了
del x["b"] display(x) ```
編輯
② drop方式:當指定了inplace=True後,才屬於就地刪除
``` x = pd.Series([10,23,31,16],index=list("abcd")) display(x)
y = x.drop("a") display(y) dispaly(x)
當指定了inplace=True後,屬於就地刪除
x.drop("a",inplace=True) display(x) ```
編輯
2.DataFrame刪除操作 pop/drop/del
和 Series刪除操作 pop/drop/del 類同的,聰明的你可以想想
六、Series, DataFrame 合併操作
一般我們用到什麼方法就去查看該方法的參數
1.Series合併操作
pd.concat() combine_first()
2.DataFrame合併操作
``` pd.concat() combine_first()
pd.merge() join() ```
七、Pandas庫其他常用函數或方法
``` head() info() describe()
sort_index() sort_values()
is_unique value_counts()
rank() ```
詳細可見pandas中Series,DataFrame的連接(拼接)_曉東邪的博客-CSDN博客_pandas series 拼接