Pandas
数据类型
series 序列
dataframe 表格
修改的参数多半有inplace: bool
文件操作
df = pd.read_csv(“name.csv”, sep=”,”)
df.to_csv(“name.csv”, index= False)
df = pd.read_excel(“name.xlsx”)
df.to_excel(“name.xlsx”)
索引
df["column_name"]df[['Name',_'Age']] # 选择多列df.loc["label"] # 按标签选择行df.loc[["label",_"label2"]] # 选择多行df.loc[row_label_slice, column_label_slice]df.iloc[row_index_slice, column_index_slice]
条件索引df[(df["age"] > 28) & (df["city"] == "New York")] # 筛选年龄大于28且城市为New York的行
数据
统计
1 | |
处理
1 | |
转换
1 | |
df.sort_values(‘Age’, ascending=False) # 按年龄降序排序
where
Pandas
http://kaelvio.com/Pandas/