【数据处理】Pandas库:画图与文件读取

语言: CN / TW / HK

持续创作,加速成长!这是我参与「掘金日新计划 · 10 月更文挑战」的第5天,点击查看活动详情

注意:本案例使用 Jupyter Notebook 进行案例演示

1. Pandas画图

pandas库中集成了matplotlib库,可以直接进行调用,在相应的DataFrame后,加上.plot就能直接进行绘图,具体语法格式如下所示:

pandas.DataFrame.plot

  • DataFrame.plt(x=None, y=None, kind='line')
    • x:x数据
    • y:y数据
    • kind:图类型

      • 'line':折线图
      • 'bar':柱状图
      • 'barth':
      • 'hist':直方图
      • 'pie':饼图
      • 'scatter':散点图

我们想绘制散点图观察一下两者之间(年份与自然增长率)之间的关系:首先导入相关库,前几行代码是解决中文字体显示问题,然后读取数据,最后使用.plot函数绘制散点图。具体代码如下所示:

```python

看一下两者之间的关系x="年份", y="自然增长率(%)"

import pandas as pd import seaborn as sns from pylab import mpl from matplotlib.font_manager import FontProperties myfont=FontProperties(fname=r'/usr/share/fonts/fangzheng/FZSYJW.TTF',size=12) sns.set(font=myfont.get_name())

people = pd.read_csv("data/data140190/人口.csv") people.plot(x="年份", y="自然增长率(%)", kind="scatter") ``` 代码运行结果如下图所示:

image.png

6. 文件读取与存储

6.1 read_csv读取文件

  • pandas.read_csv(filepath_or_buffer, sep = ',')

    • filepath_or_buffe:文件路径
    • usecols:指定读取的列名,列表形式