用Python自动生成 图文并茂的数据分析 报告
大家好,这里是程序员晚枫。
上周B站:程序员晚枫后台的一位朋读者私信我,想学习一下Python自动化生成数据分析报告。
作为有问必答的编程博主,今天我们来一起学习一下~
reportlab是Python的一个标准库,可以画图、画表格、编辑文字,最后可以输出PDF格式。它的逻辑和编辑一个word文档或者PPT很像。有两种方法:
- 建立一个空白文档,然后在上面写文字、画图等;
- 建立一个空白list,以填充表格的形式插入各种文本框、图片等,最后生成PDF文档。
因为需要产生一份给用户看的报告,里面需要插入图片、表格等,所以采用的是第二种方法。
1、一行命令,安装这个库
reportlab输入Python的第三方库,使用前需要先安装,
为了方便大家使用,我已经将这个库集成到Python自动化办公的专用库:pip install python-office
中了,
因此一行命令就可以完成的安装命令如下👇
pip install -i http://pypi.tuna.tsinghua.edu.cn/simple python-office -U
2、核心代码模块导入
①提前导入相关内容,并且注册字体。(注册字体前需要先准备好字体文件)
from reportlab.pdfbase import pdfmetrics # 注册字体
from reportlab.pdfbase.ttfonts import TTFont # 字体类
from reportlab.platypus import Table, SimpleDocTemplate, Paragraph, Image # 报告内容相关类
from reportlab.lib.pagesizes import letter # 页面的标志尺寸(8.5*inch, 11*inch)
from reportlab.lib.styles import getSampleStyleSheet # 文本样式
from reportlab.lib import colors # 颜色模块
from reportlab.graphics.charts.barcharts import VerticalBarChart # 图表类
from reportlab.graphics.charts.legends import Legend # 图例类
from reportlab.graphics.shapes import Drawing # 绘图工具
from reportlab.lib.units import cm # 单位:cm
②注册字体
提前准备好字体文件, 如果同一个文件需要多种字体可以注册多个
pdfmetrics.registerFont(TTFont('SimSun', 'SimSun.ttf'))
封装不同内容对应的函数
创建一个Graphs类,通过不同的静态方法提供不同的报告内容,包括:标题、普通段落、图片、表格和图表。函数中的相关数据目前绝大多数都是固定值,可以根据情况自行设置成相关参数。
# Graphs类的全部代码,请+v:CoderWanFeng
③生成报告
if __name__ == '__main__':
# 创建内容对应的空列表
content = list()
# 添加标题
content.append(Graphs.draw_title('数据分析就业薪资'))
# 添加图片
content.append(Graphs.draw_img('资料全集.jpg'))
# 添加段落文字
content.append(Graphs.draw_text('众所周知,大数据分析师岗位是香饽饽,近几年数据分析热席卷了整个互联网行业,与数据分析的相关的岗位招聘、培训数不胜数。很多人前赴后继,想要参与到这波红利当中。那么数据分析师就业前景到底怎么样呢?需要学习Python + 大数据分析,可以添加我:CoderWanFeng'))
# 添加小标题
content.append(Graphs.draw_title(''))
content.append(Graphs.draw_little_title('全网同名:程序员晚枫'))
# 添加表格
data = [
('平台名称', '关注人数', '较上年增长率'),
('公众号', '18.5K', '25%'),
('B站', '25.5K', '14%'),
('微博', '29.3K', '10%')
]
content.append(Graphs.draw_table(*data))
# 生成图表
content.append(Graphs.draw_title(''))
content.append(Graphs.draw_little_title('热门城市的就业情况'))
b_data = [(25400, 12900, 20100, 20300, 20300, 17400), (15800, 9700, 12982, 9283, 13900, 7623)]
ax_data = ['BeiJing', 'ChengDu', 'ShenZhen', 'ShangHai', 'HangZhou', 'NanJing']
leg_items = [(colors.red, '平均薪资'), (colors.green, '招聘量')]
content.append(Graphs.draw_bar(b_data, ax_data, leg_items))
# 生成pdf文件
doc = SimpleDocTemplate('report.pdf', pagesize=letter)
doc.build(content)
生成报告的结果如下
「其他文章」
- 帮师姐把100个Excel中符合条件的数据,汇总到1个Excel里
- 176万!GPT-4发布了,如何查看OpenAI的下载量?
- 1行Python代码,把PPT转成图片,python-office功能更新~
- 定了!Python3.7,今年停止更新!
- 1行Python代码去除图片水印,网友:干干净净!
- Python办公实战!按姓名拆分Excel为单独文件,微信自动发给相应联系人
- 12个Python自动化办公的官方文档,中文版只有2个?
- 终究还是错付了!这2种Python写法已经被淘汰了,你是不是还在用?
- 用Python下载B站视频?1行命令搞定,悄悄用
- 用Python自动生成 图文并茂的数据分析 报告
- 自动合并Excel的4种方法,pandas自动化办公,YYDS
- 绝了!深度解析了1道华为Python笔试题,竟然可以学会12种Python里正则表达式的用法
- 1行Python代码,实现PDF转图片,速度太太太太太快了
- 1行Python代码,拿到周杰伦新歌的MP3文件,终于可以免费听周杰伦了
- 官方推荐:6种Pandas读取Excel的方法,太方便了~
- 如何生成1亿个手机号码?Python生成随机数的22种方法,random函数太强了~
- 新人必看:python自动化办公,开源项目的目录结构
- 一行Python代码,给PDF文件添加水印
- 太厉害了,通过文档内容快速查找文件,1行Python代码实现
- 一行Python代码,如何成为办公小助手?这5个操作,超实用!