有一个web+flask项目需要可视化数据分析结果,检索后发现,pyecharts工具包非常对口。
Echarts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了。
pyecharts中文文档有详细的说明,这里记录了个人更感兴趣的部分和对应的使用结果。
整体说明
pyecharts绘图的步骤可以简化成:
新建合适的图表对象,常见的有:
Pie: 饼图
Bar: 柱状图/条状图
Boxplot: 箱形图
HeatMap: 热力图
Line: 折线图/面积图
Scatter: 散点图
特别的,可以把多个图合在一起的 Overlap: 层叠多图
更详细的可以参考官方文档-图表类型
bar = Bar()
后续的操作都是利用这个对象的方法进行。
为图表对象增加数据,比如 增加x轴(.add_xaxis)、y轴数(.add_yaxis)
bar.add_xaxis(["衬衫", "羊毛衫", "雪纺衫", "裤子", "高跟鞋", "袜子"])
bar.add_yaxis("商家A", [5, 20, 36, 10, 75, 90])
全局配置项:所有的内容都是通过.set_global_opts方法添加.set_global_opts()
bar.set_global_opts(title_opts=opts.TitleOpts(title="主", subtitle="副"))
常用的有
TitleOpts:配置项
LegendOpts:图例配置项
VisualMapOpts:视觉映射配置项
AxisLineOpts: 坐标轴轴线配置项
AxisTickOpts: 坐标轴刻度配置项
AxisPointerOpts: 坐标轴指示器配置项
AxisOpts:坐标轴配置项
SingleAxisOpts:单轴配置项
详见官方文档配置项-全局配置项
例子
Boxplot
箱型图,一种比较简洁的统计值可视化方法
import random
from pyecharts import options as opts
from pyecharts.charts import Boxplot
import numpy as np
# 离线资源,有网络下可以不管
from pyecharts.globals import CurrentConfig
CurrentConfig.ONLINE_HOST = "http://127.0.0.1:8889/assets/"
# 长度为1的str list
x_label = ['随机数']
data = np.random.randint(1000, size=100)
# 这里data应为2维数组,长度和x_label相同的 list list
data = [data.tolist()]
boxplot = Boxplot()
boxplot.add_xaxis(x)
# 调用自带的函数,计算箱型图需要的数据
y_value = boxplot.prepare_data(y_value)
boxplot.add_yaxis('', y_value)
boxplot.set_global_opts(title_opts=opts.TitleOpts(title='box plot demo'))
boxplot.render()
Bar
Bar比较简单,适合入门,设定一个x轴,一个y轴,就可以render了
# -*- coding: utf-8 -*-
from pyecharts.charts import Bar
from pyecharts import options as opts
import numpy as np
# 离线资源,有网络下可以不管
from pyecharts.globals import CurrentConfig
CurrentConfig.ONLINE_HOST = "http://127.0.0.1:8889/assets/"
# 随机数组,0~255的数字,10000个
x = np.random.randint(255, size=1000)
# 统计直方图
sum = np.zeros(256, dtype=np.int32)
for cur_x in x:
sum[cur_x] += 1
# 绘图
bar = Bar()
# x轴 0~255
x_label = [str(label) for label in list(range(256))]
bar.add_xaxis(x_label)
# y轴 频数, 这里的list一定要是标准int,不能为 np.int,所有 y_axis=list(sum)的话是不可以的
bar.add_yaxis(series_name='频数', y_axis=sum.tolist())
# 设置
bar.set_global_opts(title_opts=opts.TitleOpts(title='直方图统计'))
# 生成网页,会在当前目录下生成一个render.html
bar.render()
HeatMap
热力图
这篇已经叙述的很好了,以下为引用
注,引文中的代码是用链式写的,官方是这么推荐的。
import random
from pyecharts import options as opts
from pyecharts.charts import HeatMap
from pyecharts.faker import Faker
# 离线资源,有网络下可以不管
from pyecharts.globals import CurrentConfig
CurrentConfig.ONLINE_HOST = "http://127.0.0.1:8889/assets/"
value = [[i, j, random.randint(0, 50)] for i in range(24) for j in range(7)]
heatmap = (
HeatMap()
.add_xaxis(Faker.clock)
.add_yaxis(
"",
Faker.week,
value,
label_opts=opts.LabelOpts(is_show=True, position="inside"),
)
.set_global_opts(
title_opts=opts.TitleOpts(title="基础热力图"),
visualmap_opts=opts.VisualMapOpts(),
)
)
heatmap.render()
以上就是python可视化数据分析pyecharts初步尝试的详细内容,更多关于python可视化数据分析pyecharts的资料请关注编程网其它相关文章!