这篇文章主要介绍“Python Pyecharts怎么绘制桑基图分析用户行为路径”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“Python Pyecharts怎么绘制桑基图分析用户行为路径”文章能帮助大家解决问题。
桑基图,它的核心是对不同点之间,通过线来连接。线的粗细代表流量的大小。很多工具都能实现桑基
图,比如:Excel、tableau,我们今天要用 Pyecharts 来绘制。
因为没有用户行为路径相关的公开数据,所以本次实现可视化是根据泰坦尼克号,其生存与遇难的人的
数据,来分析流向路径。学会思路,你也可以换成自己公司的用户行为埋点数据。
读取数据
from pyecharts import options as optsfrom pyecharts.charts import Sankeyimport pandas as pddata = pd.read_excel('/Users/wangwangyuqing/Desktop/train.xlsx')data
整理数据结构:父类→子类→值
从父类到子类,每相邻的两个分类变量都需要计算,使用 Pandas 中数据透视表,计算后的数据纵向合并成三列。
lis = data.columns.tolist()[:-1]lis1 = lis[:-1]lis2 = lis[1:]data1 = pd.DataFrame()for i in zip(lis1,lis2): datai = data.pivot_table('ID',index=list(i),aggfunc='count').reset_index() datai.columns=[0,1,2] data1 = data1.append(datai)data1
生成节点数据
需要把所有涉及到的节点去重规整在一起。列表内嵌套字典的形式去重汇总。
# 生成nodesnodes = []# 先添加几个顶级的父节点nodes.append({'name':'C港口'})nodes.append({'name':'Q港口'})nodes.append({'name':'S港口'})# 添加其他节点for i in data1[1].unique(): dic = {} dic['name'] = i nodes.append(dic)nodes
组织数据:定义节点和流量
数据从哪里流向哪里,流量(值)是多少,循环+字典来组织数据
links = []for i in data1.values: dic = {} dic['source'] = i[0] dic['target'] = i[1] dic['value'] = i[2] links.append(dic)links
数据可视化
c = ( Sankey(init_opts=opts.InitOpts(width="1200px", height="800px",theme='westeros')) .add( "", nodes=nodes, links=links, linestyle_opt=opts.LineStyleOpts(opacity=0.2, curve=0.5, color="source"), label_opts=opts.LabelOpts(position="right"), ) .set_global_opts(title_opts=opts.TitleOpts(title="桑基图")) .render("/Users/wangwangyuqing/Desktop/image.html"))
桑基图是分析用户路径的有效方法之一,能非常直观地展现用户旅程,帮助我们进一步确定转化漏斗中的关键步骤,发现用户的
流失点,找到有价值的用户群体,看用户主要流向了哪里,发现用户的兴趣点以及被忽略的产品价值,寻找新的机会。
关于“Python Pyecharts怎么绘制桑基图分析用户行为路径”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注编程网行业资讯频道,小编每天都会为大家更新不同的知识点。