文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python库助力pandas智能可视化的示例分析

2024-04-02 19:55

关注

Python库助力pandas智能可视化的示例分析,很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。

Pandas是用于数据处理的核心库,它也可以进行简单的可视化,绘制散点、折线、直方等基础图表都不在话下。

Python库助力pandas智能可视化的示例分析

Pandas自带的可视化方法是基于matplotlib的函数接口,在Jupyter里可以静态展示。

这次介绍一个可视化工具-LUX,它能自动地将DataFrame数据转化为统计图表,让你一目了然地看到相关性、分布、频率等信息。

Python库助力pandas智能可视化的示例分析

LUX在Jupyter Notebook或Lab中进行交互,图表与数据可以同步显示。

项目地址: https:// github.com/lux-org/lux

使用LUX

以下面数据集(美国各大学信息表)为例:

# 导入pandas和lux库 import pandas as pd import lux  #加载数据 df = pd.read_excel("C:\\Users\\zii\\Documents\\USA_College.xlsx") df

读取的数据如下:

Python库助力pandas智能可视化的示例分析
Python库助力pandas智能可视化的示例分析

除了显示的数据表外,同时你还会看到数据集上面出现一个按钮,可以进行数据/图表的交换显示。

Python库助力pandas智能可视化的示例分析

所以说只需要导入lux库,就能直接使用图表功能。

Python库助力pandas智能可视化的示例分析

大家看到下面有三种类型的图表,代表的统计学含义分别是相关性、直方分布、事件频次。

Python库助力pandas智能可视化的示例分析
Python库助力pandas智能可视化的示例分析
Python库助力pandas智能可视化的示例分析

除了全表的可视化探索外,你还可以研究特定变量间的关系。

比如,我想看 SAT平均值 和 收入中位数 的关联性.

df.intent = ['SAT平均值','收入中位数'] df
Python库助力pandas智能可视化的示例分析

左边的表是两个变量的总体分布,右边是在有筛选条件下的分布。

导出图表

LUX支持图表的导出,既可以导出图表文件,也可以导出相应的matplotlib、altair代码。

首先选定一个或多个图表,点击导出按钮。

Python库助力pandas智能可视化的示例分析

可以直接将选定的图表单独显示出来:

Python库助力pandas智能可视化的示例分析
  1. 鸿蒙官方战略合作共建——HarmonyOS技术社区

  2. 导出html df.save_as_html('hpi.html')

  3. 导出matplotlib代码

vis = df.exported print (vis[0].to_matplotlib())
Python库助力pandas智能可视化的示例分析
  1. 鸿蒙官方战略合作共建——HarmonyOS技术社区

  2. 导出altair代码

vis = df.exported print(vis[0].to_Altair())
Python库助力pandas智能可视化的示例分析

导出的代码可以直接运行:

import altair as alt  chart = alt.Chart(df).mark_circle().encode(     x=alt.X('SAT平均值',scale=alt.Scale(domain=(666, 1534)),type='quantitative', axis=alt.Axis(title='SAT平均值')),     y=alt.Y('收入中位数',scale=alt.Scale(domain=(20200, 125600)),type='quantitative', axis=alt.Axis(title='收入中位数')) ) chart = chart.configure_mark(tooltip=alt.TooltipContent('encoding')) # Setting tooltip as non-null chart = chart.interactive() # Enable Zooming and Panning chart = chart.encode(color=alt.Color('最高学位',type='nominal'))  chart = chart.configure_title(fontWeight=500,fontSize=13,font='Helvetica Neue') chart = chart.configure_axis(titleFontWeight=500,titleFontSize=11,titleFont='Helvetica Neue', labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue',labelColor='#505050') chart = chart.configure_legend(titleFontWeight=500,titleFontSize=10,titleFont='Helvetica Neue', labelFontWeight=400,labelFontSize=8,labelFont='Helvetica Neue') chart = chart.properties(width=160,height=150)  chart
Python库助力pandas智能可视化的示例分析

安装设置

lux安装过程和其他库一样,可以通过pip或conda安装,直接在命令行输入:

pip install lux-api

conda install -c conda-forge lux-api

因为lux一般用在Jupyter生态中,所以需要安装并激活luxwidget拓展,才能显示交互式窗口。

如果你是在Jupyter Notebook或VSCode中使用,使用下面代码激活拓展:

jupyter nbextension install --py luxwidget jupyter nbextension enable --py luxwidget

如果你使用的是Jupyter Lab,则激活lab拓展:

jupyter labextension install @jupyter-widgets/jupyterlab-manager jupyter labextension install luxwidget

LUX是一个不错的数据可视化分析工具,能智能地辅助Pandas做数据探索,省去了很多不必要的操作。

看完上述内容是否对您有帮助呢?如果还想对相关知识有进一步的了解或阅读更多相关文章,请关注编程网行业资讯频道,感谢您对编程网的支持。

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯