文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

对不起,你的PPT数据不够直观,你可能需要让数据动起来

2024-12-11 22:23

关注

数据暴增的年代,数据科学家、分析师在被要求对数据有更深的理解与分析的同时,还需要将结果有效地传递给他人。如何让目标听众更直观地理解?当然是将数据可视化啊,而且最好是动态可视化。

本文将以线型图、条形图和饼图为例,系统地讲解如何让你的数据图表动起来。

这些动态图表是用什么做的?

接触过数据可视化的同学应该对 Python 里的 Matplotlib 库并不陌生。它是一个基于 Python 的开源数据绘图包,仅需几行代码就可以帮助开发者生成直方图、功率谱、条形图、散点图等。这个库里有个非常实用的扩展包——FuncAnimation,可以让我们的静态图表动起来。

FuncAnimation 是 Matplotlib 库中 Animation 类的一部分,后续会展示多个示例。如果是首次接触,你可以将这个函数简单地理解为一个 While 循环,不停地在 “画布” 上重新绘制目标数据图。

如何使用 FuncAnimation?

这个过程始于以下两行代码:

  1. import matplotlib.animation as ani 
  2.  
  3. animator = ani.FuncAnimation(fig, chartfunc, interval = 100

从中我们可以看到 FuncAnimation 的几个输入:

这是三个关键输入,当然还有更多可选输入,感兴趣的读者可查看原文档,这里不再赘述。

下一步要做的就是将数据图表参数化,从而转换为一个函数,然后将该函数时间序列中的点作为输入,设置完成后就可以正式开始了。

在开始之前依旧需要确认你是否对基本的数据可视化有所了解。也就是说,我们先要将数据进行可视化处理,再进行动态处理。

按照以下代码进行基本调用。另外,这里将采用大型流行病的传播数据作为案例数据(包括每天的死亡人数)。

  1. import matplotlib.animation as ani 
  2. import matplotlib.pyplot as plt 
  3. import numpy as np 
  4. import pandas as pdurl = 'https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv' 
  5. df = pd.read_csv(url, delimiter=',', header='infer')df_interest = df.loc[ 
  6.     df['Country/Region'].isin(['United Kingdom''US''Italy''Germany']) 
  7.     & df['Province/State'].isna()]df_interest.rename( 
  8.     index=lambda x: df_interest.at[x, 'Country/Region'], inplace=True) 
  9. df1 = df_interest.transpose()df1 = df1.drop(['Province/State''Country/Region''Lat''Long']) 
  10. df1 = df1.loc[(df1 != 0).any(1)] 
  11. df1.index = pd.to_datetime(df1.index) 

绘制三种常见动态图表

绘制动态线型图

如下所示,首先需要做的第一件事是定义图的各项,这些基础项设定之后就会保持不变。它们包括:创建 figure 对象,x 标和 y 标,设置线条颜色和 figure 边距等:

  1. import numpy as np 
  2.  
  3. import matplotlib.pyplot as pltcolor = ['red''green''blue''orange'
  4.  
  5. fig = plt.figure() 
  6.  
  7. plt.xticks(rotation=45, ha="right", rotation_mode="anchor") #rotate the x-axis values 
  8.  
  9. plt.subplots_adjust(bottom = 0.2, top = 0.9) #ensuring the dates (on the x-axis) fit in the screen 
  10.  
  11. plt.ylabel('No of Deaths'
  12.  
  13. plt.xlabel('Dates'

接下来设置 curve 函数,进而使用 .FuncAnimation 让它动起来:

  1. def buildmebarchart(i=int): 
  2.  
  3.     plt.legend(df1.columns) 
  4.  
  5.     p = plt.plot(df1[:i].index, df1[:i].values) #note it only returns the dataset, up to the point i 
  6.  
  7.     for i in range(0,4): 
  8.  
  9.         p[i].set_color(color[i]) #set the colour of each curveimport matplotlib.animation as ani 
  10.  
  11. animator = ani.FuncAnimation(fig, buildmebarchart, interval = 100
  12.  
  13. plt.show() 

动态饼状图

可以观察到,其代码结构看起来与线型图并无太大差异,但依旧有细小的差别。

  1. import numpy as np 
  2.  
  3. import matplotlib.pyplot as pltfig,ax = plt.subplots() 
  4.  
  5. explode=[0.01,0.01,0.01,0.01] #pop out each slice from the piedef getmepie(i): 
  6.  
  7.     def absolute_value(val): #turn % back to a number 
  8.  
  9.         a  = np.round(val/100.*df1.head(i).max().sum(), 0
  10.  
  11.         return int(a) 
  12.  
  13.     ax.clear() 
  14.  
  15.     plot = df1.head(i).max().plot.pie(y=df1.columns,autopct=absolute_value, label='',explode = explode, shadow = True) 
  16.  
  17.     plot.set_title('Total Number of Deathsn' + str(df1.index[min( i, len(df1.index)-1 )].strftime('%y-%m-%d')), fontsize=12)import matplotlib.animation as ani 
  18.  
  19. animator = ani.FuncAnimation(fig, getmepie, interval = 200
  20.  
  21. plt.show() 

主要区别在于,动态饼状图的代码每次循环都会返回一组数值,但在线型图中返回的是我们所在点之前的整个时间序列。返回时间序列通过 df1.head(i) 来实现,而. max()则保证了我们仅获得最新的数据,因为流行病导致死亡的总数只有两种变化:维持现有数量或持续上升。

  1. df1.head(i).max() 

动态条形图

创建动态条形图的难度与上述两个案例并无太大差别。在这个案例中,作者定义了水平和垂直两种条形图,读者可以根据自己的实际需求来选择图表类型并定义变量栏。

  1. fig = plt.figure() 
  2.  
  3. bar = ''def buildmebarchart(i=int): 
  4.  
  5.     iv = min(i, len(df1.index)-1) #the loop iterates an extra one time, which causes the dataframes to go out of bounds. This was the easiest (most lazy) way to solve this :) 
  6.  
  7.     objects = df1.max().index 
  8.  
  9.     y_pos = np.arange(len(objects)) 
  10.  
  11.     performance = df1.iloc[[iv]].values.tolist()[0
  12.  
  13.     if bar == 'vertical'
  14.  
  15.         plt.bar(y_pos, performance, align='center', color=['red''green''blue''orange']) 
  16.  
  17.         plt.xticks(y_pos, objects) 
  18.  
  19.         plt.ylabel('Deaths'
  20.  
  21.         plt.xlabel('Countries'
  22.  
  23.         plt.title('Deaths per Country n' + str(df1.index[iv].strftime('%y-%m-%d'))) 
  24.  
  25.     else
  26.  
  27.         plt.barh(y_pos, performance, align='center', color=['red''green''blue''orange']) 
  28.  
  29.         plt.yticks(y_pos, objects) 
  30.  
  31.         plt.xlabel('Deaths'
  32.  
  33.         plt.ylabel('Countries')animator = ani.FuncAnimation(fig, buildmebarchart, interval=100)plt.show() 

在制作完成后,存储这些动态图就非常简单了,可直接使用以下代码:

  1. animator.save(r'C:tempmyfirstAnimation.gif'

感兴趣的读者如想获得详细信息可参考:https://matplotlib.org/3.1.1/api/animation_api.html。

 

 

来源:机器之心内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯