文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

数据分析实战,用Pandas分析二手车市场行情

2024-11-30 14:18

关注

使用的工具(库)

导入所需的包并加载数据集:

来自网站的原始数据:

现在,可以看到有一个名为Unnamed:0的列。这一列一定是在抓取数据并将其保存到CSV文件中时添加的。因此,下一步就是删除数据。

数据清洗:

现在将删除Unnamed:0列,然后再次清洗,使数据可视化。

清洗后的Dataframe:

数据概览:

DataFrame.info()将为项目提供有关数据类型和每一列中非空值的数量的信息。

Describe()每一列的数字特征和信息:

最后我们得到了560行和9列,并且在Year、Brand、Car name、kilometer、owner、fuel、Emi、location和price等列中没有空值。

探索数据

车辆信息汇总

列类型:

  1. 2010年至2022年之间的车型年份
  2. 公里数范围从121英里到99944英里不等
  3. 价格从1.62万到24.36万卢比不等

数据可视化

单变量:

最畅销的品牌:

a[‘Brand’].value_counts().plot(kind=’bar’)
plt.xlabel(‘Brand’)
plt.ylabel(‘Highest selling’)
plt.show()

价格分布:

sns.histplot(a[‘price(in_lk)’],kde=True)

燃料

px.bar(a[‘fuel’].value_counts())

双变量分析

不同数量的前车主的车辆列表 :

sns.barplot(x=a[‘owner’],y=a[‘price(in_lk)’],errorbar=None)

来自不同州的车辆列表

a.groupby([‘Location’])[‘year’].count().sort_values(ascending=False).plot(kind=’bar’, figsize=(10,6))
plt.ylabel(‘Number of listings per state’, fnotallow=12)
plt.xlabel(‘State’, fnotallow=12)
plt.title(‘Listings per State’, fnotallow=18)
plt.show()

比较年份和价格:

sns.lineplot(x=a[“year”],y=a[“price(in_lk)”],errorbar=None)

燃料类型将如何影响转售价格?

sns.boxplot(x=a[“fuel”],y=a[“price(in_lk)”])

多变量分析:

sns.barplot(x=a[“year”],y=a[“price(in_lk)”],errorbar=None,hue=a[“owner”])

相关性:

可以使用corr()函数找到各种特征之间的相关性。

sns.heatmap(a.corr(),annot=True)

plt.figure(figsize=(18,7))
sns.barplot(x=a[“Location”],y=a[“price(in_lk)”],hue=a[“Location”],errorbar=None)
plt.xticks(rotation = 90)
plt.show()

结论

从可视化中,我们发现了以下结论:

来源:Python学研大本营内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯