文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python如何实现对某地区二手房房价进行数据分析

2023-06-21 23:18

关注

这篇文章主要介绍了Python如何实现对某地区二手房房价进行数据分析,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。

房价数据分析

数据简单清洗

data.csv

Python如何实现对某地区二手房房价进行数据分析

数据显示

# 导入模块import pandas as pd  # 导入数据统计模块import matplotlib  # 导入图表模块import matplotlib.pyplot as plt  # 导入绘图模块# 避免中文乱码matplotlib.rcParams['font.sans-serif'] = ['SimHei']  # 设置字体为SimHei显示中文matplotlib.rcParams['axes.unicode_minus'] = False  # 设置正常显示字符,使用rc配置文件来自定义# 简单清洗data = pd.read_csv('data.csv')  # 读取csv数据del data['Unnamed: 0']  # 将索引列删除data.dropna(axis=0, how='any', inplace=True)  # 删除data数据中的所有空值data['单价'] = data['单价'].map(lambda d: d.replace('元/平米', ''))  # 将单价“元/平米”去掉data['单价'] = data['单价'].astype(float)  # 将房子单价转换为浮点类型,float(data['',单价])data['总价'] = data['总价'].map(lambda d: d.replace('万', ''))  # 将总价“万”去掉data['总价'] = data['总价'].astype(float)  # 将房子总价转换为浮点类型,float(data['',单价])data['建筑面积'] = data['建筑面积'].map(lambda p: p.replace('平米', ''))  # 将建筑面积“平米去掉”data['建筑面积'] = data['建筑面积'].astype(float)  # 将将建筑面积转换为浮点类型

Python如何实现对某地区二手房房价进行数据分析

各区均价分析

# 获取各区二手房均价分析,根据需求,,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理def get_average_price():    group = data.groupby('区域')  # 将房子区域分组    average_price_group = group['单价'].mean()  # 计算每个区域的均价,average_price_group字典    x = average_price_group.index  # 区域    y = average_price_group.values.astype(int)  # 区域对应的均价a =['t':'123'] a.keys()    return x, y  # 返回区域与对应的均价,region二关 average_price均价# 显示均价条形图def average_price_bar(x, y, title):    plt.figure()  # 图形画布    plt.bar(x, y, alpha=0.8)  # 绘制条形图    plt.xlabel("区域")  # 区域文字    plt.ylabel("均价")  # 均价文字    plt.title(title)  # 表文字    # 为每一个图形加数值标签    for x, y in enumerate(y):        plt.text(x, y + 100, y, ha='center')    plt.show()if __name__ == '__main__':    x, y = get_average_price()    title = '各区均价分析'    average_price_bar(x, y, title)

运行如图

Python如何实现对某地区二手房房价进行数据分析

全市二手房装修程度分析

# 获取各区二手房均价分析,根据需求,,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理def get_decorate_sum():    group = data.groupby('装修')  # 将房子区域分组    # decorate_sum_group = group['装修'].count()  # 计算每个区域的均价,average_price_group字典    decorate_sum_group = group.size()  # 计算每个区域的均价,average_price_group字典    x = decorate_sum_group.index  # 区域    y = decorate_sum_group.values.astype(int)  # 区域对应的均价a =['t':'123'] a.keys()    return x, y  # 返回区域与对应的均价,region二关 average_price均价# 显示均价条形图def average_price_bar(x, y, title):    plt.figure()  # 图形画布    plt.bar(x, y, alpha=0.8)  # 绘制条形图    plt.xlabel("装修类型")  # 区域文字    plt.ylabel("数量")  # 均价文字    plt.title(title)  # 表文字    # 为每一个图形加数值标签    for x, y in enumerate(y):        plt.text(x, y + 100, y, ha='center')    plt.show()if __name__ == '__main__':    x, y = get_decorate_sum()    title = '全市二手房装修程度分析'    average_price_bar(x, y, title)

Python如何实现对某地区二手房房价进行数据分析

各区二手房数量所占比比例

# 获取各区二手房各区比例数量,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理def get_proportional_quantity():    area = data['区域'].groupby(data['区域']).count()  # 将房子区域分组比例数量    areaName = (area).index.values  # 将房子区域分组比例取名    return area, areaName# 显示均价条形图def proportional_quantity_pie(area, areaName, title):    plt.figure()  # 图形画布    plt.pie(area, labels=areaName, labeldistance=1.1, autopct='%.1f%%',            shadow=True, startangle=90, pctdistance=0.7)    plt.title(title, fontsize=24)  # 表文字    plt.legend(bbox_to_anchor=(-0.1, 1))  # 作者    plt.show()if __name__ == '__main__':    # 对应x,y    area, areaName = get_proportional_quantity()    title = '各区二手房数量所占比比例'    proportional_quantity_pie(area, areaName, title)

Python如何实现对某地区二手房房价进行数据分析

热门户型均价分析

# 获取各区热门户型分析,根据需求,,进一步处理数据,如果要写相应算法,需要根据算法所需求的数据处理def get_hot_portal():    # 另外一种方法获取并取值    """    group = data.groupby('户型').size  # 将房子区域分组    sort_data = group.sort_values(ascending=False)  # 将户型分组数量进行降序    five_data = sort_data.head()  # 提取前5组户型数据    house_type_mean = data.groupby('户型')['单价'].mean().astype(int)  # 计算每个户型的均价    x = house_type_mean[five_data.index].index  # 户型    y = house_type_mean[five_data.index].value  # 户型对应的均价    """    group = data.groupby('户型')  # 将房子区域分组    a = group['户型'].count().sort_values(ascending=False).head()  # 计算每个户型的均价 字典    b = group['单价'].mean()[a.index]  # 区域对应的均价a =['t':'123'] a.keys()    x = b.index    y = b.values.astype(int)    return x, y  # 返回区域与对应的均价,region二关 average_price均价# 显示均价横条形图def hot_portal_barh(x, y, title):    plt.figure()  # 图形画布    plt.barh(x, y, alpha=0.9, color='red')  # 绘制条形图    plt.xlabel("均价")  # 区域文字    plt.ylabel("户型")  # 均价文字    plt.title(title)  # 表文字    plt.xlim(0, 15000)  # X轴的大小    # 为每一个图形加数值标签    for y, x in enumerate(y):        plt.text(x + 100, y, str(x) + '元', ha='left')    plt.show()if __name__ == '__main__':    x, y = get_hot_portal()    title = '热门户型均价分析'    hot_portal_barh(x, y, title)

前面三个图较简单,最后相对于前面三个较为麻烦

先获取得到热门户型前五名,通过户型得到对应的户型的平均值

Python如何实现对某地区二手房房价进行数据分析

感谢你能够认真阅读完这篇文章,希望小编分享的“Python如何实现对某地区二手房房价进行数据分析”这篇文章对大家有帮助,同时也希望大家多多支持编程网,关注编程网行业资讯频道,更多相关知识等着你来学习!

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯