文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

Python如何读取Excel表内容

2023-09-02 08:38

关注

用python读取excel表中的数据

假如说有如下一张存储了数据的excel表,其中x1-x6是特征,y_label是特征对应的类别标签。我们想要使用python对以下数据进行数据分析,那么第一步就要先把excel表中的数据读取出来才行。这里我们主要使用到了python中的pandas库。
在这里插入图片描述
首先确定excel表存放的路径所在,比如我的路径是 ‘E:\relate_code\svm\dataset\data.xlsx’.

import pandas as pdfile_path = r'E:\relate_code\svm\dataset\data.xlsx'   # r对路径进行转义,windows需要raw_data = pd.read_excel(file_path, header=0)  # header=0表示第一行是表头,就自动去除了print(raw_data)

这样就可以取出数据了,输出见下图。可以看出,这里就没有表中的x1等表头信息了。
在这里插入图片描述

但是,最左边这里还有0-169这些行号额外信息,咱们可以用以下命令只要里面的有用信息,并保存到数组中。

data = raw_data.values     # 只提取表中信息print(data)

输出结果:
在这里插入图片描述
这时候数据就都读进来了,并且存储为了数组形式。咱们可以选择想要的数据,比如想把x和y分开,毕竟一个是特征,另一个是标签,这时候可以使用以下代码。

features = data[:, 0:6]  # 由于是二维数组,所以第一个冒号表示选择所有行,之后0:6表示只要前六列的数据labels = data[:, -1]     # 标签只要最后一列

还可以对特征进行选择,假如只要第四列的特征也可以使用:

feature_4 = data[: 3:4]  # 这样得出的数组依然是二维数组,便于后续特征操作

如果不想要第四个特征,其它都想要,也可以这样使用,需要用到numpy库:

import numpy as npfeature1_3 = data[:, 0:3]   # 取前三列特征feature5_6 = data[:, 4:6]   # 取第5,第6列特征feature_choose = np.hstack(feature1_3, feature5_6)   # 对两份特征进行特征拼接

这里再多说一下,np.hstack()函数和 np.vstack()函数:

这里是np.vstack()函数。主要是进行竖直堆叠,使用这个函数的时候要保证两个数组列数是一致的(都是三列),得出的结果如下。

import numpy as nparr1 = np.array([[1, 2, 3], [4, 5, 6]])arr2 = np.array([7, 8, 9])print(np.vstack((arr1, arr2)))

在这里插入图片描述
下面是np.hstack()函数,主要是进行水平堆叠,使用这个函数的时候要保证行数是一致的(都是两行)。

import numpy as nparr1 = np.array([[1, 2], [3, 4]])arr2 = np.array([[7, 8, 9], [10, 11, 12]])print(np.hstack((arr1, arr2)))

在这里插入图片描述
就先介绍到这里吧,下一篇文章介绍机器学习的代码使用,请多关注哦!

日常学习记录,一起交流讨论吧!侵权联系~

来源地址:https://blog.csdn.net/WYKB_Mr_Q/article/details/122999267

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯