短信预约-IT技能免费直播动态提醒

短信预约提醒成功

pandas如何将表中的字符串转成数值型

2023-02-21 18:00

关注

目录

pandas将表中的字符串转成数值型
扩展：pandas 把某一列中字符串变数值_Pandas对文本数据处理

一、str属性
二、替换和分隔
三、提取子串

1、提取第一个匹配的子串

四、生成哑变量

pandas将表中的字符串转成数值型

在用pd.read_csv读数据时，将要转换数据类型的列名和类型名构成字典，传给dtype

import numpy as np
import pandas as pd

path = 'house_data.csv'
col = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS',
       'RAD', 'TAX', 'PTRATIO', 'B', 'LSTAT', 'MEDV']
dict_dtype = {}
for i in col:
    dict_dtype[i] = np.float64
# print(dict_dtype)

data = pd.read_csv(path, header=None, names=col, sep=',', dtype=dict_dtype)

扩展：pandas 把某一列中字符串变数值_Pandas对文本数据处理

在处理数据的时候,对数值型的数据处理还是比较方便的,但是有时候数值型数据出现问题后就会比较头痛了,因为文本数据的排列组合可是有很多很多的,今天我们就学习一下如何对文本数据进行处理,这样我们接下来在工作中遇到了这些情况就可以少掉一下头发啦。

一、str属性

文本数据也就是我们常说的字符串,pandas为series提供了str属性,通过它可以方便对每个元素进行操作。

为了防止数据被弄坏,我们先预留一个备份以防万一。

这里我们是不能使用backup_user_info = user_info的因为这样的话一个更改另外一个也会更改。

在之前我们也已经了解过,在对series中每个元素处理时,我们可以使用map或apply方法,比如我们想把星球列下面的地球和外星转换为英文,可以使用下面的方式。

这时候我们在将表恢复成原来的样子。

将哪个星球列下的星球改为大写的英文后再改为小写

首先更改为英文

然后设置一个函数,将星球改为大写,原理为upper()方法

然后在设置为小写,原理为lower方法

给英雄们的身高加上一个单位

我们通过str属性来访问之后用到的方法名与 Python 内置的字符串的方法名一样。并且能够自动排除缺失值。我们再来试试其他一些方法。例如，统计每个字符串的长度。

将cm替换成空白的字符串

将身高列的元素类型转换为整数型

生成一个新的列,列名为姓名的长度,元素为英雄姓名的长度(len方法)

查看表的元素类型

将年不年轻列的中的中年属性更改为中老年属性

查看城市列中每个元素有几个字

查看年不年轻列中每个元素是否有轻这个字符串

二、替换和分隔

使用.srt属性也支持替换与分割操作。先来看下替换操作，例如：将大写的R转换为小写的r。

将列中的数据进行分隔

将是否年轻按年进行分隔,结果如上所述。

分割列表中的元素可以使用 get 或 [] 符号进行访问：

比如说电影的主演有很多人, 可能是用逗号, 或者/ 进行分割, 这是可以用这种方法转换成列表

在表中添加一列英雄的爱人列

将爱人列以,号分隔

这时候就可以让某一行的这个元素以列表表现出来。

将索引列改为英雄姓名,并查看蜘蛛侠和灭霸的爱人

三、提取子串

既然是在操作字符串，很自然的大家可能会想到是否可以从一个长的字符串中提取出子串。答案是可以的。

1、提取第一个匹配的子串

extract方法接受一个正则表达式并至少包含一个捕获组，指定参数 expand=True可以保证每次都返回DataFrame。例如，现在想要匹配空字符串前面的所有的字母，可以使用如下操作：

查看哪位英雄的所在的星球包括E这个字符串

查看哪位英雄所在的城市包括纽这个字符串

四、生成哑变量

首先我们先了解一下什么是哑变量:

哑变量原名为虚拟变量 ( Dummy Variables) 又称虚设变量、名义变量或哑，用以反映质的属性的一个人工变量，是量化了的自变量，通常取值为0或1。引入哑变量可使线形回归模型变得更复杂，但对问题描述更简明，一个方程能达到两个方程的作用，而且接近现实。

在pandas中我们可以通过get_dummies 方法可以将字符串转为哑变量，sep 参数是指定哑变量之间的分隔符。

对英雄姓名进行哑变量转换

从结果可以看出,第0行的英雄姓名是蜘蛛侠,第1行的英雄姓名是灭霸,哑变量转换就是将每一个选择匹配哪一行的数据。

对那个星球进行哑变量转换

从结果可以看出,在地球的英雄是第0、2、3、4、6行的,对应的英雄名称为(蜘蛛侠、奇异博士、钢铁侠、蝙蝠侠、黑寡妇)

到此这篇关于pandas将表中的字符串转成数值型的文章就介绍到这了,更多相关pandas字符串转成数值型内容请搜索编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程网！

阅读原文内容投诉

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

历年真题答案解析
备考技巧名师总结
高频考点精准押题

资料下载
历年真题

2024上半年软考中级软件测评师考试基础知识真题
193.9 KB下载数265
2024上半年软考中级软件设计师考试基础知识真题
191.63 KB下载数245
2023下半年-系统集成项目管理工程师-真题考点汇总（完整版）
143.91 KB下载数1148
2023年下半年系统集成项目管理工程师第一、二、三批次真题考点整理(考友回忆版)
183.71 KB下载数642
2023年上半年软考中级《系统集成项目管理工程师》-基础知识-考试真题及答案
644.84 KB下载数2756

2024年上半年信息系统项目管理师第二批次真题及答案解析（完整版）
难度 813人已做
查看
【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析
难度 354人已做
查看
【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析
难度 318人已做
查看
2024年上半年软考高项第一、二批次真题考点汇总（完整版）
难度 435人已做
查看
2024年上半年系统架构设计师考试综合知识真题
难度 224人已做
查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机

pandas如何将表中的字符串转成数值型

后端开发2023-02-21

pandas怎么将表中的字符串转成数值型

后端开发2023-07-05

php如何将值转型成字符串

后端开发2023-06-29

javascript中如何将值转为字符串类型

后端开发2023-06-14

javascript中如何将字符串转换成数字

后端开发2023-02-10

mysql中如何将字符串转换成数字

mysql中如何将字符串转换成数字

后端开发2024-05-13

javascript如何将数值转为字符串

后端开发2024-04-02

php中如何将字符串转化成字符数组

后端开发2023-06-29

python如何将字符类型、数值类型等转换为字符串类型

后端开发2024-04-02

vb中怎么将字符串转换成数值

后端开发2023-10-11

Android中如何将字符串转换成Bitmap类型

后端开发2024-04-02

如何在 Java 中将字符串转换成整数？(java怎么将字符串转换成整数)

如何在 Java 中将字符串转换成整数？(java怎么将字符串转换成整数)

后端开发 Java2024-12-17

javascript如何将字符串转换成数字

后端开发2024-04-02

mysql如何将字符串转换成数字

mysql如何将字符串转换成数字

后端开发2024-06-14

php字符串如何转换成数值

后端开发2023-07-05

php中如何将数字字符串转化数字类型

后端开发2023-06-29

php如何将值强制转为字符串类型

后端开发2023-06-15

php如何将浮点型转换成字符串

后端开发2023-06-25

javascript如何将值类型强制转为字符串

后端开发2024-04-02

如何在 Java 中将字符串转化为 hash 值？(Java怎么将字符串转化为hash值)

如何在 Java 中将字符串转化为 hash 值？(Java怎么将字符串转化为hash值)

后端开发 Java2024-12-15

位置：首页-资讯-后端开发

咦！没有更多了？去看看其它编程学习网内容吧