pandas数据处理之标签列字符转数字的实现-编程学习网

机器学习中，当我们在进行数据预处理的时候，对于标签列非字符的数据，我们往往需要将其转换成字符，因为有的算法可能不支持非数字类型来做特征。

那么怎么快捷地来着这个转换呢，请看我的示例：

1.构建测试数据


import pandas as pd
array = ['good','bad','well','bad','good','good','well','good']

2.数据转换下，并获取标签列的字典


df = pd.DataFrame(array,columns=['status'])
status_dict = df['status'].unique().tolist()

3.使用函数进行转换


df['transfromed']=df['status'].apply(lambda x : status_dict.index(x))

这样，就将标签列处理好了哈

等用完之后，再转回来


df['transfromed1']= df['transfromed'].apply(lambda x : status_dict[x])

补充：pandas factorize将字符串特征转化为数字特征

将原始数据中的字符串特征转化为模型可以识别的数字特征可是使用pandas自带的factorzie方法。

原始数据的job特征值如下

都是字符串特征,无法用于训练，当然可以单独建立map硬编码处理，但是pandas已经封装好了相应的方法。


data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持编程网。如有错误或未考虑完全的地方，望不吝赐教。

文章详情

pandas数据处理之标签列字符转数字的实现

1.构建测试数据

2.数据转换下，并获取标签列的字典

3.使用函数进行转换

软考中级精品资料免费领

相关文章

猜你喜欢

pandas数据处理之标签列字符转数字的实现

pandas数据处理之标签列字符转数字的实现

Python列表之间的数字与字符转化实例

python数据处理之Pandas类型转换的实现

python数据清洗系列之字符串处理详解

python数据处理之Pandas类型转换怎么实现

R语言实现将数据框中的字符类型数字转换为数值

lodash里to系列之将数据转换成数字类型实现示例

PHP中处理字符串转浮点数的最佳实践

Python实现列表转换成字典数据结构的方法

详解C语言对字符串处理函数的实现方法

深入理解Go语言文档中的strconv.FormatInt函数实现整数转字符串

Python项目实战篇之常用验证码标注&识别(数据采集/预处理/字符图切割）

深入理解Go语言文档中的strconv.FormatFloat函数实现浮点数转字符串

100天精通Python（数据分析篇）——第72天：Pandas文本数据处理方法之判断类型、去除空白字符、拆分和连接

MySQL怎么有效的实现存储IP地址及字符串IP和数值之间的转换

Java关键字在分布式实时数据处理中的性能表现如何？

mssql sqlserver sql对使用逗号分隔的字符串转换为数据表的另类方法实现

文章详情

pandas数据处理之 标签列字符转数字的实现

1.构建测试数据

2.数据转换下，并获取标签列的字典

3.使用函数进行转换

软考中级精品资料免费领

相关文章

猜你喜欢

pandas数据处理之标签列字符转数字的实现

pandas数据处理之 标签列字符转数字的实现

Python列表之间的数字与字符转化实例

python数据处理之Pandas类型转换的实现

python数据清洗系列之字符串处理详解

python数据处理之Pandas类型转换怎么实现

R语言 实现将数据框中的字符类型数字转换为数值

lodash里to系列之将数据转换成数字类型实现示例

PHP中处理字符串转浮点数的最佳实践

Python实现列表转换成字典数据结构的方法

详解C语言对字符串处理函数的实现方法

深入理解Go语言文档中的strconv.FormatInt函数实现整数转字符串

Python项目实战篇之常用验证码标注&识别(数据采集/预处理/字符图切割）

深入理解Go语言文档中的strconv.FormatFloat函数实现浮点数转字符串

100天精通Python（数据分析篇）——第72天：Pandas文本数据处理方法之判断类型、去除空白字符、拆分和连接

MySQL怎么有效的实现存储IP地址及字符串IP和数值之间的转换

Java关键字在分布式实时数据处理中的性能表现如何？

mssql sqlserver sql对使用逗号分隔的字符串 转换为数据表的另类方法实现

pandas数据处理之标签列字符转数字的实现

pandas数据处理之标签列字符转数字的实现

R语言实现将数据框中的字符类型数字转换为数值

mssql sqlserver sql对使用逗号分隔的字符串转换为数据表的另类方法实现