这篇文章将为大家详细讲解有关如何在python中实现数据变换,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
python是什么意思
Python是一种跨平台的、具有解释性、编译性、互动性和面向对象的脚本语言,其最初的设计是用于编写自动化脚本,随着版本的不断更新和新功能的添加,常用于用于开发独立的项目和大型项目。
1、数据规范化,即归一化的方法
常见方法:最小-最大规范化、z-score规范化、小数定标规范化
import pandas as pddf=pd.DataFrame(A.data[:,3:6])df.columns=A.feature_names[3:6]#最小-最大规范化,支持矢量运算(df-df.min())/(df.max()-df.min()) #使用sklearn中的preprocessing模块from sklearn import preprocessingpreprocessing.minmax_scale(df) #z-score规范化:结果=(数值-均值)/标准差,处理后数据的均值为0,标准差为1(df-df.mean())/df.std() #使用sklearn中的preprocessing模块from sklearn import preprocessingpreprocessing.scale(df) #小数定标规范化:常见落在[-1,1]区间,通过移动小数点的位数实现,移动位数取决于属性绝对值的最大值的位数#ceil向上取整import numpy as npdf/10**np.ceil(np.log10(df.abs().max()))
2、连续属性离散化
常见方法:分箱法(等宽法、等频法)、聚类
import pandas as pd#等宽法,5个箱子,标签为0-4pd.cut(df.AGE,5,label=range(5))#等频法pd.qcut(df.AGE,5,label=range(5))
关于如何在python中实现数据变换就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。