Python3实现常用数据标准化方法-编程学习网

数据标准化是机器学习、数据挖掘中常用的一种方法。包括我自己在做深度学习方面的研究时，数据标准化是最基本的一个步骤。数据标准化主要是应对特征向量中数据很分散的情况，防止小数据被大数据（绝对值）吞并的情况。另外，数据标准化也有加速训练，防止梯度爆炸的作用。下面是从李宏毅教授视频中截下来的两张图。

左图表示未经过数据标准化处理的loss更新函数，右图表示经过数据标准化后的loss更新图。可见经过标准化后的数据更容易迭代到最优点，而且收敛更快。

一、[0, 1] 标准化

[0, 1] 标准化是最基本的一种数据标准化方法，指的是将数据压缩到0～1之间。标准化公式如下，
$x = \dfrac{x - min(x)}{max(x) - mix(x)}$ x=max(x)−mix(x)x−min(x)
代码实现，

def MaxMinNormalization(x, min, max):
    """[0,1] normaliaztion"""
    x = (x - min) / (max - min)
    return x

或者，

def MaxMinNormalization(x):
    """[0,1] normaliaztion"""
    x = (x - np.min(x)) / (np.max(x) - np.min(x))
    return x

二、Z-score标准化

Z-score标准化是基于数据均值和方差的标准化化方法。标准化后的数据是均值为0，方差为1的正态分布。这种方法要求原始数据的分布可以近似为高斯分布，否则效果会很差。标准化公式如下，
$x = \dfrac{x - mean}{std}$ x=stdx−mean
下面，我们看看为什么经过这种标准化方法处理后的数据为是均值为0，方差为1，

代码实现，

def ZscoreNormalization(x, mean_, std_):
    """Z-score normaliaztion"""
    x = (x - mean_) / std_
    return x

或者，

def ZscoreNormalization(x):
    """Z-score normaliaztion"""
    x = (x - np.mean(x)) / np.std(x)
    return x

【参考文献】

https://en.wikipedia.org/wiki/Feature_scaling

文章详情

Python3实现常用数据标准化方法

一、[0, 1] 标准化

二、Z-score标准化

【参考文献】

软考中级精品资料免费领

相关文章

猜你喜欢

Python3实现常用数据标准化方法

Python3 常用数据标准化方法详解

Python3中实现数据标准化的方法有哪些

使用pandas模块怎么实现数据标准化

使用pandas模块实现数据的标准化操作

利用PHP trait DTO实现数据传输的标准化与规范化

Golang标准库中的常见数据结构及用法

Python标准数据类型-字符串常用方法(下)【文末送书】

Python标准数据类型-字符串常用方法(上)【文末送书】

优化数据库的常用方法

常用的MySQL数据库优化方法

实现优化MySQL数据库的方法

redis数据持久化的实现方法

服务器硬件标准化：实现数据中心和谐的利器

python用pyecharts实现地图数据可视化的方法

解读数据，我发现了超好用的七步标准法

PHP实现数据库容器化高可用的方法

服务器硬件标准化：实现数据中心可扩展性的关键

如何采用零信任数据访问方法实现数据安全现代化

驾驭服务器硬件标准化：实现数据中心的卓越运营