Python Opencv数据增强的方法-编程学习网

本篇内容介绍了“Python Opencv数据增强的方法”的有关知识，在实际案例的操作过程中，不少人都会遇到这样的困境，接下来就让小编带领大家学习一下如何处理这些情况吧！希望大家仔细阅读，能够学有所成！

常见的数据增强操作有：按比例放大或缩小图片、旋转、平移、水平翻转、改变图像通道等。

1.按比例放大和缩小

扩展缩放只是改变图像的尺寸大小。OpenCV 提供的函数 cv2.resize()可以实现这个功能。图像的尺寸可以自己手动设置，也可以指定缩放因子。可以选择使用不同的插值方法。在缩放时我们推荐使用 cv2.INTER_AREA，在扩展时我们推荐使用 v2.INTER_CUBIC（慢) 和 v2.INTER_LINEAR。默认情况下所有改变图像尺寸大小的操作使用的插值方法都是 cv2.INTER_LINEAR。

# 缩小 -- 宽和高都缩小为原来的scale倍def zoom_down(img,scale):    img = cv2.resize(img,None,fx= scale,fy= scale,interpolation=cv2.INTER_CUBIC)    return img# 放大 -- 宽和高都放大为原来的scale倍def zoom_up(img,scale):    img = cv2.resize(img,None,fx= scale,fy= scale,interpolation=cv2.INTER_CUBIC)    return img

resize库中第二个参数是目标大小，例如如果我想把图片resize成300*300大小的，可以这么写：

img = cv2.resize(img,(300,300))

2.平移图像

平移就是将对象换一个位置。如果你要沿（x，y）方向移动，移动的距离是（tx，ty），你可以以下面的方式构建移动矩阵：

Python Opencv数据增强的方法

可以使用 Numpy 数组构建这个矩阵（数据类型是 np.float32），然后把它传给函数cv2.warpAffine()。

mat_translation = np.float32([[1, 0, 20], [0, 1, 30]])

例如上面是的矩阵是将图像往水平方向上移动20个像素点，竖直方向上移动30个像素点。

实例：

# 平移 -- 水平平移或竖直方向平移def translation(img,tx,ty):    height = img.shape[0]    width = img.shape[1]    mat_translation = np.float32([[1, 0, tx], [0, 1, ty]]) # 变换矩阵：设置平移变换所需的计算矩阵：2行3列    img = cv2.warpAffine(img, mat_translation, (width + tx, height + ty))  # 变换函数    return img

我这里封装的tx和ty分别为水平和竖直方向需要移动的像素点数。

3.旋转图像

OpenCV 提供了一个函数：cv2.getRotationMatrix2D

# 旋转def rotation(img,angle,scale):    rows = img.shape[0]    cols = img.shape[1]    # 这里的第一个参数为旋转中心，第二个为旋转角度，第三个为旋转后的缩放因子    # 可以通过设置旋转中心，缩放因子，以及窗口大小来防止旋转后超出边界的问题    M = cv2.getRotationMatrix2D((cols / 2, rows / 2), angle, scale) # 向左旋转angle度并缩放为原来的scale倍    img = cv2.warpAffine(img, M, (cols, rows)) # 第三个参数是输出图像的尺寸中心    return img

4.镜像变换

Opencv提供了cv2.flip()函数，可以第二个参数为1时为水平翻转，为0时垂直翻转。为了后面调用方便，我还是自己封装了一下。

# 镜像变换def mirror(img,mode):    img = cv2.flip(img, mode)  # mode = 1 水平翻转 mode = 0 垂直翻    return img

5.添加椒盐噪声

椒盐噪声为纯黑或纯白的像素点，随机生成。

# 添加椒盐噪声def spiced_salt_noise(img,prob):    output = np.zeros(img.shape,np.uint8)    thres = 1 - prob    for i in range(img.shape[0]):        for j in range(img.shape[1]):            rdn = random.random()            if rdn < prob:                output[i][j] = 0 # 椒盐噪声由纯黑和纯白的像素点随机组成            elif rdn > thres:                output[i][j] = 255            else:                output[i][j] = img[i][j]    return output

6.添加高斯噪声

与椒盐噪声不同，高斯噪声是彩色的，方差越大时噪声越大。

# 添加高斯噪声def gasuss_noise(image, mean = 0, var = 0.01):    '''        添加高斯噪声        mean : 均值        var : 方差，方差越大越模糊    '''    image = np.array(image/255, dtype=float)    noise = np.random.normal(mean, var ** 0.5, image.shape)    out = image + noise    if out.min() < 0:        low_clip = -1.    else:        low_clip = 0.    out = np.clip(out, low_clip, 1.0)    out = np.uint8(out*255)    return out

7.模糊化

将图片模糊或平滑有多种算法，例如高斯模糊、中值模糊、均值模糊等，我这里使用一个比较普通的cv2.blur()实现。同样也是先封装方便我后面调用。

# 模糊def blur(img,scale):    img = cv2.blur(img,(scale,scale)) # scale越大越模糊    return img

这里的scale其实就是滤波器的尺寸，一般取奇数，scale越大越模糊，

8.重新组合颜色通道

在opencv中，图像的通道顺序为BGR，也就是蓝绿红，可以改变成其他顺序以得到不同的效果。

# 重新组合颜色通道def change_channel(img):    b = cv2.split(img)[0]    g = cv2.split(img)[1]    r = cv2.split(img)[2]    brg = cv2.merge([b, r, g]) # 可以自己改变组合顺序    return brg

实例

我有以下几张测试图片：

Python Opencv数据增强的方法

我希望随机地对这些图片进行一些变换，最终执行结果如下：

Python Opencv数据增强的方法

可以看到程序对我的图片随机进行了各种变换，我这里只是一次变换，读者也可以尝试对图片同时进行多种变换。

本次程序如下：

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2022/2/18 16:30# @Author : 若谷# @File : Data_Augumentation.py# @Software: PyCharmimport numpy as npimport cv2import randomimport osimport sys# 缩小 -- 宽和高都缩小为原来的scale倍def zoom_down(img, scale):    img = cv2.resize(img, None, fx=scale, fy=scale, interpolation=cv2.INTER_CUBIC)    return img# 放大 -- 宽和高都放大为原来的scale倍def zoom_up(img, scale):    img = cv2.resize(img, None, fx=scale, fy=scale, interpolation=cv2.INTER_CUBIC)    return img# 平移 -- 水平平移或竖直方向平移def translation(img, tx, ty):    height = img.shape[0]    width = img.shape[1]    mat_translation = np.float32([[1, 0, tx], [0, 1, ty]])  # 变换矩阵：设置平移变换所需的计算矩阵：2行3列    img = cv2.warpAffine(img, mat_translation, (width + tx, height + ty))  # 变换函数    return img# 旋转def rotation(img, angle, scale):    rows = img.shape[0]    cols = img.shape[1]    # 这里的第一个参数为旋转中心，第二个为旋转角度，第三个为旋转后的缩放因子    # 可以通过设置旋转中心，缩放因子，以及窗口大小来防止旋转后超出边界的问题    M = cv2.getRotationMatrix2D((cols / 2, rows / 2), angle, scale)  # 向左旋转angle度并缩放为原来的scale倍    img = cv2.warpAffine(img, M, (cols, rows))  # 第三个参数是输出图像的尺寸中心    return img# 镜像变换def mirror(img, mode):    img = cv2.flip(img, mode)  # mode = 1 水平翻转 mode = 0 垂直翻    return img# 添加椒盐噪声def spiced_salt_noise(img, prob):    output = np.zeros(img.shape, np.uint8)    thres = 1 - prob    for i in range(img.shape[0]):        for j in range(img.shape[1]):            rdn = random.random()            if rdn < prob:                output[i][j] = 0  # 椒盐噪声由纯黑和纯白的像素点随机组成            elif rdn > thres:                output[i][j] = 255            else:                output[i][j] = img[i][j]    return output# 模糊def blur(img, scale):    img = cv2.blur(img, (scale, scale))  # scale越大越模糊    return img# 添加高斯噪声def gasuss_noise(image, mean=0, var=0.01):    '''        添加高斯噪声        mean : 均值        var : 方差，方差越大越模糊    '''    image = np.array(image / 255, dtype=float)    noise = np.random.normal(mean, var ** 0.5, image.shape)    out = image + noise    if out.min() < 0:        low_clip = -1.    else:        low_clip = 0.    out = np.clip(out, low_clip, 1.0)    out = np.uint8(out * 255)    return out# 重新组合颜色通道def change_channel(img):    b = cv2.split(img)[0]    g = cv2.split(img)[1]    r = cv2.split(img)[2]    brg = cv2.merge([b, r, g])  # 可以自己改变组合顺序    return brg# 随机进行以上操作def Data_Augument():    for i in images_list:        img = cv2.imread(image_dir+i) # 图片路径+图片名字        cv2.imshow('img',img)        functions = [('zoom_down', [img, 0.8]), # 第一个参数为函数名,后面为函数调用时的参数                     ('zoom_up', [img, 1.2]),                     ('translation', [img, 20, 30]),                     ('rotation', [img, 15, 0.9]),                     ('mirror', [img, 1]),                     ('spiced_salt_noise', [img, 0.01]),                     ('blur', [img, 5]),                     ('gasuss_noise', [img, 0, 0.01]),                     ('change_channel', [img])]        choice = random.choice(functions) # 随机选择一个函数执行        this_module = sys.modules[__name__]  # 当前文件        res = getattr(this_module, choice[0])(*choice[1])        cv2.imwrite(output_dir + i, res)if __name__ == '__main__':    image_dir = './test/' # 源图片路径    images_list = os.listdir(image_dir)    nums = len(os.listdir(image_dir))    print('found %d pictures' % nums)    output_dir = './output/' # 图像变换后的保存路径    Data_Augument() # 执行    print('finished!')

“Python Opencv数据增强的方法”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识可以关注编程网网站，小编将为大家输出更多高质量的实用文章！

文章详情

Python Opencv数据增强的方法

1.按比例放大和缩小

2.平移图像

3.旋转图像

4.镜像变换

5.添加椒盐噪声

6.添加高斯噪声

7.模糊化

8.重新组合颜色通道

实例

软考中级精品资料免费领

相关文章

猜你喜欢

Python Opencv数据增强的方法

深入了解Python Opencv数据增强

python目标检测YoloV4当中的Mosaic数据增强方法

图像数据增强算法汇总(Python)

Python深度学习albumentations数据增强库

分析语音数据增强及python实现

navicat增加数据的方法

Scitter库的增强方法是什么

WCF服务增强的方法有哪些

Python增量循环删除MySQL表数据的方法

SpringBoot整合MybatisPlus配置多数据源增强插件的方法是什么

详解Python实现图像分割增强的两种方法

Torch中的数据增强技术有哪些

Oracle Index与数据库安全性的增强

SAP ABAP7.50隐式增强的方法是什么

python目标检测数据增强的代码参数解读及应用

如何用Python增强Excel的3大集成方法及用途

Python基于域相关实现图像增强的方法教程

sql新增数据的方法是什么

如何用Python增强Excel减少处理复杂数据的痛苦