如何进行Python 音频的数据扩充-编程学习网

今天就跟大家聊聊有关如何进行Python 音频的数据扩充，可能很多人都不太了解，为了让大家更加了解，小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

经典的深度学习网络AlexNet使用数据扩充（Data Augmentation）的方式扩大数据集，取得较好的分类效果。在深度学习的图像领域中，通过平移、翻转、加噪等方法进行数据扩充。但是，在音频（Audio）领域中，如何进行数据扩充呢？

音频的数据扩充，主要有以下四种方式：

音频剪裁（Clip）
音频旋转（Roll）
音频调音（Tune）
音频加噪（Noise）

音频解析基于librosa音频库；矩阵操作基于scipy和numpy科学计算库。

以下是Python的实现方式：

音频剪裁

import librosafrom scipy.io import wavfiley, sr = librosa.load("../data/love_illusion.mp3")  # 读取音频print y.shape, srwavfile.write("../data/love_illusion_20s.mp3", sr, y[20 * sr:40 * sr])  # 写入音频

音频旋转

import librosaimport numpy as npfrom scipy.io import wavfiley, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频y = np.roll(y, sr*10)print y.shape, srwavfile.write("../data/raw/xxx_roll.mp3", sr, y)  # 写入音频

音频调音，注：cv库的resize函数含有插值功能。

import cv2import librosafrom scipy.io import wavfiley, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频ly = len(y)y_tune = cv2.resize(y, (1, int(len(y) * 1.2))).squeeze()lc = len(y_tune) - lyy_tune = y_tune[int(lc / 2):int(lc / 2) + ly]print y.shape, srwavfile.write("../data/raw/xxx_tune.mp3", sr, y_tune)  # 写入音频

音频加噪，注：在添加随机噪声时，保留0值，否则刺耳难忍！

import librosafrom scipy.io import wavfileimport numpy as npy, sr = librosa.load("../data/raw/love_illusion_20s.mp3")  # 读取音频wn = np.random.randn(len(y))y = np.where(y != 0.0, y + 0.02 * wn, 0.0)  # 噪声不要添加到0上！print y.shape, srwavfile.write("../data/raw/love_illusion_20s_w.mp3", sr, y)  # 写入音频

看完上述内容，你们对如何进行Python 音频的数据扩充有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注编程网行业资讯频道，感谢大家的支持。

文章详情

如何进行Python 音频的数据扩充

软考中级精品资料免费领

相关文章

猜你喜欢

如何进行Python 音频的数据扩充

python如何对音频进行降噪

使用 NLPAUG 进行文本数据的扩充增强

如何进行laravel框架中的数据填充

python如何截取一段音频数据

如何利用python处理原始音频数据

如何进行Spring MVC数据绑定的扩展

python3使用mutagen进行音频元数据处理的方法

如何使用 JavaScript object URLs进行图像音频和视频的处理

如何进行扩展Python的相关说明

windows中goldwave如何进行批量的音频格式转换

如何用Python进行数据清洗

如何用python进行数据分析

Python中如何进行数据预处理？

如何使用 Python 进行数据科学

如何在麒麟操作系统上进行音频和视频的播放和编辑

Oracle数据库空间满了如何进行空间扩展

如何用一行Python进行数据收集探索

如何在Python中进行数据库操作

如何使用Python进行数据可视化