今天就跟大家聊聊有关Python中如何进行基于BP神经网络的预测,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
一、Introduction
1 BP神经网络的优点
非线性映射能力:BP神经网络实质上实现了一个从输入到输出的映射功能,数学理论证明三层的神经网络就能够以任意精度逼近任何非线性连续函数。这使得其特别适合于求解内部机制复杂的问题,即BP神经网络具有较强的非线性映射能力。
自学习和自适应能力:BP神经网络在训练时,能够通过学习自动提取输入、输出数据间的“合理规则”,并自适应地将学习内容记忆于网络的权值中。即BP神经网络具有高度自学习和自适应的能力。
泛化能力:所谓泛化能力是指在设计模式分类器时,即要考虑网络在保证对所需分类对象进行正确分类,还要关心网络在经过训练后,能否对未见过的模式或有噪声污染的模式,进行正确的分类。也即BP神经网络具有将学习成果应用于新知识的能力。
2 BP神经网络的缺点
局部极小化问题:从数学角度看,传统的 BP神经网络为一种局部搜索的优化方法,它要解决的是一个复杂非线性化问题,网络的权值是通过沿局部改善的方向逐渐进行调整的,这样会使算法陷入局部极值,权值收敛到局部极小点,从而导致网络训练失败。加上BP神经网络对初始网络权重非常敏感,以不同的权重初始化网络,其往往会收敛于不同的局部极小,这也是每次训练得到不同结果的根本原因
BP 神经网络算法的收敛速度慢:由于BP神经网络算法本质上为梯度下降法,它所要优化的目标函数是非常复杂的,因此,必然会出现“锯齿形现象”,这使得BP算法低效;又由于优化的目标函数很复杂,它必然会在神经元输出接近0或1的情况下,出现一些平坦区,在这些区域内,权值误差改变很小,使训练过程几乎停顿;BP神经网络模型中,为了使网络执行BP算法,不能使用传统的一维搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这种方法也会引起算法低效。以上种种,导致了BP神经网络算法收敛速度慢的现象。
BP 神经网络结构选择不一:BP神经网络结构的选择至今尚无一种统一而完整的理论指导,一般只能由经验选定。网络结构选择过大,训练中效率不高,可能出现过拟合现象,造成网络性能低,容错性下降,若选择过小,则又会造成网络可能不收敛。而网络的结构直接影响网络的逼近能力及推广性质。因此,应用中如何选择合适的网络结构是一个重要的问题。
二、实现过程
1 Demo
#%% 基础数组运算库导入import numpy as np # 画图库导入import matplotlib.pyplot as plt # 导入三维显示工具from mpl_toolkits.mplot3d import Axes3D# 导入BP模型from sklearn.neural_network import MLPClassifier# 导入demo数据制作方法from sklearn.datasets import make_classificationfrom sklearn.metrics import classification_report, confusion_matriximport seaborn as snsimport warningsfrom sklearn.exceptions import ConvergenceWarning#%%模型训练# 制作五个类别的数据,每个类别1000个样本train_samples, train_labels = make_classification(n_samples=1000, n_features=3, n_redundant=0,n_classes=5, n_informative=3, n_clusters_per_class=1,class_sep=3, random_state=10)# 将五个类别的数据进行三维显示fig = plt.figure()ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20)ax.scatter(train_samples[:, 0], train_samples[:, 1], train_samples[:, 2], marker='o', c=train_labels)plt.title('Demo Data Map')
#%% 建立 BP 模型, 采用sgd优化器,relu非线性映射函数BP = MLPClassifier(solver='sgd',activation = 'relu',max_iter = 500,alpha = 1e-3, hidden_layer_sizes = (32,32),random_state = 1)# 进行模型训练with warnings.catch_warnings(): warnings.filterwarnings("ignore", category=ConvergenceWarning, module="sklearn") BP.fit(train_samples, train_labels)# 查看 BP 模型的参数print(BP)#%% 进行模型预测predict_labels = BP.predict(train_samples)# 显示预测的散点图fig = plt.figure()ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20)ax.scatter(train_samples[:, 0], train_samples[:, 1], train_samples[:, 2], marker='o', c=predict_labels)plt.title('Demo Data Predict Map with BP Model')# 显示预测分数print("预测准确率: {:.4f}".format(BP.score(train_samples, train_labels)))# 可视化预测数据 print("真实类别:", train_labels[:10])print("预测类别:", predict_labels[:10])# 准确率等报表print(classification_report(train_labels, predict_labels))# 计算混淆矩阵classes = [0, 1, 2, 3]cofusion_mat = confusion_matrix(train_labels, predict_labels, classes) sns.set()figur, ax = plt.subplots()# 画热力图sns.heatmap(cofusion_mat, cmap="YlGnBu_r", annot=True, ax=ax) ax.set_title('confusion matrix') # ax.set_xticklabels([''] + classes, minor=True)ax.set_yticklabels([''] + classes, minor=True)ax.set_xlabel('predict') # x轴ax.set_ylabel('true') # y轴plt.show()
#%%# 进行新的测试数据测试test_sample = np.array([[-1, 0.1, 0.1]])print(f"{test_sample} 类别是: ", BP.predict(test_sample))print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))test_sample = np.array([[-1.2, 10, -91]])print(f"{test_sample} 类别是: ", BP.predict(test_sample))print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))test_sample = np.array([[-12, -0.1, -0.1]])print(f"{test_sample} 类别是: ", BP.predict(test_sample))print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))test_sample = np.array([[100, -90.1, -9.1]])print(f"{test_sample} 类别是: ", BP.predict(test_sample))print(f"{test_sample} 类别概率分别是: ", BP.predict_proba(test_sample))
2 基于BP神经网络的乳腺癌分类预测
#%%基于BP神经网络的乳腺癌分类#基本库导入# 导入乳腺癌数据集from sklearn.datasets import load_breast_cancer# 导入BP模型from sklearn.neural_network import MLPClassifier# 导入训练集分割方法from sklearn.model_selection import train_test_split # 导入预测指标计算函数和混淆矩阵计算函数from sklearn.metrics import classification_report, confusion_matrix# 导入绘图包import seaborn as snsimport matplotlib.pyplot as plt# 导入三维显示工具from mpl_toolkits.mplot3d import Axes3D# 导入乳腺癌数据集cancer = load_breast_cancer()# 查看数据集信息print('breast_cancer数据集的长度为:',len(cancer))print('breast_cancer数据集的类型为:',type(cancer))# 分割数据为训练集和测试集cancer_data = cancer['data']print('cancer_data数据维度为:',cancer_data.shape)cancer_target = cancer['target']print('cancer_target标签维度为:',cancer_target.shape)cancer_names = cancer['feature_names']cancer_desc = cancer['DESCR']#分为训练集与测试集cancer_data_train,cancer_data_test = train_test_split(cancer_data,test_size=0.2,random_state=42)#训练集cancer_target_train,cancer_target_test = train_test_split(cancer_target,test_size=0.2,random_state=42)#测试集
#%%# 建立 BP 模型, 采用Adam优化器,relu非线性映射函数BP = MLPClassifier(solver='adam',activation = 'relu',max_iter = 1000,alpha = 1e-3,hidden_layer_sizes = (64,32, 32),random_state = 1)# 进行模型训练BP.fit(cancer_data_train, cancer_target_train)#%% 进行模型预测predict_train_labels = BP.predict(cancer_data_train)# 可视化真实数据fig = plt.figure()ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20) ax.scatter(cancer_data_train[:, 0], cancer_data_train[:, 1], cancer_data_train[:, 2], marker='o', c=cancer_target_train)plt.title('True Label Map')plt.show()# 可视化预测数据fig = plt.figure()ax = Axes3D(fig, rect=[0, 0, 1, 1], elev=20, azim=20) ax.scatter(cancer_data_train[:, 0], cancer_data_train[:, 1], cancer_data_train[:, 2], marker='o', c=predict_train_labels)plt.title('Cancer with BP Model')plt.show()
#%% 显示预测分数print("预测准确率: {:.4f}".format(BP.score(cancer_data_test, cancer_target_test)))# 进行测试集数据的类别预测predict_test_labels = BP.predict(cancer_data_test)print("测试集的真实标签:\n", cancer_target_test)print("测试集的预测标签:\n", predict_test_labels)#%% 进行预测结果指标统计 统计每一类别的预测准确率、召回率、F1分数print(classification_report(cancer_target_test, predict_test_labels))
#%% 计算混淆矩阵confusion_mat = confusion_matrix(cancer_target_test, predict_test_labels)# 打印混淆矩阵print(confusion_mat)# 将混淆矩阵以热力图的方式显示sns.set()figure, ax = plt.subplots()# 画热力图sns.heatmap(confusion_mat, cmap="YlGnBu_r", annot=True, ax=ax) # ax.set_title('confusion matrix')# x轴为预测类别ax.set_xlabel('predict') # y轴实际类别ax.set_ylabel('true') plt.show()
注:之前还做过基于BP神经网络的人口普查数据预测,有需要的猿友私信
三、Keys
BP神经网络的要点在于前向传播和误差反向传播,来对参数进行更新,使得损失最小化。
它是一个迭代算法,基本思想是:
先计算每一层的状态和激活值,直到最后一层(即信号是前向传播的);
计算每一层的误差,误差的计算过程是从最后一层向前推进的(反向传播);
更新参数(目标是误差变小)。迭代前面两个步骤,直到满足停止准则(比如相邻两次迭代的误差的差别很小)。
Python的优点有哪些
1、简单易用,与C/C++、Java、C# 等传统语言相比,Python对代码格式的要求没有那么严格;2、Python属于开源的,所有人都可以看到源代码,并且可以被移植在许多平台上使用;3、Python面向对象,能够支持面向过程编程,也支持面向对象编程;4、Python是一种解释性语言,Python写的程序不需要编译成二进制代码,可以直接从源代码运行程序;5、Python功能强大,拥有的模块众多,基本能够实现所有的常见功能。
看完上述内容,你们对Python中如何进行基于BP神经网络的预测有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注编程网行业资讯频道,感谢大家的支持。