用 Python 实现数据集的分割,将数据集分为训练集和测试集
在机器学习中,数据集的分割是非常重要的,常见的方法是将数据集分为训练集和测试集。本文将介绍如何使用 Python 中的 Sklearn 实现数据集分割。
首先,我们需要导入 Sklearn 库,并加载数据集,这里我们以鸢尾花数据集为例:
from sklearn import datasetsiris = datasets.load_iris()X = iris.datay = iris.target
然后,我们可以使用 Sklearn 中的 train_test_split 函数将数据集分成训练集和测试集。其中,参数 test_size 表示测试集所占比例,random_state 表示随机种子,可以保证每次划分的结果相同。
from sklearn
来源地址:https://blog.csdn.net/update7/article/details/131862512