文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

机器学习——线性回归-KNN-决策树(实

2023-01-30 22:29

关注
1 import numpy as np
2 import pandas as pd
3 from sklearn.linear_model import LinearRegression
4 from sklearn.preprocessing import StandardScaler
5 from sklearn.neighbors import KNeighborsClassifier
6 from sklearn.feature_extraction import DictVectorizer
7 from sklearn.tree import DecisionTreeClassifier
 1 def price_predict():
 2     # 数据有三个特征:距离地铁距离、附近小学数量、小区绿化率
 3     X = np.array([[500.0, 3.0, 0.3], [1000.0, 1.0, 0.6], [750.0, 2.0, 0.3], [600.0, 5.0, 0.2], [1200.0, 1.0, 0.6]])
 4     # 具有三个特征的房屋对应的房价
 5     Y = np.array([10000, 9000, 8000, 12000, 8500])
 6 
 7     # 标准化,按列转化,转化到数据均值为0方差为1的标准分布内
 8     std_x = StandardScaler()
 9     x_train = std_x.fit_transform(X)
10     std_y = StandardScaler()
11     y_train = std_y.fit_transform(Y.reshape(-1, 1))
12 
13     # 构建线性预测模型
14     lr = LinearRegression()
15     # 模型在历史数据上进行训练,Y.reshape(-1,1)将Y变为二维数组,fit函数要求二维数组
16     lr.fit(x_train, y_train)
17 
18     # 使用训练模型预测新房屋价格
19     x_predict = std_x.transform(np.array([[1300, 3.0, 0.4]]))
20     print(std_y.inverse_transform(lr.predict(x_predict)))
 1 # K近邻分类(K表示以最近的几个邻居作为分类的指标)
 2 # KNN表示了物以类聚人以群分的基本思考方法,最近的K个邻居是什么类别,预测样本就会被划为该类别
 3 def knn_predict_rev():
 4     # 数据理解为二维坐标上的6歌点
 5     X = np.array([[1.0, 1.0], [1, 1.5], [0.5, 1.5], [3.0, 3.0], [3.0, 3.5], [2.8, 3.1]])
 6     # 6个点的类别,按顺序和X依次对应
 7     Y = np.array([0, 0, 0, 1, 1, 1])
 8 
 9     # n_neighbors就是KNN中的K
10     knn = KNeighborsClassifier(n_neighbors=3)
11     knn.fit(X, Y)
12     print(knn.predict(np.array([[2.0, 3.0]])))
 1 def decide_play():
 2     '''
 3     ID3
 4     :return:
 5     '''
 6     df = pd.read_csv('dtree.csv')
 7     # 将数据转换为字典格式,orient='record'参数指定数据格式为{column:value}的形式
 8     # 一个字典对应一行数据
 9     dict_train = df.loc[:, ['Outlook', 'Temperatur', 'Humidity', 'Windy']].to_dict(orient='record')
10     # 如果pandas从DataFrame取出一列数据,该数据类型会变成Series
11     dict_target = pd.DataFrame(df['PlayGolf'], columns=['PlayGolf']).to_dict(orient='record')
12 
13     # 训练数据字典向量化
14     dv_train = DictVectorizer()
15     x_train = dv_train.fit_transform(dict_train)
16     # 目标数据字典向量化
17     dv_target = DictVectorizer()
18     y_target = dv_target.fit_transform(dict_target)
19 
20     # 创建决策树
21     d_tree = DecisionTreeClassifier()
22     # 训练数据
23     d_tree.fit(x_train, y_target)
24     data_predict = {
25         'Humidity': 85,
26         'Outlook': 'sunny',
27         'Temperatur': 85,
28         'Windy': False
29     }
30     # 标准化要预测的数据
31     x_data = dv_train.transform(data_predict)
32     # 预测数据并转换为原格式
33     print(dv_target.inverse_transform(d_tree.predict(x_data)))

 

阅读原文内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯