文章详情

短信预约-IT技能 免费直播动态提醒

请输入下面的图形验证码

提交验证

短信预约提醒成功

AI股神:如何用机器学习预测股价?

2024-12-11 19:13

关注

首先要强调,文中只是简单展示了怎样上手H2o.ai机器学习框架,并不作为投资理财的建议。不要简单根据本文就做出任何投资理财的决策。

[[333548]]

本文将向你展示如何使用R语言和H2o.ai机器学习框架预测股价。该框架也可以在Python中使用,但因为笔者更熟悉R语言,所以本文就用R语言来演示。以下是详细的步骤:

  1. 搜集数据
  2. 导入数据
  3. 整理并操作数据
  4. 分割测试并观察训练
  5. 选择模型
  6. 训练模型
  7. 用模型测试数据
  8. 评估结果
  9. 如有必要便改进模型
  10. 重复步骤5到10,直到对结果满意为止

本文研究的问题是:股票在接下来一小时的收盘价是多少?

数据整理

导入想要通过MetaTrader软件进行预测的资产数据之后,需要更改一些变量。首先,定义变量名称:

  1. #seting the name of variables 
  2. col_names <- c("Date", "Open", "High","Low", "Close", "Tick", "Volume") 
  3. colnames(data) <- col_names 
  4. head(data) 

数据格式如下:


我们仅用到开盘价、最高价、最低价、收盘价和交易量等一些能获得的数据,那么就需要清除其他数据:

  1. data$Date <- NULL 
  2. data$Tick <- NULL 

因为我们想知道下一个观测期的收盘价,所以需要将下面的值移到上一行,需要用新数据在原始数据集中创建函数并设置变量:

  1. #shifting n rows up of a given variable 
  2. shift <- function(x, n) {  
  3.  c(x[-(seq(n))], rep(NA, n)) 
  4. data$shifted <- shift(data$Close, 1) 
  5. tail(data) 

注意,我们已在上一行中给变量收盘价赋了值。所以,在最后一行中会出现NA,我们用na.omit ()函数跳过这一行:

  1. #remove NA observations 
  2. data <- na.omit(data) 
  3. write.csv(data, "data.csv") 

OK,数据已准备就绪,可以开始建模了。

分割数据

[[333549]]

用H2O.ai进行数据分割。H2O.ai为我们分析和训练人工智能模型提供了一套完整的解决方案,非常好用,即便是没有任何数据科学背景的人也能使用它来解决复杂的问题。先下载H2O.ai:

  1. #Installing the package 
  2. install.packages("h2o") 
  3.  
  4. #loading the library 
  5. library(h2o) 

安装加载好后,启动用于建模的虚拟机。启动虚拟机时,必须设置所需的核数和内存参数:

  1. #Initializing the Virtual Machine using all the threads (-1) and 16gb ofmemory 
  2. h2o.init(nthreads = -1, max_mem_size = "16g"

导入数据:

  1. h2o.importFile("data.csv") 
  2. h2o.describe(data) 

接着定义想要在数据集中预测的变量,以及那些用于训练模型的变量:

  1. <- "shifted" #variable we want to forecast 
  2. <- setdiff(names(data), y) 

随后,分割数据,分别用于训练和测试,其中80%用于训练数据。

  1. parts <- h2o.splitFrame(data, .80) 
  2. train <- parts[[1]] 
  3. test <- parts[[2]] 

完成这些步骤,就是时候见证H2O.ai创造奇迹的时候了。

选择模型

每一位数据科学家在创建自己的机器学习项目时,必须完成的一项任务便是识别出最佳的一个或一组模型来进行预测。这需要大量的知识,尤其是深厚的数学基础,来决定针对特定任务的最佳方案。

我们可以借助H2O.ai来选择最佳模型,这样就可以腾出时间解决其他问题,这便是自动建模。虽然这可能不是解决问题最有效的方法,却是一个不错的尝试。

训练模型

创建模型,需要调用automl函数并传递必要的参数:

  1. automodel <- h2o.automl(x, y, train, test, max_runtime_secs = 120

几分钟后,我们就能获取一个按性能顺序排列的模型列表:


运用模型

现在,可以用模型来测试数据啦!你还可以用模型对尚未观察到的数据进行性能评估,以模型和测试数据作为参数调用预测函数:

  1. predictions <- h2o.predict(automodel@leader, test) 

好啦,静待一小时,看看你的预测能否成真吧。

免责声明:本文不是投资建议,预测股票价格并不是一项简单的任务,本文只是简单说明了用H2O.ai解决机器学习问题是多么容易。预测股价走势非常容易,但这并不意味着预测都是正确或准确无误的。

 

来源:今日头条内容投诉

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

软考中级精品资料免费领

  • 历年真题答案解析
  • 备考技巧名师总结
  • 高频考点精准押题
  • 2024年上半年信息系统项目管理师第二批次真题及答案解析(完整版)

    难度     813人已做
    查看
  • 【考后总结】2024年5月26日信息系统项目管理师第2批次考情分析

    难度     354人已做
    查看
  • 【考后总结】2024年5月25日信息系统项目管理师第1批次考情分析

    难度     318人已做
    查看
  • 2024年上半年软考高项第一、二批次真题考点汇总(完整版)

    难度     435人已做
    查看
  • 2024年上半年系统架构设计师考试综合知识真题

    难度     224人已做
    查看

相关文章

发现更多好内容

猜你喜欢

AI推送时光机
位置:首页-资讯-后端开发
咦!没有更多了?去看看其它编程学习网 内容吧
首页课程
资料下载
问答资讯