我对随机森林回归有一个深刻的理解。目标是一个大学项目:我们要用R中的财务数据做随机森林回归分析,我已经读了很多小时的随机森林例子,它们大多是分类类型,比如预测股票价值是上升还是下降。万一退步,我就站在线上。我的想法如下:
如果我有如下结构的数据集:
Date | Open | High | Low | Close | Volume
...I可以添加一些技术仪器,如RSI、SMA等。
然后将数据集分解为训练和测试数据,执行随机森林过程,并对测试数据进行预测。但这真的是随机森林回归分析的目的吗?我猜一个“正确的”回归分析是比较两只股票,看看它们是否相关,根据另一只股票预测一只股票的价值--但在没有
我只是在测试kaggle 的这个模型,这个模型应该比给定的最后一组股票提前1天预测。在调整了几个参数之后,我得到了令人惊讶的好结果,正如您所看到的。
均方误差为5.193,所以总的来说,它看起来很好地预测未来的股票,对吗?好吧,当我仔细观察结果时,结果是很可怕的。
正如你所看到的,这个模型预测的是给定股票的最后价值,这是我们目前的最后一只股票。
所以我把预测调整到后退一步。
因此,现在你可以清楚地看到,模型是预测一个倒退或最后一个股票价格,而不是未来的股票预测。
这是我的训练数据
# So for each element of training set, we have 30 prev
我试图用ARIMA对R中的股票价格进行预测。我使用auto.arima函数来拟合我的模型。每次我尝试这样做时,我都会得到预测值的相同值。我试着使用不同的股票,但同样的事情发生在每一种情况下。在这里,我试着预测苹果价格:
芳香糖<- ts(小苹果,start = timedata1)
Auto.arima(芳香苹果)
适配火车
预测苹果<-预测(适配程序,h=57)
预测苹果
我得到的输出如下:
Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
17763 180.94 176.7350 185.1
作为一项学习练习,我计划实现一种机器学习算法(可能是神经网络),根据股票买卖和交易时间来预测用户赚到的股票。下面的数据集是我编写的测试数据。
缩略词:
tab=millisecond time apple bought
asb=apple shares bought
tas=millisecond apple sold
ass=apple shares sold
tgb=millisecond time google bought
gsb=google shares bought
tgs=millisecond google sold
gss=google shares sold
培训数据:
我有一系列关于金融数据的算法。为了这个问题,我有1226行数据的股票的金融市场数据。
I run the follow code to fit and predict the model:
strat.fit <- glm(DirNDay ~l_UUP.Close + l_FXE.Close + MA50 + +MA10 + RSI06 + BIAS10 + BBands05, data=STCK.df,family="binomial")
strat.probs <- predict(strat.fit, STCK.df,type="response&