我有一个大约20k的数据集,在这个20k中我有13k唯一的因变量。我的数据如下:
Pattern Y
0 dd AN dd AN dd AN Y1
1 dd AN dd AN dd AN Y1
2 a omnes Y2
3 agence reuters ralr agence retr sarl Y3
类似的20k+观察。所以在生产中,我必须预测Y在生产过程中,一旦这个模式数据来了。
我的问题是,对于每个唯一的因变量,我没有太多的观测值(就像在某些或大部分时间是1)的1-5观测一样。
My approach
我正在使用tf
我有一个scikit学习分类器clf,它已经安装了一些数据,并且有足够的观察结果,最初的.fit(X, y)需要一段时间(>30)。
我每秒钟都会得到新的数据点,我想用它来更新模型。是否有可能在这些新的数据点上重新训练模型?还是必须将新的数据点添加到旧数据集中,然后用所有数据从头开始对模型进行重新培训?
我想避免再次对模型进行再培训,因为我获得新数据的速度比模型重新培训的速度要快,这是有问题的(如果有问题,我可以进一步扩展,但我认为细节与问题无关)。
示例
使用旧数据对模型进行培训:
clf = MLPClassifier()
# X and y have enough observat
我试图拟合一个非线性模型,但在网上找不到任何好的例子。
这个函数有名字吗?
它能线性化吗?
我试图估计参数a、b和c的随机效应g (如在组中)作为时间t的函数,如下所示。我可以在没有随机效应的情况下使用nls对模型进行拟合,但是很难使模型收敛。欢迎建议(最好在R内,但任何合适的套餐都可以)?
## time, repeated 16 times for 4 replicates from each of 4 groups
t <- rep(1:20, 16)
## g, group
g <- rep(1:4, each = 80)
## starting to create
我知道在Android的A-frame中启动Chrome视频需要一个用户发起的事件,但我不知道如何让Chrome接受通过融合光标触发的点击事件侦听器作为用户事件。
以下代码位于附加到多维数据集的组件的init中。
this.el.addEventListener('click',function(evt){
console.log("clicked");
var els = document.querySelector('#video');
els.components.material.material.map.image.play
在训练了sarimax模型之后,我希望将来能够用新的观测来预编预报,而不必再训练它。然而,我注意到我在新应用的预测中使用的观测数改变了预测。
根据我的理解,只要给出足够的观测量,允许正确地计算自回归和移动平均,该模型甚至不会使用先前的历史观测来通知自己,因为系数没有经过再训练。在一个(3,0,1)的例子中,我认为它至少需要3个观测才能应用其经过训练的系数。然而,情况似乎并非如此,我怀疑我是否正确地理解了这一模式。
作为一个示例和测试,我对相同的数据应用了一个经过训练的sarimax,去掉了最初的几个观察结果,用以下代码测试行数对预测的影响:
import pandas as pd
from s