腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
具有
交叉
验证
的
ngram
文本
模型
、
、
在
ngram
模型
(字符
ngram
或词袋)中,我们需要确保测试数据
的
词汇不用于拟合或训练
模型
。 这就是sklearn TfidfVectorizer函数对两个函数(拟合和变换)所做
的
事情。所以,如果我有一个sklearn Pipeline
模型
: model = Pipeline([ ('svc',SVC()) ]) 并将其传递给<em
浏览 21
提问于2019-03-08
得票数 0
回答已采纳
3
回答
如何评价和解释这一机器学习中
的
训练
模型
?
、
、
、
、
在每一组中,我使用90%
的
数据来建立
ngram
模型
。然后,在同一组
的
其他10%数据上测试此
ngram
模型
。结果精度在10%以下。其他9组采用相同
的
方法(分别建立
模型
,并分别在该组剩余
的
10%数据上进行测试)。所有结果
的
准确度都在10%左右。(这是10倍
交叉
验证
吗?)案例2: 首先建立了一个基于全数据集(数据A)约8000字
的
ngram
模型
浏览 5
提问于2012-05-23
得票数 0
回答已采纳
1
回答
如何改进我对德语
文本
的
多类
文本
分类?
、
、
、
、
我是NLP
的
新手,这让我有点困惑。我试图在我
的
数据集上使用SVC进行
文本
分类。我有一个6个类
的
不平衡数据集。这篇文章是健康、体育、文化、经济、科学和网络课程
的
新闻。我用TF-以色列国防军进行矢量化。预处理步骤:lower-case所有
文本
并删除stop-words。因为我
的
文本
是德语
的
,所以我没有使用lemmatization。我
的
第一次尝试: from sklearn.model_selection import
浏览 1
提问于2020-12-04
得票数 0
回答已采纳
1
回答
获得良好
的
交叉
验证
分数,但Roc_auc分数非常低
、
、
、
我对此非常陌生,所以任何类型
的
信息都会有所帮助。抱歉,如果我问了一个非常琐碎
的
问题。我正在处理一个中等大小
的
数据集,其中有很多零。我们已经应用了很多
模型
,k=10
的
cv-skf得分已经超过了0.85,但roc_auc得分却停留在0.5左右。我正在使用sklearn。下面是代码片段。
浏览 0
提问于2016-03-25
得票数 0
1
回答
区分过拟合与良好预测
、
、
、
、
我有一个很小
的
文本
样本,我试图预测与它们相关
的
值。我已经使用sklearn计算tf-以色列国防军,并将其插入回归
模型
中进行预测。这些信息是通过从cross_validation.LeaveOneOut(X.shape[0], indices=True)获得
的
保留一次
交叉
验证
获得
的
: using ngrams (n=1):使用
ngram
(n=300)代替unigram (n=1),会出现类似的结果,这显然是不正确
的
。
浏览 2
提问于2012-09-03
得票数 33
回答已采纳
1
回答
交叉
验证
试验与训练误差
、
我偶然发现了这样
的
流程图:在流程图下面,如下所示:他们只提到
交叉
验证</em
浏览 0
提问于2019-09-09
得票数 1
1
回答
栅栏
模型
的
验证
?
、
我构建了一个栅栏
模型
,然后使用该
模型
通过预测命令从已知数据点预测到未知数据点。有没有办法
验证
模型
和这些预测?我是否必须分两部分来做这件事,例如使用
模型
的
二项式部分
的
敏感性和特异性?关于如何评估此
模型
的
有效性,还有其他想法吗?
浏览 1
提问于2016-11-14
得票数 0
1
回答
如何在python/sklearn中
交叉
验证
来自随机森林
的
预测?
、
、
请有人告诉我,如果这是正确
的
方法,计算
交叉
验证
的
精度我
的
分类器?我将我
的
数据集划分为训练数据
的
xtrain和ytrain,以及测试集
的
xtest & ytest。构建
模型
:适合于训练集
的
:,这是我不确定
的
部分: scores= cross_val_
浏览 8
提问于2015-07-04
得票数 3
1
回答
什么时候对测试数据也进行
模型
的
训练是个好主意?
、
、
、
我有一个小
的
受限制
的
数据集,它不是很小,但是如果我有更多
的
数据,它
的
准确性会更好。我把它分割成训练和测试数据集: 85%/15%。我选择了神经网络
模型
,并训练了它,测量损失,它是好
的
。我是否应该对测试数据进行额外
的
培训,因为这样我就能获得更好
的
准确性。
浏览 0
提问于2018-03-10
得票数 0
1
回答
如何在TensorFlow中提高CNN
的
预测能力?
、
、
、
我在TensorFlow中使用
具有
两个卷积层
的
CNN,一个完全连接
的
层和一个线性层来预测对象
的
大小。标签是大小,特征是图像。两种方法
的
准确率都有所提高,但
交叉
验证
准确率
的
提高速度较慢。考虑到精度上
的
差异是由于
模型<
浏览 3
提问于2018-09-07
得票数 0
1
回答
如何在matlab中选择
交叉
验证
的
最佳
模型
?
、
、
我有两个数据集,我想通过其中一个训练支持向量机分类
模型
(fitcsvm),然后预测另一个
的
标签。我使用10倍
交叉
验证
(crossval)来训练我
的
模型
,所以我有10个不同
的
模型
。我
的
问题是,这些
模型
中哪一个是最适合预测
的
,我如何才能找到它?这是我
的
代码:CVMdl = crossval(Mdl);
浏览 2
提问于2020-10-23
得票数 0
回答已采纳
1
回答
何时使用
交叉
验证
?
、
、
Cross-validation 嗨,我正在使用Weka在我
的
MSc论文中部署机器学习
模型
。我已经注意到,当我在训练数据集中使用10倍
交叉
验证
时,与在整个数据集上没有
交叉
验证
的
情况下训练
模型
相比,我得到了较低
的
评估指标,如果我在测试数据集上测试该
模型
时获得更好
的
性能,这将是有意义
的
,然而,它保持相同
的
性能例如,我为一个回归问题训练了一个随机森林
模型</em
浏览 0
提问于2021-01-23
得票数 0
1
回答
双数据源LSTM神经网络
、
、
、
我有以下配置:一个lstm网络,接收大小为2
的
n克
文本
。下面是一个简单
的
原理图:经过一些测试后,我注意到在某些类中,当我使用大小为3
的
ngram
时,我
的
准确性有了很大提高。现在,我想训练一个同时
具有
两个
ngram
大小
的
新
的
LSTM神经网络,如下面的原理图:我如何提供数据并建立这个
模型
,使用keras来执行这个任务?
浏览 0
提问于2018-10-27
得票数 0
回答已采纳
2
回答
在损失函数中添加
模型
复杂性惩罚允许您跳过
交叉
验证
吗?
我
的
理解是,选择小型
模型
,即有一个多目标函数,为
模型
的
精确性和简单性进行优化,会自动处理数据过度拟合
的
危险。对于我
的
用例来说,跳过冗长
的
交叉
验证
过程是非常方便
的
。
浏览 0
提问于2021-04-05
得票数 1
3
回答
检验顾问提供
的
模型
的
准确性
、
、
、
我
的
公司最近聘请了一家咨询公司来开发一个预测
模型
来检测有缺陷
的
作品。有人建议,我可以给咨询公司2000-2015年
的
数据,并保留2016年
的
数据,供我们自己核对。然而,一个对2016年数据<
浏览 0
提问于2016-11-30
得票数 3
回答已采纳
2
回答
交叉
验证
在多项式回归中
的
应用
、
、
、
、
我有两个
文本
文件,其中包含我
的
数据。X轴上
的
一个
文本
文件,Y轴上
的
另一个
文本
文件,然后使用python
的
散乱函数进行数据可视化,然后用python
的
polyfit函数得到曲线,它可以拟合我们需要编写
的
多项式
的
多项式度。2或3现在让我们考虑,我得到了4个这样
的
方程,分别是2,3,4,5。现在我
的
问题来了。在我得到
的
所有方程中,我如何选择最适合我
的
数
浏览 0
提问于2016-04-21
得票数 0
2
回答
如何使用RBM提高
文本
分类
的
准确率?
、
、
、
、
我正在学习
文本
分类,我使用自己
的
语料库和线性回归进行分类,如下所示:classifierclassifier.fit(training_matrix, y_train)我想用scikit learn提供
的
受限博尔兹曼机器来增加分类报告有人能帮我增加这是我到目前为止尝试
的
,提前谢谢: vectorizer
浏览 5
提问于2015-02-04
得票数 2
2
回答
我应该为我在
文本
中找到
的
每个特定单词创建一个功能,还是为所有它们创建一个功能?
、
、
、
我现在正在为我
的
分类任务做特性工程。在我
的
dataframe中,我有一个包含
文本
消息
的
列。我决定创建一个二进制功能,它取决于
文本
中是否有"call“、"phone”、"mobile“、"@gmail”、"mail“"facebook”等词。但是现在我想知道是为每个单词(或一组单词)创建单独
的
二进制特性,还是为所有这些单词创建一个二进制特性。如何检查哪个解决方案更好。有什么衡量标准吗?人们在实践中通常会做些什么。谢谢)
浏览 0
提问于2022-01-26
得票数 1
1
回答
交叉
验证
Vs。列车
验证
测试续
、
交叉
验证
Vs.列车
验证
测试训练次数为k次,每次忽略训练集
的
不同部分。通常,这些k
模型
的
误差是平均
的
。这是对要测试
的
每个
模型
参数进行
的
,并且选择误差最小
的
模型
。选择平均误差最小
的
参数,从K
模型
中找出
浏览 0
提问于2019-09-27
得票数 4
3
回答
使用joblib在sklearn中重用cross_val_score拟合
的
模型
、
、
(filename, "pkl") os.remove(filename) returnalg = joblib.load我不能重用拟合
的
模型
来计算<
浏览 2
提问于2016-03-25
得票数 11
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
交叉验证和超参数调整:如何优化你的机器学习模型
5种常用的交叉验证技术,保证评估模型的稳定性
浅论渠道业务的交叉验证
时间序列的蒙特卡罗交叉验证
腾讯提出用于文本匹配的多信道信息交叉模型,真实任务中表现优异
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券