腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3963)
视频
沙龙
1
回答
当
有
多个
文本
特征
需要
输
入时
,
如何
处理
支持
向量
机
和文本
数据
?
、
我在NLP项目中工作,我
有
多个
功能提供给
支持
向量
机
模型。所有要输入的要素都是
文本
形式的。如果只有一个要输入的
特征
,我们可以为训练模型提供X
特征
和相应的Y标签,但是我
如何
为模型提供
多个
特征
作为X输入?因为它们是
文本
数据
,所以我必须在应用algorithm.It之前应用TfidfVectorizer,看起来TfidfVectorizer并不
支持
X=<
浏览 25
提问于2021-07-18
得票数 0
2
回答
导入自己的
数据
以进行文档分类
、
、
我
有
文件夹,每个文件夹都有
多个
文本
文件。文件夹在
文本
文件的类上命名。
如何
导入这些文件夹
和文
件,以便在nltk/ scikit中进行文档分类。我计划使用Bi法向分离进行
特征
选择和
支持
向量
机
进行分类。
浏览 5
提问于2015-01-12
得票数 0
回答已采纳
1
回答
基于SVM的垃圾邮件检测综述
、
、
、
、
我
有
来自不同电子商务网站的评论
数据
集。
如何
将
文本
数据
集转换为
支持
向量
机
功能?是否
需要
考虑其他
特征
,如果
需要
,
如何
将它们转换为
支持
向量
机
特征
向量
? 是否
有
任何示例代码或教程可用于完成此任务?我
需要</
浏览 8
提问于2015-01-02
得票数 0
1
回答
对于二进制分类,哪种是最好的随机森林还是神经网络?
、
、
、
、
我必须执行二进制分类,从一开始我就开始考虑使用随机森林分类器。但现在我在想,如果使用神经网络不会更好。 所以我的问题是,你会选择哪一种模式?如果不是神经网络,最适合神经网络的任务是什么?为什么?
浏览 0
提问于2019-05-22
得票数 1
1
回答
MATLAB的svmtrain :保存
支持
向量
索引,而不是
支持
向量
本身
、
、
、
我正在研究一个机器学习问题,这
需要
我使用
多个
支持
向量
机
。它工作得相对较好;然而,问题是每个SVM的
支持
向量
机
的数量往往很大(~2,000),并且输入
特征
的数量约为50,000个数量级。我
需要
大约100个
支持
向量
机
。 在我的笔记
本
电脑上运行它会很快耗尽所有可用的内存;我认为这是因为svmtrain创建了一个
支持
向量</em
浏览 3
提问于2013-11-18
得票数 0
3
回答
支持
向量
机
中不同大小
特征
向量
的编码
、
、
、
我致力于对一些评论(段落)进行分类,由
多个
句子组成。我通过libSVM在Weka中对它们进行分类。然而,我
有
另一个想法,我不知道
如何
实现: 我认为在评论中创建每个句子基于句法和浅语义的特性是值得一试的。但是,由于段落的句子大小不同,我无法找到对这些特性进行顺序编码的任何方法。我之所以想把这些
特征
按顺序排列,是因为句子
特征
的顺序可能为分类提供了更好的线索。例如,如果我
有
两个实例P1 (
有
3个句子)和P2 (2个句子),我就有一个类似的空格(假设每个句子都有一个二进制特性作
浏览 2
提问于2014-05-31
得票数 2
回答已采纳
1
回答
如何
在MATLAB中训练用于分类的大
数据
集
、
、
我
有
一个大约111Mb的大型
特征
数据
集,用于分类,
有
217000个
数据
点,每个点
有
1760000个
特征
点。在MATLAB中使用
支持
向量
机
进行训练时,
需要
花费大量的时间。
如何
在MATLAB中
处理
这些
数据
。
浏览 1
提问于2017-07-29
得票数 1
2
回答
为什么
支持
向量
机能很好地
处理
高维
数据
?
我很难理解为什么
支持
向量
机能很好地
处理
高维
数据
,
当
p >> n时。 我读了如下:
支持
向量
机
是自动正规化的。您不必选择正则化参数,因为选择最宽的分离范围是一种自动正则化的方法。然而,我不明白为什么这意味着
支持
向量
机
在这类
数据
上很好地工作。我还读到过,最大化裕度的优化问题不取决于维度,所以在什么方面取决于?
浏览 0
提问于2021-10-28
得票数 3
2
回答
SVM
如何
对图像进行分类?
、
我读过关于SVM的文献,了解到对于复杂的划分,SVM从理论上将
数据
绘制成高维平面,使得在新维中
数据
是线性可分的,并且为了实现这一点,它使用了核函数代替实际将
数据
转换成一个更高的平面,从而给出了边界和
数据
点之间的边界距离但是,在图像分类器的情况下,这是
如何
工作的呢?比方说,我们
需要
把图片归类为狗或猫。在这个场景中,CNN模型将学习诸如耳朵大小、面部形状、鼻子形状和训练集的其他视觉
特征
,以便在狗和猫之间进行分类。在这种情况下,它是
如何
工作的?
浏览 0
提问于2020-07-12
得票数 1
回答已采纳
7
回答
帮助我理解二进制
支持
向量
机
中的线性可分性
、
、
、
、
我的问题是关于
支持
向量
机
中超平面的线性可分性。
支持
向量
机
( ...formally )是在高维或无限维空间中构造超平面或超平面集的
支持
向量
机
,可用于分类、回归或其他任务。然而,我使用一个流行的
支持
向量
机库(libSVM)来实现
支持
向量
机
,当我
处理
这些数字时,我不明白
当
n维空间V中的超平面是维数n−1的
浏览 7
提问于2010-10-22
得票数 5
回答已采纳
1
回答
组合多参数生成
支持
向量
机
、
、
新的科学知识-学习和我正在工作的一些
数据
,如以下。: False }对于单行
文本
这些输出可以串联在一起,我希望
有
以下警告:我不想对特定、有限和定义良好的参数具有同等重要性的任意
文本
。 这个
数据
结构是否
浏览 2
提问于2013-04-01
得票数 0
回答已采纳
1
回答
支持
向量
机
后的遗传算法
、
、
、
、
现在我想实现用于
特征
选择的遗传算法。但是在
支持
向量
机
的情况下,什么才是合适的呢?我想听听你的反馈。 提前谢谢。
浏览 2
提问于2012-01-31
得票数 2
2
回答
SVM分类器中
特征
长度与预测的关系
、
、
、
特征
向量
的长度
如何
取决于分类?(如果
特征
长度增加(我当前的
特征
长度为125),会发生什么?
如何
确定
特征
向量
归一化的最佳方法?
浏览 5
提问于2015-01-06
得票数 1
回答已采纳
2
回答
如何
提高小
文本
的分类性能
、
、
、
我得到的
数据
大多是tweet或小评论(300-400个字符)。我使用了词袋模型并使用了NaiveBayes分类。现在我
有
很多错误分类的案例,都是下面提到的类型:这只是一个这样的例子,我面临着大量的错误分类,并且不知道
如何
提高准确性。
浏览 5
提问于2015-12-29
得票数 2
2
回答
如何
将包含非数字
特征
的
数据
记录表示为
向量
(数学,而不是c++
向量
)?
、
许多
数据
挖掘算法/策略使用
数据
记录的
向量
表示,以便模拟
数据
的空间表示(如
支持
向量
机
)。 我的麻烦来自于
如何
在
数据
集中表示非数字
特征
。我的第一个想法是用一个从1到n(其中n是
特征
的数量)的数字为一个
特征
的每个可能的值‘别名’。在做一些研究时,我遇到了一个建议,
当
处理
具有少量可能值的
特征
时,您应该使用长度为n的位串,其中每
浏览 0
提问于2011-04-09
得票数 2
回答已采纳
4
回答
猪描述符是在peopledetect.cpp中构造的吗?
、
、
2010,我正在运行软件包中的示例peopledetect.cpp,它的编译和运行,但我想了解detail.In peopledetect.cpp中的源代码是为人们构建/已经训练的hog描述符检测3780
向量
是否被送入当我尝试调试peopledetect.cpp时,我只能发现HOGDescriptor创建了hog描述符和检测器,我基本上不理解这个是做什么的,因为我看到没有经过hog
处理
的步骤,它将已经训练好的
向量
加载到
浏览 2
提问于2013-04-16
得票数 1
回答已采纳
1
回答
支持
向量
机
机器学习算法中字符串
数据
的转换
、
、
我
有
一个
数据
集<table><tr><td>100% free cashback </td><td>spam</td></<tr><td>click on this link to get free sms plan</td>&
浏览 2
提问于2020-05-31
得票数 0
回答已采纳
5
回答
支持
向量
的数量与训练
数据
和分类器性能之间的关系是什么?
、
、
、
也就是说:如果我的训练集是1000,那么大约800个被选为
支持
向量
。我到处寻找,想知道这是好事还是坏事。我的意思是,
支持
向量
的数量与分类器性能之间是否存在关系?我已经阅读了这个,但我正在执行参数选择,而且我还确定
特征
向量
中的属性都是有序的。我只
需要
知道它们之间的关系。谢谢。附注:我使用线性内核。
浏览 2
提问于2012-02-28
得票数 78
回答已采纳
1
回答
用预先制作的字典表示
支持
向量
机
进行
文本
分类
、
、
、
我想把一个
文本
集合分成两类,比如说我想做一个情感分类。我
有
两
本
预先编好的感情字典,一
本
只有正面的,另一
本
只有负面的。我想把这些字典合并到
支持
向量
机
分类器的
特征
向量
中。我的问题是,是否可以将正负词词典区分为SVM
特征
向量
,特别是当我为测试集生成
特征
向量
时?Pos
浏览 3
提问于2016-04-24
得票数 1
回答已采纳
5
回答
在哪里最好使用带有线性内核的svm?
、
、
、
我目前正在研究svm,并且想知道svm与线性内核的应用是什么。在我看来,它一定是应用于解决一个线性优化问题。这是正确的吗?
浏览 9
提问于2013-12-13
得票数 20
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于 Spark 的文本情感分析,以《疯狂动物城》为例
在类似ChatGPT的模型中,嵌入(embeddings)扮演着什么角色?(第二部分)
基于 Milvus 的跨模态行人检索
使用Python和keras进行文本分类(下)
Keras文本分类实战(下)
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券