当有多个文本特征需要输入时，如何处理支持向量机和文本数据？

、

我在NLP项目中工作，我有多个功能提供给支持向量机模型。所有要输入的要素都是文本形式的。如果只有一个要输入的特征，我们可以为训练模型提供X特征和相应的Y标签，但是我如何为模型提供多个特征作为X输入？因为它们是文本数据，所以我必须在应用algorithm.It之前应用TfidfVectorizer，看起来TfidfVectorizer并不支持X=<

浏览 25提问于2021-07-18得票数 0

2回答

导入自己的数据以进行文档分类

、、

我有文件夹，每个文件夹都有多个文本文件。文件夹在文本文件的类上命名。如何导入这些文件夹和文件，以便在nltk/ scikit中进行文档分类。我计划使用Bi法向分离进行特征选择和支持向量机进行分类。

浏览 5提问于2015-01-12得票数 0

回答已采纳

1回答

基于SVM的垃圾邮件检测综述

、、、、

我有来自不同电子商务网站的评论数据集。如何将文本数据集转换为支持向量机功能？是否需要考虑其他特征，如果需要，如何将它们转换为支持向量机特征向量？是否有任何示例代码或教程可用于完成此任务？我需要</

浏览 8提问于2015-01-02得票数 0

1回答

对于二进制分类，哪种是最好的随机森林还是神经网络？

、、、、

我必须执行二进制分类，从一开始我就开始考虑使用随机森林分类器。但现在我在想，如果使用神经网络不会更好。所以我的问题是，你会选择哪一种模式？如果不是神经网络，最适合神经网络的任务是什么?为什么？

浏览 0提问于2019-05-22得票数 1

1回答

MATLAB的svmtrain :保存支持向量索引，而不是支持向量本身

、、、

我正在研究一个机器学习问题，这需要我使用多个支持向量机。它工作得相对较好；然而，问题是每个SVM的支持向量机的数量往往很大(~2,000)，并且输入特征的数量约为50,000个数量级。我需要大约100个支持向量机。在我的笔记本电脑上运行它会很快耗尽所有可用的内存；我认为这是因为svmtrain创建了一个支持向量</em

浏览 3提问于2013-11-18得票数 0

3回答

我致力于对一些评论(段落)进行分类，由多个句子组成。我通过libSVM在Weka中对它们进行分类。然而，我有另一个想法，我不知道如何实现：我认为在评论中创建每个句子基于句法和浅语义的特性是值得一试的。但是，由于段落的句子大小不同，我无法找到对这些特性进行顺序编码的任何方法。我之所以想把这些特征按顺序排列，是因为句子特征的顺序可能为分类提供了更好的线索。例如，如果我有两个实例P1 (有3个句子)和P2 (2个句子)，我就有一个类似的空格(假设每个句子都有一个二进制特性作

浏览 2提问于2014-05-31得票数 2

回答已采纳

1回答

如何在MATLAB中训练用于分类的大数据集

、、

我有一个大约111Mb的大型特征数据集，用于分类，有217000个数据点，每个点有1760000个特征点。在MATLAB中使用支持向量机进行训练时，需要花费大量的时间。如何在MATLAB中处理这些数据。

浏览 1提问于2017-07-29得票数 1

2回答

为什么支持向量机能很好地处理高维数据？

我很难理解为什么支持向量机能很好地处理高维数据，当p >> n时。我读了如下:支持向量机是自动正规化的。您不必选择正则化参数，因为选择最宽的分离范围是一种自动正则化的方法。然而，我不明白为什么这意味着支持向量机在这类数据上很好地工作。我还读到过，最大化裕度的优化问题不取决于维度，所以在什么方面取决于？

浏览 0提问于2021-10-28得票数 3

2回答

SVM如何对图像进行分类？

、

我读过关于SVM的文献，了解到对于复杂的划分，SVM从理论上将数据绘制成高维平面，使得在新维中数据是线性可分的，并且为了实现这一点，它使用了核函数代替实际将数据转换成一个更高的平面，从而给出了边界和数据点之间的边界距离但是，在图像分类器的情况下，这是如何工作的呢？比方说，我们需要把图片归类为狗或猫。在这个场景中，CNN模型将学习诸如耳朵大小、面部形状、鼻子形状和训练集的其他视觉特征，以便在狗和猫之间进行分类。在这种情况下，它是如何工作的？

浏览 0提问于2020-07-12得票数 1

回答已采纳

7回答

帮助我理解二进制支持向量机中的线性可分性

、、、、

我的问题是关于支持向量机中超平面的线性可分性。支持向量机( ...formally )是在高维或无限维空间中构造超平面或超平面集的支持向量机，可用于分类、回归或其他任务。然而，我使用一个流行的支持向量机库(libSVM)来实现支持向量机，当我处理这些数字时，我不明白当n维空间V中的超平面是维数n−1的

浏览 7提问于2010-10-22得票数 5

回答已采纳

1回答

组合多参数生成支持向量机

、、

新的科学知识-学习和我正在工作的一些数据，如以下。: False }对于单行文本这些输出可以串联在一起，我希望有以下警告:我不想对特定、有限和定义良好的参数具有同等重要性的任意文本。这个数据结构是否

浏览 2提问于2013-04-01得票数 0

回答已采纳

1回答

支持向量机后的遗传算法

、、、、

现在我想实现用于特征选择的遗传算法。但是在支持向量机的情况下，什么才是合适的呢？我想听听你的反馈。提前谢谢。

浏览 2提问于2012-01-31得票数 2

2回答

SVM分类器中特征长度与预测的关系

、、、

特征向量的长度如何取决于分类？(如果特征长度增加(我当前的特征长度为125)，会发生什么？如何确定特征向量归一化的最佳方法？

浏览 5提问于2015-01-06得票数 1

回答已采纳

2回答

如何提高小文本的分类性能

、、、

我得到的数据大多是tweet或小评论(300-400个字符)。我使用了词袋模型并使用了NaiveBayes分类。现在我有很多错误分类的案例，都是下面提到的类型：这只是一个这样的例子，我面临着大量的错误分类，并且不知道如何提高准确性。

浏览 5提问于2015-12-29得票数 2

2回答

如何将包含非数字特征的数据记录表示为向量(数学，而不是c++向量)？

、

许多数据挖掘算法/策略使用数据记录的向量表示，以便模拟数据的空间表示(如支持向量机)。我的麻烦来自于如何在数据集中表示非数字特征。我的第一个想法是用一个从1到n(其中n是特征的数量)的数字为一个特征的每个可能的值‘别名’。在做一些研究时，我遇到了一个建议，当处理具有少量可能值的特征时，您应该使用长度为n的位串，其中每

浏览 0提问于2011-04-09得票数 2

回答已采纳

4回答

猪描述符是在peopledetect.cpp中构造的吗？

、、

2010，我正在运行软件包中的示例peopledetect.cpp，它的编译和运行，但我想了解detail.In peopledetect.cpp中的源代码是为人们构建/已经训练的hog描述符检测3780向量是否被送入当我尝试调试peopledetect.cpp时，我只能发现HOGDescriptor创建了hog描述符和检测器，我基本上不理解这个是做什么的，因为我看到没有经过hog处理的步骤，它将已经训练好的向量加载到

浏览 2提问于2013-04-16得票数 1

回答已采纳

1回答

支持向量机机器学习算法中字符串数据的转换

、、

我有一个数据集<table><tr><td>100% free cashback </td><td>spam</td></<tr><td>click on this link to get free sms plan</td>&

浏览 2提问于2020-05-31得票数 0

回答已采纳

5回答

支持向量的数量与训练数据和分类器性能之间的关系是什么？

、、、

也就是说:如果我的训练集是1000，那么大约800个被选为支持向量。我到处寻找，想知道这是好事还是坏事。我的意思是，支持向量的数量与分类器性能之间是否存在关系？我已经阅读了这个，但我正在执行参数选择，而且我还确定特征向量中的属性都是有序的。我只需要知道它们之间的关系。谢谢。附注:我使用线性内核。

浏览 2提问于2012-02-28得票数 78

回答已采纳

1回答

用预先制作的字典表示支持向量机进行文本分类

、、、

我想把一个文本集合分成两类，比如说我想做一个情感分类。我有两本预先编好的感情字典，一本只有正面的，另一本只有负面的。我想把这些字典合并到支持向量机分类器的特征向量中。我的问题是，是否可以将正负词词典区分为SVM特征向量，特别是当我为测试集生成特征向量时？Pos

浏览 3提问于2016-04-24得票数 1

回答已采纳

5回答

在哪里最好使用带有线性内核的svm？

、、、

我目前正在研究svm，并且想知道svm与线性内核的应用是什么。在我看来，它一定是应用于解决一个线性优化问题。这是正确的吗？

浏览 9提问于2013-12-13得票数 20

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

导入自己的数据以进行文档分类

基于SVM的垃圾邮件检测综述

对于二进制分类，哪种是最好的随机森林还是神经网络？

MATLAB的svmtrain :保存支持向量索引，而不是支持向量本身

支持向量机中不同大小特征向量的编码

如何在MATLAB中训练用于分类的大数据集

为什么支持向量机能很好地处理高维数据？

SVM如何对图像进行分类？

帮助我理解二进制支持向量机中的线性可分性

组合多参数生成支持向量机

支持向量机后的遗传算法

SVM分类器中特征长度与预测的关系

如何提高小文本的分类性能

如何将包含非数字特征的数据记录表示为向量(数学，而不是c++向量)？

猪描述符是在peopledetect.cpp中构造的吗？

支持向量机机器学习算法中字符串数据的转换

支持向量的数量与训练数据和分类器性能之间的关系是什么？

用预先制作的字典表示支持向量机进行文本分类

在哪里最好使用带有线性内核的svm？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐