如何从CSV文件中训练和测试一个简单的二进制分类器？

文章/答案/技术大牛

发布

2回答

维卡:火车和测试设备不兼容。

我试图使用weka和朴素贝叶斯分类器对一些网络帖子进行分类。首先，我手动对许多帖子进行分类(大约100个否定的和100个肯定的)，并使用以下形式创建了一个.arff文件：@attribute 'post' string然后打开Weka，加载该文件，并应用StringToWordVector筛选器将文章拆分为单个word属

浏览 2提问于2012-12-17得票数 3

回答已采纳

2回答

、、、、

我用tweets bigram做了一个下面的CSV文件，我想训练一个模型来预测标签。我在网上找到的大多数示例都包含带有附加参数的数字特征，这使得它很难理解。在这里，我要求一个非常简单的例子来理解应该如何使用python (使用诸如scikit-learn之类的库)来训练和测试使用这个最简单的<

浏览 26提问于2020-10-27得票数 0

1回答

用于LIBSVM的图像特征提取

、、、

我想将LIBSVM应用于图像分类。我捕获了大量的训练图像(位图格式)，我想从中提取特征。训练图像包含躺在地板上的人。分类器应该确定在给定的图像中是否有人躺在地板上。我读了很多论文、纪录片、指南和教程，但它们都没有记录如何获得LIBSVM包。唯一要描述的就是如何从CSV文件转换成LIBSVM包：。在上，可以下载几个示例数据。示例数据要么准备为<e

浏览 0提问于2012-01-23得票数 0

1回答

训练和测试数据中缺失值的机器学习问题

、、

我在为二进制分类训练文本分类器。在我的培训数据中，文本部分的.csv文件中有空值，测试文件中也有空值。我已经将这两个文件转换为一个dataframe (Pandas)。这是总体数据的一小部分(小于0.01)。了解这一点--用空字符串替换空文本字段更好，还是将其保留为空？如果答案是用空字符串替换，那么在针对模型

浏览 4提问于2022-05-22得票数 0

1回答

OpenCV 3.1.0 NB分类器将所有MNIST训练样本分类为单类

、、、、

我正在尝试使用OpenCV 3.1.0为MNIST数据集训练NB分类器。我使用来自的准备好的CSV训练和数据文件来训练NB分类器。我使用剪切和粘贴功能稍微修改了这个CSV文件，以满足OpenCV的要求。在训练分类器之后，我尝试使用它来对训练数据集进行

浏览 0提问于2016-03-27得票数 0

1回答

多类分类1对1

在多类分类中，一对一方法是如何用于测试集的？我明白它是如何为每一对训练集生成子集的，但是它是如何在测试集上使用的呢？我读过一些关于大多数选票的文章，但我找不到那些选票是什么，也找不到它们是如何运作的，我的想法是，在两个类中，选票是被平放为正反两类的观察。我是怎么理解的：如果

浏览 3提问于2020-10-20得票数 1

回答已采纳

1回答

用Weka编写分类器

、、

我的英语很差，但我会尽量说清楚。我想用Weka编写一个分类器(例如J48)。在我的例子中，一个实例由六个数字组成，除了一个介于0和-10之间的数字之外，所有的数字都在0到10之间。示例: 1、-3、6、3、6、7或1、-4、5、3、7、6或2、-4、5、3、8、6@ATTRIBUTE attribute1 {0,1,2,3,4,5,6,7,8,9,10} @ATTRIBUTE这些例

浏览 2提问于2015-02-27得票数 0

1回答

如何使用Keras加载图像以解决分类问题

、、、、

我正在使用Keras框架解决图像分类问题。这是二进制分类问题，我有两个文件夹，训练集，和测试集，其中包含两个类的图像。我没有单独的文件夹为每个班级(例如猫对狗)。当我们对每个类都有单独的文件夹(猫文件夹和狗文件夹)时，Keras ImageDataGenerator才能工作。但是我有所有的图片在单文件夹培训集，

浏览 2提问于2018-11-01得票数 0

回答已采纳

2回答

使用TF-下手测试和训练集具有不同数量的特征

、、、

我正在做一个简单的二进制分类，我给出了一个问题的例子:假设我们有n文档(Doc1，Doc2，…，Doc )。我们将使用TF-以色列国防军作为特征值，使用单词袋训练二进制分类器。我们为我们的培训文件提供了m特性(从技术上讲，m是我们在清理和预处理后的所有n个文档中拥有的唯一标记的数量)。现在，

浏览 4提问于2017-06-23得票数 2

1回答

多个二进制分类器组合

、

我正在尝试实现一个多层感知器分类器，我有一个1000个样本的数据集。有6个要素和5个可能的不同标注基于我对OneVsAll的理解，我们为每个标签创建一个二进制分类器，并用训练数据训练分类器。然而，我不明白我们如何将5个二进制分类器

浏览 4提问于2017-03-04得票数 0

回答已采纳

2回答

错误:无法将gs://bucket/SampleVideo.mp4解析为CSV

、、、、

我正在尝试创建一个自定义模型的自动ML视频智能分类，并不断得到上述错误。这不是一个视频剪辑的问题，因为如果我尝试使用相同的CSV，我会收到不同视频的错误信息。CSV是在excel中创建的，第一列是训练或测试，第二列是视频URI。

浏览 47提问于2020-06-14得票数 0

1回答

基于最小化、差分进化和Basinhopping的模型优化

、、、

我正在做一个广为人知的简单的Kaggle项目，只是为了好玩，但当我看到其他参赛者做出的一些预测时，我有一些怀疑，他们达到了100%。有两个csv文件，一个叫做'train.csv‘和'test.csv'；第一个是训练，第二个是预测二进制特征。要预测的二进制功能称为“Survived

浏览 16提问于2020-11-22得票数 0

1回答

使用银河动物园数据集、TensorFlow和Keras训练GAN

、、、

为了使用TensorFlow和Keras训练简单的GAN，导入Galaxy Zoo dataset的正确方法是什么？例如，有没有和导入MNIST一样简单的方法？

浏览 28提问于2020-11-19得票数 1

回答已采纳

1回答

面向初学者的BERT文本分类任务

、、、

有人可以简单地列出为CS新手构建BERT文本分类器所涉及的任务吗？我的方法包括获取一个段落长度的人道主义援助活动描述列表(在CSV文件中具有相应的标题和扇区代码)，并使用单独的扇区代码列表及其句子长描述构建一个能够将扇区代码分配给描述的分类器。对于训练、测试和</em

浏览 15提问于2021-11-12得票数 0

2回答

我选择从我的pc上传图像。我已经尝试上传多个和单个图像，以确保格式正确。我已经尝试创建新的云存储容器。ICN8572734381850886144错误消息:错误: INVALID_ROW:在gs://cloud-automl-tenant-gcs-868eb49b-dec0-4c63-a25c-659fa5ffdd76/create-csv-1065568604314927104-2020-06-02T21:32:31.819Z.csv：“不支持的<

浏览 29提问于2020-06-03得票数 1

回答已采纳

1回答

weka分类失败，是由于标称值的大小写敏感引起的吗？

、、、

我有两个csv文件:一个用于训练分类器(包含300个查询)，另一个用于测试分类器(当前包含大约200个查询)。当我使用training use和testset来训练/评估带有weka knowledgeflow的分类器时，大多数类都达到了相当好的准确性。Weka知识流培训/测试</e

浏览 1提问于2012-05-25得票数 0

1回答

为有监督的机器学习选择样本

、、

如何为要通过应用监督学习解决的二进制分类问题选择样本大小和样本集(用于训练和测试)？目前的实现基于15个二进制特征，我们可以将其扩展到20个或可能24个二进制特征，以提高准确性度量。该分类基于在决策表中的查找，我们希望将其替换为具有机器学习分类器的决策。目标的一部分也是为了衡量我们当前<em

浏览 2提问于2015-06-11得票数 0

1回答

WEKA显示了ARFF文件中的第一个变量，它的开头是几个字符

、

在WEKA中，我尝试使用ARFF文件作为模型的测试集，但在对我的训练数据进行分类(在分类选项卡下)后，收到以下错误："Train和test set不兼容。“请参见图像：我在Excel中打开了原始的培训和测试CSV文件，它们在我看来是一样的。我在Notepad++中打开

浏览 0提问于2020-04-10得票数 0

1回答

文本分类:多文本分类与多类文本分类

、、

我有一个关于处理多标签分类问题的方法的问题。在文献综述的基础上，我发现最常用的方法之一是问题转换方法.它将多标号问题转化为多个单标号问题，分类结果只是每个单标签分类器的简单结合，采用二进制相关的方法。由于单个标签问题可以被描述为二进制分类(如果有两个标签)或多类分类问题(如果有多个标签，即labels>2

浏览 5提问于2016-03-02得票数 1

2回答

使用sci-kit中的训练/测试数据学习曲线，而不是交叉验证

、、、

我有一个独立的训练和测试数据(从不同的CSV加载到不同的pandas数据框中)，我想用这些训练和测试数据绘制学习曲线，而不是使用交叉验证从训练集本身生成训练和测试数据(这似乎是learning_curve的常见工作方式)。似乎scikit希望你的测试

浏览 3提问于2015-09-20得票数 2

点击加载更多

维卡:火车和测试设备不兼容。