数据特征_数据特征提取_大数据的特征 - 腾讯云开发者社区

、、、

在使用OneHotEncoder转换特征之后，我试图对数据集中的一些特征进行一些数据分析，结果显示特征13和特征21是最重要的特征，但是我如何知道这些特征对应于哪些特征呢？

浏览 31提问于2019-12-02得票数 0

回答已采纳

1回答

我的数据集中是否存在过度拟合的问题？

、、、

我已经将顺序前向选择应用到我的数据集上，该数据集有214个样本和515个特征(2个类问题)。特征选择算法选择了8个特征。现在我已经将svm (MATLAB)应用于这8个特性。下表给出了算法的正确率(训练数据集)以及使用的特征集。所取得的结果是： 16个特征= 0

浏览 0提问于2016-08-08得票数 4

回答已采纳

1回答

PCA算法背后的直觉

、、、、

在找到数据集协方差矩阵的特征向量和特征值后，特征值表示数据集的分布情况，特征向量表示特征值的方向。我们所要做的是将特征向量从最高的特征值降到最低的特征向量(最高的意思是特征更加分散，从而彼此更加独立，减少冗余)，并将原始数据集投影到新的“轴”集(特征向量)上。例如，如果我们有一个三维数据集，那么就会有三个特征向量，每个特

浏览 0提问于2019-09-17得票数 1

2回答

我想更新苹果健康的生日。但我不知道怎么做。private func requestAuthorisationForHealthStore() { HKCharacteristicType.characteristicTypeForIdentifier(HKCharacteristicTypeIdentifierDateOfBirth), HKQuantityType.quantityTypeForIdentifier(HKQuantityTypeIdentifierBodyMass

浏览 0提问于2014-09-22得票数 0

1回答

为什么套索不能进行特征选择？

、、、

我在一个只有15个特征试图预测二进制结果的数据集上拟合逻辑拉索。我知道LASSO应该做特征选择和消除不重要的特征(系数= 0)，但在我的分析中，它已经选择了所有的特征，而没有消除其中的任何一个。我的问题是：这是因为我的特征太少，或者特征之间没有关联(对于分类模型来说，低co-linearity?)Is是一件坏事还是好事？所选的特征系数小于0.1，我能把它们解释为对模型不重要或不重要吗？

浏览 2提问于2021-12-15得票数 0

1回答

自然语言处理中的特征向量和特征值

、

特征向量和特征值如何应用/适用于自然语言处理问题？有什么例子吗？

浏览 0提问于2017-03-29得票数 1

1回答

缺失特征的神经网络

、

我有一个具有A...F特征的数据集用于训练。现在我的预测数据集预测的关键特征没有在训练集中使用的3个特征的观测值。因此，我只有一个用于预测的特征子集，而神经newtork是针对更广泛的特征进行训练的。我该如何处理这样的问题？你能使用神经网络来处理缺失的特征吗？我的想法如下:首先，我在训练集上使用神经网络，但现在在缺失的特征上进行训练。因此，我可以预测预测数据集中缺少的3个特征。现在，我在这个新的预

浏览 3提问于2017-05-07得票数 0

1回答

如何(本机)给出特征向量和解释方差分数进行PCA特征选择

、、、

输入的测试数据是一个2D数组，4个特性Colsx100行实例。*如果某些特征值的幅度明显大于其他特征值，*则通过将“信息量较低”的特征对删除，将数据集通过PCA降至较小的维子空间*是合理的。**特征向量表示数据的相对基(轴)**从主成分分析*/ EigenDecomposition分解中计算新变量=新的EigenDecomposition(covarianceMatrix)；对角化协方差矩阵(特征值)；选择第一个n特征

浏览 1提问于2019-09-08得票数 0

1回答

分类数据-如何处理

、、

很少有关于分类数据的问题。需要建议/指示：cat和num特征之间的相关性如何？我们如何找到目标依赖于组合的分类特征，但可能不显示与个别特征的相关性的情况？我们能否处理测试数据具有训练数据中不存在的分类特征值的场景？

浏览 0提问于2020-04-28得票数 0

1回答

最大特征值与特征向量的匹配

、、、

在Python中，我通过eig()计算了数据矩阵eig()的特征向量和特征值。我希望找到数据的前2位主组件 (U = u1 u2)。我知道前两个分量是对应于两个最大特征值的两个特征向量，但我不知道如何用手头的数据(特征值、特征向量和X)来计算这些信息。计算的特征向量和特征值：

浏览 0提问于2018-10-07得票数 0

3回答

聚类:可变数据维度的训练数据集

、

我有一个包含n个数据的数据集，其中每个数据都由一组提取的特征表示。通常，聚类算法要求所有输入数据具有相同的维数(相同的特征数)，即输入数据X是n个数据点的n*d矩阵，每个数据点具有d个特征。在我的例子中，我之前从我的数据中提取了一些特征，但每个数据提取的特征的数量很可能是不同的(我的意思是，我有一个数据集X，其中数据</

浏览 7提问于2011-12-18得票数 1

回答已采纳

1回答

如何对人脸识别特征值进行散列，并将其存储在数据库中与以后进行比较

、

我从照相机上抓取人脸图像，并存储每个人脸帧，直到有足够的图像来训练opencv中的特征脸对象。我可以得到一个普通的特征面，但我想知道如何将它存储到服务器上的数据库中，这样当一个人回来后，我可以得到另一个平均特征面，发送到服务器并找到最接近的匹配。我想要散列这个特征面和比较散列，但是我可以将这个平均特征面存储在数据库中，但是我不知道如何将客户端的特征面与数据库中的所有特征面进行比较，而不从数据库中提取

浏览 0提问于2015-03-12得票数 2

回答已采纳

2回答

从json提取数据到CSV

、、、、

json文件完整json文件name link traits_type(eye) traits_type(fur) traits_type(mouth) APE 0 https:/file = js

浏览 16提问于2022-10-10得票数 0

回答已采纳

1回答

数据帧的剂量元数据有助于建立ML算法的特性

、、、、

到目前为止，我在远离站点的地方收集到的是，当您构建一个特性时，它从给定的数据集中提取某些列，然后将这些信息放入一个特征向量中，供ML算法学习。因此，对我来说，您可以直接从数据集构建一个特性，而不关心元数据。但是，我想知道使用元数据在多个数据集中搜索给定的信息以构建特性是否常见，即在元数据文件中查看某些适合您构建的特性的标准，然后从元数据中加载数据并从那里构建特性以训练模型。与其直接遍历所有数据集，不如检查元数

浏览 2提问于2019-12-13得票数 0

回答已采纳

1回答

特征工程:我们把从数据集生成特征值的过程称为什么？

、

我知道特征生成意味着从原始特征生成新的特征，而特征提取意味着从一组特征中选择特征。那么，我们如何从数据集中获取每个特征的值的过程呢？

浏览 25提问于2019-04-23得票数 0

2回答

状态模型PCA特征值和

、、

当我将statsmodels.multivariate.pca.PCA应用于某些数据时，我发现产生的特征值之和并不等于数据的总方差。添加1 当对数据X (即使用矩阵X^TX)进行主成分分析时，方差和与特征值之间的关系不再成立，只有当主成分分析是在协方差矩阵(即X^TX/n上)上进行时，当特征值之和为方差和时，即trace(X^TX/

浏览 3提问于2020-04-22得票数 1

1回答

数据预处理和特征工程

、、

我一直在读一些关于数据预处理和特征工程的文章，包括特征选择，特征重要性和特征构造。我的理解是在数据预处理阶段应用了特征工程。此外，在应用机器学习模型时，有时会检查特征重要性，有时会在模式内部进行检查。我的问题是:特征工程是否总是在预处理阶段实现，或者有时可以在以后的阶段执行？谢谢你Shosho

浏览 45提问于2021-04-28得票数 0

1回答

条件分布的均值和协方差

、、、、

我有一个10000×22维阵列(观测x特征)，我拟合一个高斯混合的一个分量如下：然后，根据第87页的方程2.81和2.82计算前两个特征的条件分布的均值和协方差。

浏览 5提问于2018-01-20得票数 1

回答已采纳

1回答

one-hot编码会导致功能不均衡的问题吗？

、、、、

我们知道，在数据挖掘中，我们经常需要对分类特征进行一次性编码，因此，一个分类特征将被编码为几个"0/1“特征。有一个特例让我感到困惑:现在我的数据集中有一个分类特征和一个数字特征，我将分类特征编码为300个新的"0/1“特征，然后使用MinMaxScaler对数字特征进行归一化，因此我的所有特征值都在0到1的范围内但可疑的现象是，分类特征和数

浏览 2提问于2018-12-03得票数 0

1回答

我可以在r中的多个数据帧列表中应用滑动窗口吗？

、、、

我有一个大约400个数据帧的列表，我想为每个数据帧提取特征。所有数据帧的功能都将是相同的。我可以直接对数据帧列表执行此操作吗？提取特征，然后将新的特征列添加回每个数据帧的列表中？任何建议都将不胜感激。我知道如何在每个数据

浏览 2提问于2017-07-12得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从OneHotEncoder获取相应的功能

我的数据集中是否存在过度拟合的问题？

PCA算法背后的直觉

迅速更新HealthKit生日

为什么套索不能进行特征选择？

自然语言处理中的特征向量和特征值

缺失特征的神经网络

如何(本机)给出特征向量和解释方差分数进行PCA特征选择

分类数据-如何处理

最大特征值与特征向量的匹配

聚类:可变数据维度的训练数据集

如何对人脸识别特征值进行散列，并将其存储在数据库中与以后进行比较

从json提取数据到CSV

数据帧的剂量元数据有助于建立ML算法的特性

特征工程:我们把从数据集生成特征值的过程称为什么？

状态模型PCA特征值和

数据预处理和特征工程

条件分布的均值和协方差

one-hot编码会导致功能不均衡的问题吗？

我可以在r中的多个数据帧列表中应用滑动窗口吗？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐