腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
用于
scikit-learn
向
量化
器
的
自定义
标记
器
、
one`feature two`feature three','feature one'我想使用scikit中
的
两个向量器类CountVectorizer或TfidfVectorizer),其中'feature one'、'feature two'、'feature three'和'feature four'应该是矩阵中表示
的
四个特性
浏览 0
提问于2018-02-23
得票数 2
回答已采纳
1
回答
Tfidf矢量器
、
、
、
我从文本评论中获取了一个
用于
预测情绪
的
数据集,最初,我清理了数据(删除标点符号,删除停用词,
标记
化)。当我尝试将
标记
化
的
数据作为TFIDF向量器
的
输入时,我得到
的
是AttributeError:'list‘对象没有'lower’属性。请帮我改掉这个错误。
浏览 0
提问于2020-01-21
得票数 1
2
回答
如何在
scikit-learn
中继承向
量化
器
的
子类而不重复构造函数中
的
所有参数
、
、
、
、
我正在尝试通过将CountVectorizer子类化来创建
自定义
向
量化
器
。向量器将在计算词频之前对句子中
的
所有单词进行词干处理。然后我在流水线中使用这个向
量化
器
,当我执行pipeline.fit(X,y)时,它工作得很好。但是,当我尝试用pipeline.set_params(rf__verbose=1).fit(X,y)设置一个参数时,我得到了以下错误: RuntimeError:
scikit-learn
estimators下面是我
的
自定
浏览 11
提问于2018-07-20
得票数 3
1
回答
在python中使用
Scikit-learn
Pipeline vs list append
、
我想使用自己
的
函数对文本数据进行预处理,然后应用countvectorizer。我可以为这两个作品使用管道吗?
浏览 12
提问于2020-01-29
得票数 1
回答已采纳
3
回答
sklearn导入错误:无法导入名称tfidfvectorizer
、
--------------------------------------------------------------------------- /usr/lib/python2.7/dist-packages/IPython/utils/py3compat.pyc in execfile(fname, *where) 174 fi
浏览 9
提问于2013-12-17
得票数 1
回答已采纳
1
回答
在训练过程中,Tensorflow
量化
感知训练是否会导致实际
的
加速?
、
、
、
、
我们正在考虑将
量化
感知训练
用于
一个研究项目,以确定训练期间
量化
对收敛速度和运行时间
的
影响。尽管我们还不完全相信这是正确
的
工具。请您澄清以下几点: 1)如果一个层在
量化
感知训练期间被
量化
,这意味着输入和权重被
量化
,包括激活函数在内
的
所有操作都被
量化
,然后在返回之前,输出被反
量化
到与下一层兼容
的
精度。这种理解正确吗?3)原则上,
量化
感知训练是否会在您
的</em
浏览 22
提问于2020-06-19
得票数 0
回答已采纳
1
回答
在nltk中使用
scikit-learn
分类
器
,多类情况
、
、
文本文档
的
分类是一个,但在NLTK中没有一个干净
的
支持,也有像这样困难
的
方法来做这件事
的
示例。在
scikit-learn
everything is OK:from sklearn.multiclassOneVsRestClassifier(MultinomialNB())print clf.classes_ 结果是['first'
浏览 2
提问于2012-11-23
得票数 6
回答已采纳
1
回答
使用C++20概念为
自定义
容器创建一个Iterator
、
、
C++20引入了概念,这是对模板函数或类可以接受
的
类型施加约束
的
一种聪明方法。同样
的
情况也适
用于
所有迭代
器
属性。例如,前
向
迭
浏览 3
提问于2022-05-27
得票数 9
回答已采纳
2
回答
如何通过
scikit-learn
中
的
SVM使用非整数字符串标签?Python
、
、
、
、
Scikit-learn
为机器学习提供了相当友好
的
python模块。 我正在尝试训练一个
用于
自然语言处理(NLP)
的
SVM
标记
器
,其中我
的
标签和输入数据是单词和注释。例如,词性
标记
,而不是使用双精度/整数数据作为输入元组[[1,2], [2,0]],我
的
元组将看起来像这样
的
[['word','NOUN'], ['young', 'adje
浏览 0
提问于2012-10-18
得票数 6
回答已采纳
1
回答
spacy
的
自定义
规范化
、
我正在使用en_core_web_sm,我正在尝试使它适应我
的
语料库。我已经调整了令牌
器
,现在它会根据需要生成令牌。 我看到有一个norm_exceptions.py文件,除了标准化
的
所有例外。但是,我不知道如何强制我
浏览 0
提问于2018-09-06
得票数 1
回答已采纳
1
回答
如何对字符串数据使用RandomForestClassifier
、
在我
的
数据集中有一个字符串数据和一个文件夹数据。它会显示出来
的
在我跑完之后clf.fit(x1, y1) 如何构建具有混合数据
的
RandomForest模型?
浏览 0
提问于2016-12-01
得票数 1
2
回答
当使用SPF包括时,应用哪种SPF
量化
器
?
、
、
、
SPF记录具有多个
标记
,其中一个可以是include
标记
,SPF记录以像+、?、~或-这样
的
量词结束。这个“子量词”是否只适
用于
它定义
的
主机,而“父量词”适
用于
除子定义主机之外
的
所有东西?还是父量词总是否决所有包含
的</
浏览 0
提问于2018-02-06
得票数 1
回答已采纳
2
回答
在sklearn中持久化数据
、
、
、
我正在使用
scikit-learn
对文本文档进行聚类。我使用CountVectorizer、TfidfTransformer和MiniBatchKMeans类来帮助我做到这一点。新
的
文本文档一直被添加到系统中,这意味着我需要使用上面的类来转换文本并预测聚类。我
的
问题是:我应该如何在磁盘上存储数据?我是否应该简单地处理向
量化
器
、转换
器
和kmeans对象?我应该只保存数据吗?
浏览 2
提问于2012-06-21
得票数 5
回答已采纳
2
回答
在矩阵上使用降维
、
、
、
对于有监督
的
学习,我
的
矩阵大小真的很大,因此只有某些模型同意与它一起运行。我读到PCA可以在很大程度上帮助降低维数。下面是我
的
代码: output = subprocess.check_output(command, shell=True)print(len(set(label_tmp)))print(len(label_tmp)) 我希望
浏览 5
提问于2016-01-16
得票数 1
1
回答
最小二乘回归拟合多项式
的
左一出误差
、
、
、
我需要实现最小二乘回归来拟合1-27次多项式.然后,我需要得到留出一次错误(k=n
的
交叉验证)。在进行了大量研究之后,获得LOO错误
的
最佳方法似乎是使用sklearn cross_val_score()。我
的
问题是,我不知道如何或是否可能使用回归模型。, X, y, scoring=mse, cv=n) 我不知道估计
器
是什么,也不知道如何在cross_val_score中得到它。对于python和这些主题来说,这是一个新
的
主题,因此它
的
挑战性是原来
的
两倍。
浏览 0
提问于2020-03-06
得票数 0
1
回答
第三方XML解析
器
(xpath.js)给出错误“未捕获
的
结束
标记
名称:tagName不匹配当前
的
开始div”
、
、
、
、
使用parse.com
的
云代码,我试图从网页上抓取数据,然后发送到我
的
iOS应用程序。我已经用iOS原生实现了web抓取代码,但我正在尝试将此任务转移到后端。我使用了一个名为
的
node.js库 "Uncaught end tag name: div is not match the curre
浏览 0
提问于2014-09-27
得票数 3
1
回答
将事件处理程序附加到文档,因此不能使用指令
的
文档
标记
、
现在,我已经掌握了创建
自定义
指令和
向
DOM元素添加事件侦听
器
的
诀窍,但现在我想将事件侦听
器
添加到document中。显然没有<document>
标记
,所以我不能使用指令,或者可能有一些特殊
的
技巧?侦听
器
将
用于
处理对文档
的
单击,如果可能的话,它将需要访问$scope,因为它需要找出当前正在打开
的
下拉列表,以便能够关闭它们。
浏览 0
提问于2014-05-21
得票数 0
回答已采纳
1
回答
如何保存稀疏数据集以供
scikit-learn
使用?
、
、
我想用
scikit-learn
分类
器
测试我
的
数据集。我使用Java动态创建特征向量,向量非常稀疏。我想将我
的
稀疏向量/数据集导出为一种可以轻松与
scikit-learn
一起使用
的
格式。我已经用Java语言编写了一个导出函数,将数据集导出为ARFF格式,但我发现用
scikit-learn
无法读取它。有一些
用于
ARFF文件
的
python解析
器
,但它们不支持稀疏数据集。 即哪种格式?!
浏览 5
提问于2015-05-15
得票数 0
1
回答
如何在nyoka中添加
自定义
Transformer/Estimator,并将管道转换为PMML文档?
我正在编写一个Python
scikit-learn
管道,它需要
自定义
的
转换
器
/估计
器
(而不是sklearn中已经定义
的
常规转换
器
)。
浏览 26
提问于2019-05-23
得票数 0
1
回答
向量向量
的
C++矢
量化
、
、
、
我有一些使用vector<vector<>>存储计算结果
的
代码。 通过基准测试,我发现这正在阻止我
的
代码矢
量化
,即使我正在使用适当
的
C-大步访问元素。我正在尝试提出一种数据结构,它将
向
矢
量化
并提高代码
的
性能。我在这里读了几篇文章,其中几篇文章提到了创建一个类,它在内部有两个独立
的
向量:一个
用于
连续存储数据,另一个
用于
存储
标记
原始2D vector<vector>中
浏览 1
提问于2015-12-03
得票数 2
回答已采纳
点击加载更多
相关
资讯
内马尔再次向蓝洞索要《绝地求生》自定义服务器
希捷向华为支付 3 亿美元用于销售磁盘驱动器
足球明星向吃鸡官方讨要自定义服务器 蓝洞:马上派人跟进!
足球明星向吃鸡官方讨要自定义服务器!蓝洞:马上派人跟进!
谷歌浏览器怎么设置自定义的主页
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券