腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
将稀疏矩阵导入
h2o
实例非常慢
r
、
performance
、
import
、
sparse-matrix
、
h2o
我在R中得到了21万x 500个稀疏矩阵,我试图用
h2o
进行聚类。我设想对于
h2o
来说,21万行矩阵并不大,但是当我试图将它导入到
h2o
实例时,需要很长时间(让它运行超过10分钟并在完成之前停止),当我在稀疏矩阵中子集前10,000行并导入它时,它只需几秒钟。
H2O
cluster total memory: 14.22 GB
H2O
cluster allowedcores: 4
浏览 1
提问于2017-06-26
得票数 0
回答已采纳
1
回答
如何将稀疏矩阵引入
H2O
?
r
、
sparse-matrix
、
h2o
假设我们有以下内容:假设我的本地
H2O
是localH2O,我似乎不能做以下工作这似乎很符合逻辑,但是假设测试太大,我无法将其转换为
数据
格式,我如何将它加载到
H2O
中呢?使用稀疏矩阵表示,它仅为500 so左右。 如何将稀疏矩阵加载到
H2O
中?
浏览 7
提问于2015-09-29
得票数 7
回答已采纳
1
回答
使用
svmlight
读取
h2o
中的稀疏
数据
r
、
data.table
、
h2o
、
svmlight
我正在尝试将
SVMLight
格式的
数据
集读取到
h2o
中。将其写入磁盘上的文件并将其读回是正常的,但直接从R的内存中读取则不是。我想知道是否有不同的函数或调用我在下面使用的函数的不同方式。下面是一个R 3.3.3,
h2o
3.10.3.6示例require(
h2o
) tot_obs <- 100 tot_var:=paste(is_event,feature)][, c("obs","is_ev
浏览 5
提问于2017-04-28
得票数 1
1
回答
将
数据
直接从Elasticsearch索引导入到
h2o
elasticsearch
、
h2o
、
h2o4gpu
有没有办法通过任何应用程序接口直接将
数据
从Elasticsearch索引导入到
h2o
。 谢谢Sarvendra
浏览 5
提问于2020-06-08
得票数 0
1
回答
Python
h2o
svmlight
数据
python
、
h2o
、
svmlight
我有一个
svmlight
格式的文件,其值为:我正在尝试使用h2o.import_file(fname.
svmlight
)将其导入到
h2o
中
h2o
是否支持高维稀疏二进制特征?
浏览 4
提问于2017-08-03
得票数 1
1
回答
使用稀疏矩阵的内存过多的
H2O
r
、
sparse-matrix
、
h2o
我使用的是
H2O
,维数为70万x ~800,000的
SVMLight
稀疏矩阵。磁盘上的文件大小约为800 on。但是将它导入
H2O
占用300 it的内存?下面是我的代码:h2o.init(nthreads=-1,max_mem_size = "512g")
H2O
浏览 1
提问于2017-10-31
得票数 0
回答已采纳
1
回答
如何在
H2O
中将
数据
从长格式转换到宽格式?
r
、
sparse-matrix
、
tidyr
、
h2o
、
tidytext
总体动机之一是通过分析这些
数据
来了解各种硬件设置的局限性,但目前我还在努力将
数据
放入
H2O
集群(在R可以将其全部保存在内存中的机器上),因此无法对大小限制进行分析。/Core/ Cholmod _dense.c中的cholmod错误‘问题太大’,第105行 将
数据
的长、整洁、高效的形式上传到
H2O
中,并在
H2O
中进行整形“扩展”用R(或任何其他语言)进行
数据
整形,将产生的稀疏矩阵以稀疏格式保存到磁盘,然后从那里上传
浏览 1
提问于2016-12-27
得票数 6
回答已采纳
1
回答
我可以直接从蜂窝表中提取
数据
到
H2O
吗?
hadoop
、
hive
、
h2o
我们的
数据
存储在蜂箱文本文件和拼板文件中,不管怎么说,是否有直接从这些文件加载到
H2O
,或者我们必须通过一个中间步骤,如csv或熊猫
数据
文件?
浏览 0
提问于2018-02-21
得票数 1
1
回答
将text2vec dtm写入文件(csv或
svmlight
)
r
、
sparse-matrix
、
svmlight
、
text2vec
我的最终目标是使用text2vec在R中生成特性,并将生成的矩阵导入
H2O
以供进一步建模。
H2O
可以读取CSV或
SVMLight
格式。我想我也许可以轻松地把它写成
SVMLight
格式,但是还没有找到一个能工作的库。有谁有其他选项可以将这个输出输出到我可以读入
H2O
的文件中呢?
浏览 2
提问于2016-11-27
得票数 1
回答已采纳
2
回答
h2o
闪亮的省水帧存储到磁盘
h2o
、
sparkling-water
我正在尝试通过从spark拼接文件创建
h2o
框架来导入框架。文件大小为2 2GB,行大小约为12M,稀疏向量大小为12k。它在镶木地板格式中不是那么大,但导入永远需要花费时间。在
h2o
中,它实际上报告为447mb压缩大小。实际上很小。我觉得好
浏览 3
提问于2016-12-12
得票数 1
1
回答
大型glm模型与内存管理
python
、
h2o
、
glm
我使用
h2o
训练一组
h2o
模型,其中非常稀疏训练矩阵(4million x 50k)是相同的,但是每个模型的响应变量(y)是不同的。在过去,我更喜欢编写
SVMLight
文件并将其读取回来。但是有了这个,我必须在磁盘上创建20个,并把它读回来。创建没有响应变量的文件是一种方法吗?安装程序:32核,512 jre mem,RHEL7 (单用户)/
Python
3.6.9/
h2o
3.30.0.2 /jre 1.8.0_251
浏览 9
提问于2020-05-01
得票数 0
1
回答
加载
svmlight
格式错误
python
、
import
、
load
、
format
、
svmlight
当我尝试对
数据
使用时,我已经将其转换为
svmlight
格式,我会得到一个错误。这应该是很基本的,我不明白发生了什么。下面是代码:training_data = open('thedata', "w") model=
svmlight
.learn(training_data, type=
浏览 6
提问于2014-09-04
得票数 0
回答已采纳
1
回答
scikit学习用SVM轻型加载器
python
、
file
、
machine-learning
、
svm
一旦我有了一个格式的
数据
,我需要运行一个分类器从科学工具包(lib线性)。我可以把
数据
转换成svm光格式。据我所知,有一个模块可以将其转换为科学工具包标准。问题是我不想把文件写到磁盘上。样本svm光
数据
位于:。(bufFile) line 97, in load_
svmlight
_filezero_based)) F
浏览 2
提问于2012-12-01
得票数 0
1
回答
如何保存稀疏
数据
集以供scikit-learn使用?
java
、
python
、
scikit-learn
我想用scikit-learn分类器测试我的
数据
集。我使用Java动态创建特征向量,向量非常稀疏。我想将我的稀疏向量/
数据
集导出为一种可以轻松与scikit-learn一起使用的格式。我已经用Java语言编写了一个导出函数,将
数据
集导出为ARFF格式,但我发现用scikit-learn无法读取它。有一些用于ARFF文件的
python
解析器,但它们不支持稀疏
数据
集。 即哪种格式?!
浏览 5
提问于2015-05-15
得票数 0
2
回答
scikit-learn
svmlight
格式加载器中的弃用警告
python
、
scikit-learn
我看到的是以下内容:/Users/cpd/.virtualenvs/py27-ipython+pandas/lib/
python
2.7/site-packages/sklearn/datasets/
svmlight
_format.py:137: DeprecationWarning: usi
浏览 1
提问于2013-11-20
得票数 14
回答已采纳
1
回答
用svmLigh读取
h2o
格式
r
、
h2o
、
svmlight
使用
h2o
R包(v3.24.0.5)对一些深度学习,我需要导入一些大的稀疏矩阵2M * 10k到它。我试过使用fwrite,但是遇到了一个很大的错误,所以我使用了
svmlight
。为此,我使用了sparsio包,编写还可以,但是当使用h2o.importFile读取文件时,我注意到了一些错误:在每个数字前面都有列索引,如下所示:write_
svmlight
数据
应该如下所示:1 0 nan 10.1266 2 0
浏览 2
提问于2019-07-08
得票数 0
回答已采纳
1
回答
如何将红移表导入
H2O
Flow?
python
、
amazon-redshift
、
h2o
我正在尝试导入红移表到H20流,并使用以下网址作为其他
数据
库编辑器,即。是否可以将Redshift集群连接到
H2O
?
浏览 15
提问于2019-05-08
得票数 0
1
回答
稀疏矩阵的k均值的图簇
python
、
matplotlib
、
scikit-learn
我有一个在
svmlight
格式的
数据
文件上做集群的
python
脚本。我使用函数sklearn.datasets.load_
svmlight
_file从
数据
文件加载
数据
。我知道这个函数返回一个稀疏矩阵。import sysdataFilename = sys.argv[1] X, y = sklearn.datasets.load_
svmlight
_file
浏览 2
提问于2020-07-09
得票数 0
2
回答
从linux可执行文件调用函数
python
、
c
我有这样的
python
代码:test_data = __import__('data').test0
svmlight
.write_model(model, 'my_model.dat
浏览 5
提问于2014-10-08
得票数 2
回答已采纳
1
回答
python
sklearn读取非常大的
svmlight
文件
python
、
scikit-learn
、
sparse-matrix
、
libsvm
、
svmlight
我使用
python
2.7与
svmlight
一起存储和读取一个非常大的
svmlight
格式文件。我正在使用rows, labels = sklearn.datasets.load_
svmlight
_file(matrixPath, zero_based=True)现在,我发现最好的方法是使用终端命令拆分
svmlight
文件。然后读取我创建的部分文件。 我认为读取大文件的一个好方法是逐行逐行读取,以避免内存溢出。如何使用
svmlight
格式的文件来完成此操作?
浏览 2
提问于2017-07-17
得票数 2
点击加载更多
相关
资讯
【资料】Practical Machine Learning with H2O
人工智能公司H2O获得D轮7250万美元,自动为企业部署AI
python入门系列:Python数据类型
Python 数据科学入门
数据科学Python基础
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券