腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
对于get_peers查询,主线
分布式
哈希表节点发送的udp
数据
包的最大大小是多少?
、
、
、
对于get_peers查询,主线
分布式
哈希表节点发送的udp
数据
包的最大大小是多少?当节点
存储
3000个对等点时,节点如何响应?(在这种情况下,
数据
包非常
大
)。主线
分布式
哈希表客户端如何处理它的响应? 提前谢谢你。
浏览 1
提问于2011-08-16
得票数 1
回答已采纳
2
回答
如何尽可能有效地了解
分布式
软件系统?
、
我正在努力学习云计算,尤其是
分布式
操作(网格计算?)我正在做的一个项目。我们需要在一个非常
大
的
数据
集中执行
分布式
容错操作,我们还将负责以优化的方式
存储
和维护这些
数据
集。
浏览 0
提问于2011-03-31
得票数 8
1
回答
facebook/google加如何保存帖子?
、
、
、
他们如何保存帖子,然后用php加载
数据
?XML文件?
浏览 0
提问于2012-08-01
得票数 0
回答已采纳
2
回答
分布式
哈希表技术和比特币区块链有什么区别?
、
、
、
、
有一些技术用于
分布式
存储
,比如
分布式
哈希表(比如kademlia或类似的)。比特币区块链与
分布式
哈希表有何不同?或者可能是
分布式
哈希表技术支撑了比特币区块链?或者,为什么与DHT相比,比特币区块链被誉为如此
大
的突破?
浏览 2
提问于2014-10-17
得票数 25
回答已采纳
3
回答
使用zookeeper复制文件
、
我有一个
分布式
应用程序,我使用zookeeper来管理所有
分布式
servers.My服务中的配置
数据
,每个服务器都需要一些dlls来运行。我知道"ZooKeeper通常不是为
大
容量
存储
而设计的“。我的dll文件的大小小于3mb。
浏览 2
提问于2013-09-24
得票数 1
1
回答
猪窝Hbase的不同之处
、
、
、
我正在尝试弄清楚这些Pig Hive和Hbase用于哪种类型的
数据
(结构化、非结构化、半结构化)? 在哪种情况下使用哪种工具更有效?
浏览 3
提问于2015-01-05
得票数 0
1
回答
寻找H2O的记录迭代器
、
是的,我知道我可以在加载到H2O之前使用CSV
数据
,但我不想保留重复的
数据
。是的,我知道我可以使用火花/汽水,让我们暂时假装我不能。我试图联系H2O,但我得到的都是销售人员想和我进行一次鸡尾酒对话。
浏览 5
提问于2018-10-11
得票数 1
1
回答
是否有可能将经过训练的Spark模型或交叉验证器保存到postgree
数据
库?
、
、
、
、
是否有可能将经过训练的Spark模型或交叉验证器保存到postgree
数据
库?我可以找到将它保存到磁盘或HDFS的方法,但是我们可以将它保存在RDBMS(例如Postgree)表中吗?
浏览 1
提问于2017-08-21
得票数 2
回答已采纳
1
回答
如何将内存中的文件部件缓存为Spark中的RDD?
、
、
我需要流读取到非常
大
的文件(在TBs中)。为了达到更高的吞吐量,如果我们能够缓存文件部分在内存中。Spark可以在
分布式
内存中缓存
数据
。如何使用spark缓存文件部件?文件大于任何一台计算机的本地
存储
空间,也大于集群中内存总容量的总和。
浏览 1
提问于2014-05-08
得票数 1
回答已采纳
2
回答
抓取并发或
分布式
爬网
、
、
我想用scrapy抓取相当
大
的网站。在某些情况下,我已经有了抓取的链接,而在其他情况下,我需要提取(抓取)它们。我还需要在运行时访问
数据
库两次。一次是为了确定是否需要抓取url (蜘蛛中间件),一次是为了
存储
所提取的信息(项目流水线)。理想情况下,我可以运行并发或
分布式
爬行,以加快速度。使用scrapy运行并发或
分布式
爬网的推荐方式是什么?
浏览 5
提问于2015-05-28
得票数 4
2
回答
在区块链中保存文件的最佳实践
、
、
、
、
将文件保存为区块链
数据
的一部分的最佳实践是什么?我有非常
大
的文件要保存。 难道我们不能将这些文件保存在云
存储
上(像dropbox这样的集中式解决方案),并使用文件散列将它们与区块链
数据
链接起来吗?或者使用像IPFS这样的
分布式
文件
存储
更好?或者在安全性、容量、性能和容错性方面有更好的解决方案。
浏览 0
提问于2018-05-18
得票数 8
1
回答
替代glusterfs + mongodb用于
大
+小文件
存储
(在kubernetes上)?
、
、
我正在为我们的应用程序栈设置一个包含许多不同组件的kubernetes集群,并且我试图平衡
存储
需求,同时最小化组件的数量。我们有一个web 刮板,它每天下载数万个HTML文件(可能还有PDF),我想把这些文件
存储
在某个地方(以及一些JSON元
数据
)。我希望以冗余的、可伸缩的方式
存储
文件,但拥有数百万个小文件似乎不适合例如GlusterFS。同时,我们有一些非常
大
的二进制文件用于我们的系统(几千兆字节
大
),也可能还有许多较小的二进制文件(10的MBs)。这些似乎不适合像MongoDB这样的
浏览 5
提问于2016-12-23
得票数 1
2
回答
Mongoid对扩展有什么困难吗?
、
、
、
、
我正忙着设计一个web应用程序,希望它能变得非常
大
,有很多用户。我选择MongoDB作为
数据
存储
,其中一个主要原因是它能够随着用户群的增长而水平扩展。有谁有使用Mongoid与处理大量流量的高度
分布式
MongoDB进行交互的经验吗?有什么理由担心性能吗?
浏览 3
提问于2012-03-30
得票数 2
回答已采纳
3
回答
用Java缓存大文件
、
我有一个
大
的二进制文件(300 as ),我将其
存储
为
数据
库表中的媒体blob。文件内容每天更改一次。有多个客户机从文件中请求不同的字节范围。我不对每个请求进行
数据
库调用,而是将整个文件缓存一天。我们有一个
分布式
系统。我们使用Tomcat,MySQL,并且语言是Java。缓存文件的最佳方法是什么?
浏览 5
提问于2014-12-16
得票数 0
回答已采纳
2
回答
我今天可以做出哪些设计决策,可以让迁移到Azure和Azure表变得更容易?
我将处理大量的
数据
,就像Azure Tables...are的想法一样,我现在可以做出一些具体的持久性选择,模仿Azure表,这样当迁移的痛苦到来时就会减轻?
浏览 0
提问于2010-09-23
得票数 1
回答已采纳
1
回答
SageMaker
分布式
训练能用于非深度学习模式的训练吗?
、
、
、
、
我正在跟踪这个页面,以了解SageMaker的
分布式
培训功能。上面写着:- SageMaker
分布式
培训库只能通过TensorFlow、PyTorch和HuggingFace框架的AWS深度学习容器在SageMaker培训平台中使用。这是否意味着我们不能使用SageMaker
分布式
训练来使用传统的机器学习算法(如线性回归、随机森林或XGBoost )来训练机器学习模型?我有一个用例,其中
数据
集非常
大
,和
分布式
培训可以帮助模型并行和
数据
并行。为了避免在训练实例的内存中输
浏览 12
提问于2022-09-17
得票数 -1
1
回答
mapreduce能否在共享元组空间(例如:
数据
库)上高效工作?
我之所以问这个问题,是因为我想知道在
数据
库或共享键值
存储
上运行mapreduce查询是否有效?例如,要实现一个网络拖网工具,它对互联网进行索引,并计算不同网页上的所有术语,使用
数据
库作为后端可以有效地完成这一任务吗?
浏览 0
提问于2010-03-09
得票数 2
回答已采纳
1
回答
GAE 1 Mb实体限制
我有一个小的
数据
集,大约2000行,实体只有4个字符串字段和一个长id。当我填充在本地运行的
数据
库时没有问题,但是当我在appengine上运行它时,在达到1Mb的限制之前,我只有867条记录进入
数据
库。“App Engine
数据
存储
区使用
分布式
体系结构自动管理扩展到非常
大
的
数据
集” 有没有关于如何绕过这个严重限制的讨论?
浏览 1
提问于2012-10-31
得票数 2
2
回答
HDFS和ADLS有什么区别?
、
、
与HDFS不同的是,我对天蓝色
数据
湖的
存储
方式感到困惑。有谁能简单地解释一下吗?
浏览 2
提问于2020-07-09
得票数 1
回答已采纳
3
回答
使用UUID或GUID作为主键有哪些缺点?
、
、
、
我想建立一个
分布式
系统。我需要将
数据
存储
在
数据
库中,在某些表中使用UUID或参考线作为主键是很有帮助的。我想这是这个设计的缺点,因为UUID/GUID相当
大
,而且它们几乎是随机的。
浏览 0
提问于2011-01-06
得票数 72
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Gartner 19Q2外部存储数据发布,分布式存储大爆发
分布式存储大爆发:IPDS分布式存储项目正在振兴
是结合了分布式数据存储
分布式存储:IPFS/Filecoin是如何帮你存储数据的!
分布式文件存储数据库 MongoDB
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券