腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2060)
视频
沙龙
1
回答
卡桑德拉用于
数据仓库
、
Cassandra是Hadoop作为
数据仓库
的一个很好的替代方案,其中数据仅被追加,源数据库中的所有更新都不应该覆盖
数据仓库
中的现有行,而应该被追加。Cassandra真的是充当
数据仓库
,还是作为存储
批
/
流
查询结果的数据库?
浏览 1
提问于2017-07-20
得票数 3
回答已采纳
1
回答
为什么火花结构化
流
是理想的实时操作?
、
、
我想构建一个实时应用程序,但我不知道我应该使用星火
流
还是星火结构化
流
。有人能解释一下吗?
浏览 3
提问于2020-04-27
得票数 0
回答已采纳
1
回答
表与视图SQL Server的性能比较
、
、
我在一个
数据仓库
中工作,该
数据仓库
有一个非常大的事务性数据表(数亿行)。
浏览 18
提问于2017-08-31
得票数 1
1
回答
如何在
数据仓库
中对分期数据进行建模
、
、
我们有大约200个文件从客户端进入我们的
数据仓库
定期的基础上。
浏览 2
提问于2014-03-17
得票数 0
1
回答
ssis向上插入10^8行-批处理?
、
、
、
我必须从各种SQL Server表(大约3亿行)收集大量数据,并将它们插入
数据仓库
中的单个事实表中。2/ 这是一种通过
批
导入的好做法吗?一
批
应该有多大?
浏览 0
提问于2014-08-08
得票数 1
回答已采纳
6
回答
Java 8 lambda:将集合转换为元素的映射,迭代位置
、
、
、
在JDK8中有没有包含
流
和收集器的
一体机
?
浏览 1
提问于2014-07-30
得票数 9
1
回答
当
流
不重要时
、
在这个项目中,
流
功能不是那么重要。对~(90) is数据进行批量分析是最重要的。稍后,我将在数据分析中应用ML和数据挖掘。顺便说一下,我读过。这不能给我一个好的答案。 更新,2018年4月,:我们最终选择了火花。
浏览 5
提问于2017-05-19
得票数 3
回答已采纳
2
回答
如何检查sql查询是否具有确定性?
、
、
我所说的确定性是指查询将始终返回完全相同的结果集。有没有办法做到这一点?
浏览 1
提问于2010-07-08
得票数 2
1
回答
从批处理顺序Mule ESB调用
流
、
、
我创建了一个批处理
流
。从一
批
流
,我调用另一
批
,从第二
批
,我调用简单的第三
流
。我需要第三次流动的选择应该是完整的,然后,只有2条记录应
浏览 1
提问于2017-04-05
得票数 1
1
回答
在ETL中是否有将表空间配额分配给不同层的一般准则?
我正在寻找任何将表空间配额分配给
数据仓库
ETL
流
中的不同层/模式的通用指南(占每个层总空间的%)。根据我的研究,ETL
流
可以由
数据仓库
的4层组成:谢谢,
浏览 0
提问于2020-05-12
得票数 0
回答已采纳
1
回答
Postgres
流
和逻辑复制
目前,我们正在使用postgres
流
复制来同步/复制主服务器和副本服务器上的数据库。我们计划使用其中一个应用程序将数据从辅助服务器或副本服务器同步到我们的
数据仓库
,该
数据仓库
需要启用逻辑复制才能跟踪更改并将数据从副本服务器同步到
数据仓库
。我们能否在
流
复制的基础上启用逻辑复制?
浏览 17
提问于2020-12-19
得票数 0
1
回答
tensorflow验证监视器
流
auc
、
在tensorflow验证监视器
流
auc中,它对流意味着什么?案例1:每次调用验证监视器时,都会重置auc状态,因为在每个验证步骤中,对10个
批
进行
流
处理。案例2: auc状态没有重置,因此
流
auc是从验证监视器的第一次调用中计算出来的。即,第一输出( 100步)从10
批
计算,第二验证输出( 200步骤)基于第
浏览 5
提问于2017-06-09
得票数 1
回答已采纳
1
回答
从检索分区/
批
、
、
我需要从一个大
数据仓库
收集分区/
批
,这样我就可以迭代地将它们输入到一个神经网络中。 我的想法是: 1)对数据进行分区,2)迭代收集每个分区,3)用toPandas()转换收集的分区。
浏览 0
提问于2018-02-14
得票数 4
回答已采纳
1
回答
对Azure表中存储的数据执行高级查询(DW?先生?)
、
、
也许是通过在他们的
数据仓库
产品中加载数据,或者通过一些Map Reduce查询?此外,如果上述情况是可能的,我们也在考虑在
数据仓库
中以微
批
的方式摄取数据,以确保我们有一个相对较新的副本,而不必加载大量的批次。这是Azure支持的东西吗? 谢谢
浏览 1
提问于2016-03-07
得票数 0
1
回答
反转(或撤消)对仓库事实表的大量加载
目前,我们计划为我们加载的每一
批
事实记录一个“
批
id”。这样,我们就可以在发现问题的情况下退出负载。看起来维度行有不同的规则。删除该
批
事实。解决问题。重新加载事实。好了。我们的ETL工具完全是自主开发的Python应用程序。
浏览 6
提问于2009-01-07
得票数 0
回答已采纳
1
回答
从本地MySQL到Azure Synapse
数据仓库
的数据提取与转换
、
、
、
、
我正在尝试在Azure Synapse建立一个演示
数据仓库
。我希望从本地MySQL数据库中提取数据,转换和聚合一些数据,并将其存储在中的实际-/维度表中。目前,我有一个Azure SQL
数据仓库
和数据工厂的实例。我在dataset中创建了到我的MySQL数据库的连接,我的想法是,我可以使用这个连接器作为一个新数据
流
的输入,它转换数据集并将其存储到我的目标数据集,该数据集链接到我的Azure Synapse
数据仓库
问题是,Database只是支持一些Azure服务,如Azure Database或Azure SQL
浏览 2
提问于2020-04-13
得票数 1
回答已采纳
1
回答
将数据流管道的输出写入已分区的目标
、
我们有一个
流
事件源,每秒有数千个事件,这些事件都用一个id标记,标识事件属于我们数万个客户中的哪一个。我们希望使用此事件源来填充
数据仓库
(在
流
模式下),但是,我们的事件源不是持久的,因此我们还希望将原始数据归档到GCS中,以便在需要进行更改时可以通过
数据仓库
管道重放它。在数据
流
中解决这个问题的最简单方法是什么?目前,我们正在GCS/BigQuery上创建一个带有自定义接收器的数据
流
作业,将数据写入到每个客户的文件中,这合理吗?
浏览 1
提问于2016-01-15
得票数 8
1
回答
使用SSIS加载XML
对于第3点,我已经开始使用控制
流
面中的ForEach循环容器控件,来循环每个XML节点,以及SQL任务。但是,这需要每次查找时调用数据库,并调用文件系统来为“坏”和“好”记录编写XML文件。我相信,使用数据
流
表面上的查找控件可以获得更好的性能。不幸的是,我没有使用数据
流
面的经验。 有人对解决这个问题的最佳方法有什么建议吗?
浏览 3
提问于2009-12-22
得票数 0
回答已采纳
1
回答
SSIS:如何从第一个数据库查询I,然后在第二个数据库/
数据仓库
中选择只有这些I的数据?
SSIS:如何从第一个数据库查询I,然后在第二个数据库/
数据仓库
中选择只有这些I的数据?在第二个数据库/
数据仓库
中,我只需要12,000行数据,但问题是它有3M+行。
浏览 3
提问于2021-04-17
得票数 0
2
回答
对于报告平台,应该选择纱线集群还是纱线客户端?
、
、
() 星星之火--因为蜂巢更像是一
批
处理,蜂巢上的火花会加快速度。
浏览 1
提问于2015-11-19
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
这软件,让人直呼:流批!
数据仓库系统建设中的工作流及优化
诈尸更新,时隔6年还是流批!
吾爱3年前的作品,依旧流批!
Flink on Hive构建流批一体数仓
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券