腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
数据摄入之前、期间或之后的数据清理?
、
、
我正在用Python构建一个独立的数据
分析
项目。由于该项目需要可扩展,它需要一个相当坚实的
数据处理
和
分析
管道。这条管道目前看起来有点像这样:数据源--> ingest ->存储在postgreSQL DB ->
数据处理
层-->
分析
环境中。我已经编写了Pandas代码来清理
数据处理
层中的数据--但我不确定当数据从数据库中提取到
分析
环境中时,清理数据是否是最佳实践。特别是当每次数据被提取时,
数据处理
将被重复。我应该处理摄取层中的数据
浏览 3
提问于2022-05-13
得票数 1
回答已采纳
1
回答
工作线程中的多移动操作和数据进程
、
主线程->启动工作线程->开始阶段(获取
数据处理
位置列表)>移到一个位置->数据采样->数据收集->数据
分析
提前感谢!
浏览 2
提问于2010-04-06
得票数 1
2
回答
我们可以使用Hadoop MapReduce进行实时
数据处理
吗?
、
、
、
但是我想知道是否有任何方法可以使用hadoop MapReduce作为实时
数据处理
的例子,比如实时结果,实时tweet。 如果不是,实时
数据处理
或
分析
的替代方案是什么?
浏览 0
提问于2018-12-18
得票数 2
回答已采纳
1
回答
ESRI提供了谷歌BigQuery无法提供的功能,以及如何将这两种工具结合使用?
、
、
、
目前,我正在寻找支持大数据地球空间
分析
的大数据技术。我来到ESRI,发现它主要支持地球空间数据
分析
和可视化。然而,目前,除了需要许可的ArcGIS GeoAnalytics服务器之外,它们还没有对大数据地理空间
分析
的广泛支持。同时,我发现Google BigQuery是多么强大,它最近提供了对地理空间处理和
分析
的支持(为您使用的东西付费,每秒)。 我想知道的是:我应该选择哪个工具进行地理空间大
数据处理
、
分析
和可视化?请注意,我刚刚开始了对地理空间大
数据处理
的研究,我想在
浏览 5
提问于2019-10-28
得票数 0
回答已采纳
1
回答
Google
分析
没有在任何仪表板上显示任何数据。
我对谷歌
分析
很陌生。我用它来了解一个网站的性能指标,这个网站不是我的。我被指派去
分析
那个网站的性能指标。我现在非常困惑,因为我认为简单的登录和放置链接url就足以让google
分析
人员向我展示数据的仪表板,我在每个教程中都看到了,当他们打开google
分析
时,它会向他们展示带有数据的仪表板(不是空白仪表板
浏览 3
提问于2020-06-26
得票数 0
回答已采纳
1
回答
领域
分析
与系统
分析
我试图确定系统
分析
和领域
分析
之间的区别。似乎任何系统
分析
都发生在某个领域内--那么,是否有领域
分析
人员会使用的技术、概念、工具等,而系统
分析
人员则不会使用?
浏览 0
提问于2015-01-21
得票数 0
回答已采纳
3
回答
基于HBase的配置单元可实现深度
分析
查询
、
、
、
、
此接口是否可用于大型
分析
数据处理
?
浏览 0
提问于2018-05-24
得票数 1
1
回答
如何将专用SQL池(DW)迁移到无服务器Synapse?
、
( A)如何获取信息上个月发生了多少
数据处理
来
分析
成本?( B)如何对Serverless进行迁移?
浏览 0
提问于2021-01-04
得票数 0
1
回答
谷歌
分析
数据处理
时区
哪个时区使用来处理
分析
数据?我知道处理延迟是24到48小时,但我不知道如何计算数据何时可用。 谢谢
浏览 3
提问于2014-08-06
得票数 0
回答已采纳
1
回答
从傀儡代码中分离数据的最佳方法
、
我的网站是存储一些主机特定的信息在工头作为智能变量。我想将所有这些信息合并到可读的木偶文件中,并对它们进行版本控制。实现这一目标的最佳途径是什么?几乎3岁。从那以后有什么变化吗?
浏览 3
提问于2014-09-02
得票数 0
回答已采纳
2
回答
用于数据
分析
和学习的Python包建议
、
、
、
、
我想在文章发布平台之上构建一个
分析
引擎。更具体地说,我想跟踪用户的阅读行为(例如,文章的浏览数量、开放文章的时间、评分等),以及文章本身的统计数据(如段落数、作者数等)。这将有两个目的: 关于如何将所有这些都整合在一起,以及可以帮助我解决的酷python项目,有什么建议吗?如果我需要提供更多的信息,请告诉我。 谢谢
浏览 4
提问于2012-09-14
得票数 2
回答已采纳
1
回答
我是否可以运行Hadoop onflow (在应用程序运行时运行map还原)
、
我们能在流上使用hadoop生成输出吗?我有一个由日志和预约id组成的大文件,如果我使用传统的RDBMS,我可以得到预约id,但需要1或2个小时。On意味着在管理员登录到系统时显示此约会id。我是否可以运行Hadoop onflow (在应用程序运行时运行map还原)
浏览 4
提问于2013-10-25
得票数 0
回答已采纳
1
回答
在AppDomain.CurrentDomain.SetData连接字符串中设置数据库位置
、
、
我已经了解了如何使用连接字符串中的|DataDirectory|来设置wpf应用程序数据库文件所在的目录,但我希望更进一步。 换句话说,我的连接字符串将从这个开始: connectionString="Data Source='|D
浏览 1
提问于2013-09-17
得票数 0
回答已采纳
2
回答
释放内存后,进程的RES内存会下降吗?
、
、
、
、
当
数据处理
速度慢时,我看到RES内存增长;但是在所有
数据处理
完之后,RES会下降,但不会返回到原来的RES值(即使在等待超过10分钟之后)。例如10 MB (原始) => 50 MB (峰值) => 30 MB(在释放所有数据之后) 我已经使用valgrind和massif来
分析
内存,看起来所有的数据都被释放了。
浏览 7
提问于2017-11-27
得票数 1
回答已采纳
2
回答
在R包中包含和访问空间数据
、
、
我正在重写一些R脚本,将空间
数据处理
并
分析
到一个包中,以便更容易地共享。最初,我只是将所有光栅数据/etc保存到我的工作目录中,每次我想使用“堆栈”或“光栅”进行
分析
时,都会将它从那里加载到脚本中。
浏览 5
提问于2020-04-20
得票数 0
回答已采纳
2
回答
使用Python生成演示文稿
、
、
、
我正在从事
数据处理
工作,并希望直接从Python生成一些数据
分析
的PowerPoint或OpenOffice印象深刻的演示文稿。有没有什么库可以让Python做到这一点?我使用的是Unix环境。
浏览 2
提问于2012-06-26
得票数 3
回答已采纳
1
回答
使用Grafana
分析
/处理来自OpenTSDB的数据
、
、
现在,我想执行某些
分析
/
数据处理
来计算测试结果。有没有办法做到这一点?在这种情况下,grafana插件能帮上忙吗?
浏览 0
提问于2017-05-09
得票数 0
1
回答
培训样本的观察是否需要独立?
我正在为分类问题建立一个训练集。我有一个选择,我可以在其中构建一个数据集,其中我的每个主题(客户)可以有多个观察/行,或者我可以有一个观察每个主题。当从不同的时间窗口进行观测时,每个主题都有可能进行多次观测。 我的问题是:在训练数据集中保留多个观察对象是否违反了观测的独立性?因为假设对于一个主题的相同特性的两个度量可以来自两个不同但重叠的时间窗口。
浏览 0
提问于2022-11-07
得票数 0
1
回答
是否可以使用spark的jdbc驱动程序将apache spark与jasper集成?
、
、
、
我们想使用apache spark进行实时
分析
吗?我们目前使用hive/MR进行
数据处理
,使用mysqlsql存储聚合结果,并使用jasper报告进行
分析
?
浏览 1
提问于2015-02-21
得票数 2
2
回答
Azure用于流
分析
的良好架构?
、
、
1.尝试使用c#代码处理流
分析
中的数据,我知道.Net支持天青流
分析
,但我认为还为时过早?有这种方法的经验吗? azure流
分析
是否支持复杂的c#算法?2.将数据存储到azure数据湖并使用数据湖
分析
来处理数据? 非常感谢您的经验和建议。非常感谢
浏览 0
提问于2017-07-05
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据处理 主成分分析法
《轨迹大数据处理及分析软件》更新了
Excel数据处理:并购协同效应分析
数据处理时代,绕不开的数据分析
Pandas,数据处理与分析的得力助手!
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券