腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3009)
视频
沙龙
1
回答
读取
CSV
并
加
载到
PostgreSQL
的
气流
管道
、
、
因此,我正在尝试编写一个airflow Dag,以便1)从本地桌面
读取
几个不同
的
PostgresQL
,2)创建不同
的
CSV
表,3)将文件加
载到
各自
的
表中。当我运行DAG时,第二步似乎失败了。逻辑运算符代码: AIRFLOW_HOME = os.getenv('AIRFLOW_HOME') listings = pd.read_
csv
= pd.read_
csv</e
浏览 21
提问于2021-05-11
得票数 0
2
回答
如何将数据从Excel文件导入
PostgreSQL
?
、
我检查了一些链接如何将数据从excel文件加
载到
PostgreSQL
表中。解决办法如下: 将excel保存到.
CSV
文件
并
使用.
CSV
命令。使用脚本
读取
并
插入数据到
Postgresql
.。由于excel文件
的
格式,我无法将它保存为
CSV
文件。我们是否有内置
的
函数
PostgreSQL
来
读取
excel文件中
的
数据?
浏览 8
提问于2019-12-24
得票数 0
1
回答
皮亚罗
的
拼花档案,还是只为熊猫?
、
、
我一直在测试Azure上
的
地板文件,而不是将数据加
载到
PostgreSQL
表中,因为我对熊猫做了很多提取/转换步骤,并且可能很快就会发现火花。最终,我将存储原始文件(
csv
、json和xlsx)。我用熊猫或pyarrow阅读了这些文件,添加了一些元数据列,然后保存了一个经过改进/转换
的
拼花文件(星火风味,快速压缩)。然后,我用pyarrow (可能最终是Spark )
读取
这些转换后
的
文件,
并
执行一些聚合或其他
的
可视
浏览 1
提问于2019-09-15
得票数 3
2
回答
将压缩
的
CSV
(filename.
csv
.gz)文件加
载到
PostgreSQL
表中
如何加载大量
的
csv
.gz文件到
Postgresql
而不解压到
csv
文件,因为我尝试
管道
命令(mkfifo ),但它对我不起作用。有没有其他
的
解决方案来解决这个问题?我尝试使用以下命令将其从本地加
载到
postgresql
: zcat file.
csv
.gz | psql -U用户名-d数据库;需要:我想加载一个大尺寸
的
csv
.gz (大约15+GB)文件从centos到
p
浏览 5
提问于2018-09-04
得票数 4
2
回答
如何利用
气流
进行实时数据处理
、
我有一个场景,我希望处理
csv
文件
并
加
载到
其他数据库: 我们必须通过python脚本选择这些
csv
文件并进行处
浏览 0
提问于2018-02-26
得票数 0
4
回答
为什么我
的
气流
任务排队但不运行?
、
、
、
我是新
的
气流
,
并
试图设置
气流
运行ETL
管道
。我能安装 sql_alchemy_conn =
postgresql</e
浏览 13
提问于2017-04-20
得票数 10
1
回答
postgresql
文件导入
、
当我试图将
csv
文件加
载到
postgresql
中时。我使用以下命令。,); DELIMITER ','
CSV
HEADER; 然后我得到以下错误。错误:无法打开用于
读取
的</em
浏览 1
提问于2016-02-08
得票数 0
3
回答
通过
气流
更新SQL数据库中
的
大量数据
、
、
、
我在CloudSQL中有一个大表,需要每小时更新一次,我正在考虑将
气流
作为一种潜在
的
解决方案。从
气流
中更新CloudSQL数据库中大量数据
的
最佳方法是什么?我
的
一些想法是: 在内存中加载数据,将其分解为块,
并
运行一个多线程进程
浏览 0
提问于2019-07-31
得票数 0
1
回答
数据
管道
-从网络驱动器
读取
数据
的
最佳方法
、
、
、
、
源:位于共享驱动器中
的
CSV
文件(在Prem服务器上)。使用安全组控制对此共享驱动器和文件夹
的
访问。 将这些数据加
载到
GBQ表
的
最佳方
浏览 4
提问于2022-10-09
得票数 3
2
回答
如何将熊猫数据传递给
气流
任务
、
、
、
我正在学习如何使用
气流
建造机器学习
管道
。from datetime import datetimeimport numpy as np import lightgbmcatchup=False, tags=['
浏览 0
提问于2021-11-06
得票数 7
回答已采纳
1
回答
历史共同基金
我想在我
的
数据库中获取印度共同基金
的
历史数据,有没有办法做到这一点,而不必单独下载所有基金
的
数据。我试着从AMFI网站下载数据,但是数据太大了,每一只基金都要花很多时间才能把数据直接放到我
的
数据库中。
浏览 4
提问于2022-11-11
得票数 0
1
回答
Out-使用特定格式/信息归档
csv
、
、
我很难理解如何获取json中每个对象
的
两个“属性”,并将它们输出到
csv
中。这两个属性是"name“和"jobtitle”,我想应该有一种方法来提取它们。
浏览 18
提问于2016-09-14
得票数 0
回答已采纳
4
回答
Amazon :在数据库之间复制数据
、
、
、
、
我希望在Amazon上
的
数据库中复制数据。在此之前,为了分析目的,我将数据从Redshift数据库复制到托管在EC2实例上
的
EC2。我有一个ruby脚本,可以使用dblink扩展来完成它。但是现在由于数据在
PostgreSQL
实例上是不可管理
的
,我们已经决定将数据复制到一个单独
的
数据库中,在同一个Redshift集群中。如果没有其他方法,我应该使用数据
管
浏览 9
提问于2015-06-01
得票数 6
回答已采纳
1
回答
如何使用处理数百万MongoDB记录并将其插入Postgres
、
、
、
我需要处理来自MongoDb
的
数百万条记录,并将一个ETL
管道
插入到
PostgreSQL
数据库中。但是,在我尝试过
的
所有方法中,我总是得到内存堆空间异常。我已经试过了- 尝试使用tMongoDBInput连接到MongoDB,
并
放置一个tMap来处理记录,
并
使用到
PostgreSQL
的
连接输出记录。tMap无法处理这件事。试图将数据加
载到
JSON文件中,然后从文件中
读取
到
PostgreSQL
。数据被
浏览 2
提问于2020-11-16
得票数 0
1
回答
BigQuery到GCS和GCS到Mysql
、
我正在创建一个
气流
管道
,其中我使用BigQueryOperator查询我
的
BigQuery表,
并
使用BigQueryToCloudStorageOperator将结果表导出为GCS。我需要将
csv
移动到mysql数据库,在那里它应该作为表存储在mysql数据库中。 我能得到任何关于如何实现这一点
的
建议或想法吗?谢谢!
浏览 1
提问于2021-02-05
得票数 0
1
回答
使用Apache
气流
编辑存储在AWS S3中
的
CSV
,无需下载
、
、
、
、
我有一个需要大量
CSV
数据定期转换
的
项目。这些数据将存储在S3中,我使用运行UbuntuServer16.04
的
EC2实例对数据执行编辑,
并
使用Apache
气流
对数据进行路由。下载这些数据并将其重新上传到S3非常昂贵,有什么方法可以在内存中编辑这些
CSV
数据而不将文件下
载到
Ubuntu实例上
的
本地存储中? 提前谢谢你
浏览 2
提问于2019-11-20
得票数 1
回答已采纳
2
回答
将
CSV
数据加
载到
PostgreSQL
表中
、
、
将数据加
载到
数据库中
的
表(在中)
的
最佳方法是什么? 上下文:我正在处理 (ETL) -提取平面文件
并
生成(
csv
的
类似表)。我希望将
CSV
文件加
载到
PostgreSQL
表中。
浏览 4
提问于2015-03-02
得票数 1
回答已采纳
1
回答
Pyspark :
读取
带有双引号和逗号字段
的
csv
文件
我有一个
csv
文件,我正在通过pyspark
读取
并
加
载到
postgresql
中。它
的
一个字段包含字符串,字符串中包含coma和双引号。就像下面的例子- 1.这会引起问题,因为当我将数据加
载到
postgresql
中时,它会将值/列混为一谈,并且脚本失败。 1. '\"RACER \"\"K\"\"' 2. '\"JENIS, B. S.\"\&q
浏览 105
提问于2020-08-27
得票数 0
2
回答
在数据流批处理-作业步骤完成后运行函数
、
我有一个数据流作业,它有一个扇形
的
步骤,每个步骤都将结果写入GCS上
的
一个不同
的
文件夹。在批处理作业执行期间,每个文件夹都会写入数百个文件。我想确定何时完成FileIO步骤,以便运行将文件夹
的
全部内容加
载到
BigQuery表
的
java代码。我知道我可以用completion和PubSub通知来完成每个编写
的
文件,但我更喜欢在完成整个文件夹时才这样做一次。 谢谢!
浏览 4
提问于2020-05-25
得票数 0
回答已采纳
1
回答
用JSON处理
CSV
文件中
的
变量字段?
、
、
、
、
我试图找出将
CSV
文件导入
PostgreSQL
的
工程。要求:
CSV
文件有Y个动态字段TenantCode,DomainCode,PersonCode,ExtraField1,ExtraField2,ExtraFieldN"CUST1","C0001","Donald","Duck","M“ "CUST1","C0002&quo
浏览 0
提问于2018-08-16
得票数 2
点击加载更多
相关
资讯
实训课 KNIME数据库操作
卓象程序员:电子表格导入PhpSpreadsheet
灵活强大:iObjects Java for Spark模块扩展开发
一个Python大数据处理利器:PySpark入门指南
利用Python字典实现CSV数据的高效统计与分析
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券