腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >对于col_a中的每个不同值，生成一个新表

问对于col_a中的每个不同值，生成一个新表
EN

Stack Overflow用户

提问于 2020-02-12 21:47:06

回答 1查看 223关注 0票数 1

我在S3中有一个雅典娜数据表，它充当源表，列为id、name、event。对于该表中的每个唯一name值，我希望输出一个新表，其中包含与该name值相对应的所有行，并将其保存到S3中的不同存储桶中。这将导致存储在S3中的n个新文件，其中n也是源表中唯一的name值的数目。

我尝试过使用PARTITION BY和CTAS查询Lambda中的单个雅典娜查询，但似乎无法得到我想要的结果。看起来AWS Glue可能能够得到我预期的结果，但我在网上读到它更昂贵，也许我可以使用Lambda获得我的预期结果。

如何存储一个新文件(最好是JSON格式)，其中包含与每个唯一的name 对应的行( S3? )

最好是每天运行一次，以更新name存储的数据，但目前主要关注的是上面的问题。

amazon-s3

aws-lambda

aws-glue

amazon-athena

amazon-web-services

智慧园区场景解决方案

基于腾讯孪生平台物联网平台能力、视频AI智能分析能力和3D可视化云渲染等产品能力，提供完整的智慧园区方案

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-02-25 01:51:49

当您编写星火/胶水代码时，需要使用name列对数据进行分区。但是，这将导致具有以下格式的路径

S3://桶名/文件夹/name=value/file.json

这将为每个名称值提供一组单独的文件，但如果您想作为一个单独的表访问该文件，则在抓取数据并通过雅典娜提供数据之前，您可能需要从键中去掉该=签名。

如果您确实使用lambda，则操作包括遍历数据，类似于glue所做的操作，并对数据进行分区。

我想这一切都取决于它需要处理的数据量。胶水，如果使用火花可能会有一点额外的启动时间。胶水蟒壳有较好的启动时间。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/60201185

复制

python_文件的打开和关闭

node.js 编程算法

文件对象 = open('文件名','使用方式') rt：读取一个txt文件 wt: 只写打开一个txt文件，（如果没有该文件则新建该文件）会覆盖原有内容 at：打开一个txt文件，并从文件指针位置追加写内容（文件指针默认在末尾）文件操作错误属于：I/O异常通常的异常：

Mirror王宇阳

2020/11/10

1.5K0

MySQL是如何打开和关闭表？

缓存数据库云数据库 SQL Server sql 编程算法

当我们在执行mysqladmin status 命令或连接通过mysql客户端连接到实例后，执行\s的时候，应该看到类似以下的内容：

SEian.G

2021/07/29

3.6K0

c语言文件介绍，打开和关闭操作

fopen 指针

文件基本概念文件指针打开文件 fopen（“文件路径”，打开方式）; 文件路径：打开文件：关闭文件 fclose(文件指针);

大忽悠爱学习

2021/03/02

1.3K0

vim打开多个文件、同时显示多个文件、在文件之间切换打开多个文件：

ide javascript

1.vim还没有启动的时候：在终端里输入 vim file1 file2 ... filen便可以打开所有想要打开的文件 2.vim已经启动输入 :open file 可以再打开一个文件，并且此时vim里会显示出file文件的内容。

sunsky

2020/08/19

15.4K0

文件的打开与关闭

eof file fopen stdio txt

使用完一个文件后应该关闭它，以防止程序对文件误操作而导致出错。文件关闭是指撤销文件信息区和文件缓冲区，使文件指针变量不再指向该文件。

pigeon

2022/04/11

1.3K0

10.2 打开与关闭文件

编程算法

例如：fopen（“a1”，“r”），表示要打开名字为“a1”的文件，使用文件方式为“读入”。

小林C语言

2019/07/12

7460

正常的工作流程

git 人工智能

修改文件，将它们更新的内容添加到索引中。 $ git add file1 file2 file3 你现在为commit做好了准备，你可以使用git diff命令再加上–cached参数，看看哪些文件将被提交(commit)。 (如果没有–cached参数，git diff会显示当前你所有已做的但没有加入到索引里的修改。)你也可以使用git status命令来获得当前项目的一个状况。

用户3004328

2018/09/06

7600

检测网页是否正常打开原

http

import urllib.request import time opener = urllib.request.build_opener() opener.addheaders = [('User-agent', 'Mozilla/49.0.2')] #这个是你放网址的文件名，改过来就可以了 # file = open('test.txt') # lines = file.readlines() aa=['http://www.jd.com/','http

双面人

2019/04/10

1.5K0

Bootstrap 基于Bootstrap和JQuery实现动态打开和关闭tab页

bootstrap jquery 编程算法

$("#tab-a-" + options.menuID).click(); // 选中打开的tab

授客

2019/08/21

7.9K1

tomcat无法正常关闭问题分析及解决

bash 指令 bash bootstrap tomcat servlet

这时我们就只能通过强制杀死进程的方式停止Tomcat了：kill -9 <tomcat_process_id>。那么，为什么使用shutdown.sh无法正常停止Tomcat进程呢？

编程随笔

2019/09/11

2.3K0

C语言 | 文件打开关闭

c 语言编程算法

这道理放在C语言学习上也一并受用。在编程方面有着天赋异禀的人毕竟是少数，我们大多数人想要从C语言小白进阶到高手，需要经历的是日积月累的学习。

小林C语言

2021/05/28

1.3K0

C语言 | 文件打开关闭

c 语言 c++

用“r”方式打开的文件只能用于向计算机输入而不能用作向该文件输出数据，而且该文件应该已经存在，并存有数据，这样程序才能从文件中读数据。

小林C语言

2021/05/13

1.6K0

Apache编译后无法正常工作

apache 打包缓存 linux

因为某个场景的需求，要在一个国产系统Rocky4.2(国产凝思4.2操作系统)上安装Apache，虽说此系统是基于Redhat 5.8开发的，但是发现yum安装源包管理，RPM命令倒是能用，但是底层依赖完全没有，这就尴尬了，so，只能源码编译安装了。

后场技术

2020/09/03

2.8K0

Kubernetes 终止信号：确保应用程序正常关闭

容器 kubernetes 连接数据网络

在容器编排领域，Kubernetes 已成为领先的平台，可实现容器化应用程序的高效管理、扩展和部署。当应用程序在容器内运行时，正确终止这些容器对于维持系统的整体健康和可靠性至关重要。在本文中，我们将深入研究 Kubernetes 终止信号的概念，并了解它们如何确保应用程序正常关闭，避免数据丢失或用户体验中断。

DevOps云学堂

2023/09/11

6330

10.2 C语言打开与关闭文件

c 语言编程算法

例如：fopen（“a1”，“r”），表示要打开名字为“a1”的文件，使用文件方式为“读入”。

小林C语言

2020/12/08

1.4K0

完美解决Hadoop集群无法正常关闭的问题!

bash 指令 bash hadoop node.js

相信对于大部分的大数据初学者来说，一定遇见过hadoop集群无法正常关闭的情况。有时候当我们更改了hadoop内组件的配置文件后，必须要通过重启集群来使配置文件生效。但往往一stop-all.sh,集群下方总会出现下面的提示：

大数据梦想家

2021/01/27

1.9K0

VSC不能同时打开多个文件

json settings shift

通过ctrl+shift+p 获取查找框，查询 settings.json 新增或修改： { // 控制通过 Quick Open 打开的编辑器是否显示为预览编辑器。预览编辑器不会保持打开状态，在将其显式设置为保持打开(例如通过双击或编辑)前将会重复使用。当 "#workbench.editor.enablePreview#" 处于禁用状态时，将忽略此值。 "workbench.editor.enablePreviewFromQuickOpen": false, "workbench.editor.en

手撕代码八百里

2022/05/10

1.7K0

页面打开时div从右侧进入原

css

页面未加载时，用transform:translateX(100%);把div定位到右边隐藏，当页面加载的时候，增加in class,

tianyawhl

2019/04/04

1.1K0

IntelliJ IDEA同时打开多个窗口

apply file project settings window

1、点击File->Settings 2、点击open new project in new window选项 3、点击Apply即可

别团等shy哥发育

2023/02/25

6.6K0

点击加载更多

相似问题

切换jQuery div以打开和关闭不能正常工作的

每页多个图库-几乎可以正常工作

Imageshack API几乎正常工作

JQuery -多个div独立打开/关闭

actionscript打开/关闭声音不能正常工作

活动推荐

玩转EdgeOne Pages有奖征集

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例