首页
学习
活动
专区
圈层
工具
发布

GCP 上的人工智能实用指南:第一、二部分

在 Bigtable 中设计表格时,最重要的事情是行键列。 仅基于此列,数据将在表中均匀分布,并且用户在读取数据时将获得优化的性能。 如果行键列的数据倾斜,则将发生热点。...例如,如果行键是表中的一个城市,并且数据仅针对一个城市倾斜,那么数据将不会均匀分布,并且读取也不会得到优化。...通过单击存储桶,将训练和测试数据上传到各自的存储桶,然后使用上载文件选项或将文件拖放到存储桶中。...接下来,按照以下步骤从 Cloud Storage 存储桶中的可用数据创建Leads_Training和Leads_Test表: 单击左侧面板中项目中的 Leads 数据集。...将笔记本的结果(所有单元格都已预先计算)上载到 Cloud Storage 存储桶,在本例中为gs://my-bucket/。 每个单元执行后,Papermill 发出一个保存。

19.7K10

GCP 上的人工智能实用指南:第三、四部分

它可以使用存储在某些外部存储(例如 Google Cloud 存储桶)中的模型,也可以使用通过 Google Cloud AI 平台进行部署的模型。...如果操作依赖于外部初始化文件(例如词汇表),则 SavedModel 将使用资产。 资产被复制到 SavedModel 目录,并在加载特定的元图定义时读取。...)] 图 9.16:GCP 控制台–存储和浏览 从控制台菜单中,我们需要导航到“存储”部分,然后单击“浏览器”部分以找到存储在存储桶中的所有数据文件。...提供详细信息后,GCP 提供了一个简单的界面来查看每月成本估计,以获取并保存正在创建的存储桶中的数据。 这有助于在创建存储桶时根据用例和应用的上下文选择适当的选项。...例如,如果您的模型版本需要从特定的 Google Cloud 项目访问云存储存储桶,则可以定义具有该存储桶读取权限的服务帐户。

8.7K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    隐藏云 API 的细节,SQL 让这一切变简单

    强大的扩展插件包括用于地理空间数据的 PostGIS、用于在 Kafka 或 RabbitMQ 中复制数据的 pglogical,以及用于分布式操作和列存储的 Citus。...外部数据包装器(FDW)是 Postgres 的一个插件类别,用于为外部数据创建数据库表。Postgres 的绑定 postgres_fdw 支持跨本地和远程数据库的查询。...有了这个 SDK,插件开发者可以将精力放在核心的任务上,也就是将 API 结果映射到数据库表。 这些映射可以是一对一的。例如,aws_ec2_instance 表与底层 REST API 相匹配。...在其他情况下需要构建合并了多个 API 的表。例如,为了构建完整的 S3 桶的视图,需要连接核心 S3 API 与 ACL、策略、复制、标签、版本控制等子 API。...它的工作原理与 AWS 一样:调用 API,将结果放入 外部数据库表 中,这样你就可以将精力放在解决方案的逻辑上。 只是此时的逻辑略有不同。

    5K30

    Apache Hudi 0.11.0版本重磅发布!

    多模式索引 在 0.11.0 中,我们默认为 Spark writer 启用具有同步更新的元数据表和基于元数据表的file listing,以提高在大型 Hudi 表上的分区和文件 listing 的性能...索引器在时间线上添加一个名为“indexing”的新action。虽然索引过程本身是异步的并且对写入者来说是非阻塞的,但需要配置锁提供程序以安全地协调运行中的写入者进程。...Google BigQuery集成 在 0.11.0 中,Hudi 表可以作为外部表从 BigQuery 中查询。...Bucket 索引 0.11.0增加了一种高效、轻量级的索引类型Bucket index。它使用基于记录键的散列函数将记录分配到存储桶,其中每个存储桶对应于单个文件组。...更多详情请在配置页面中参考hoodie.bucket.index.*。 保存点和恢复 灾难恢复是任何生产部署中的关键特性。尤其是在涉及存储数据的系统中。

    4.5K40

    每周云安全资讯-2022年第27周

    他们还可能进行了勒索攻击或永久删除照片、文档等 https://threatpost.com/exposed-amazon-photos/180105/ 4 你的GCP桶中有多少是可以公开访问的?...它可能比你想象的要多 通过本文,您可以全面了解 Google Cloud Platform (GCP) 的存储服务、如何访问存储桶以及如何确保按照预期配置存储桶 https://zone.huoxian.cn.../d/1298-gcp 5 公开云漏洞& 安全问题数据库 一个列出所有已知云漏洞和云服务提供商安全问题的开源项目 https://www.cloudvulndb.org/ 6 MEGA云存储服务加密可被攻破...ETH Zurich安全研究人员发现MEGA云存储服务中的关键安全问题,可被攻击者利用来打破用户数据的机密性和完整性 https://mp.weixin.qq.com/s/gf5haxOWqqRtYbgYiXtk_Q.../ 10 浅析 Istio:如何从网格中访问外部服务 在生产环境使用 Istio 的时候,可能最需要考虑的问题一个是安全问题一个是性能问题,在这里和大家一起探讨下一个安全问题,如何在 Istio 网格中访问外部服务

    97140

    云端迁移 - Evernote 基于Google 云平台的架构设计和技术转型(上)

    我们需要最大的灵活性,以确保在将3PB的数据迁移到GCP的过程中时,可以通过我们现有数据中心和物理负载均衡承担所有的用户流量,作为主接收站点,而所有后端Evernote服务都从GCP运行(反之,当需要CGP...此外,我们的内部网络的结构并不适用于将这么多的请求提供给外部服务(例如Google云端存储)。 鉴于当前的状况,上传我们的所有数据将需要一年多的时间,同时可能对我们的用户体验造成负面影响。...这些延迟是由于光速和原数据中心与GCP之间的物理距离的双重因素导致的。 显然,在我们的迁移过程中并不希望遇到这些问题, 为了尽量减少可能给客户带来的负面影响,我们决定先做测试。...Reco 服务(UDP -> PubSub) 当用户向Evernote添加附件或者参考资料的时候,如果是PDF 或者图片的话,GCP会尝试读取器中的文本信息。...在复制过程中,必须解决的第一个障碍是,我们当前的数据中心网络不是为每天在数千个节点上复制数百TB而设计的, 因此,需要时间来建立到GCP网络的多条安全出口路径。

    2.9K110

    Fortify软件安全内容 2023 更新 1

    :http://ASP.NET 配置错误:记录敏感信息云基础结构即代码 (IaC)IaC 是通过代码而不是各种手动过程来管理和配置计算机资源的过程。...其他勘误表在此版本中,已投入资源以确保我们可以减少误报问题的数量,重构一致性,并提高客户审核问题的能力。...其他勘误表在此版本中,我们投入了资源来进一步减少误报的数量,并提高客户审核问题的能力。...不良做法:BigQuery 缺少客户管理的加密密钥GCP 地形配置错误:BigQuery 缺少客户管理的加密密钥GCP Terraform 不良做法:云大表缺少客户管理的加密密钥GCP 地形配置错误:云大表缺少客户管理的加密密钥...:缺少红移加密AWS CloudFormation 配置错误:不安全的 Redshift 存储不安全的存储:缺少 S3 加密AWS Ansible 配置错误:不安全的 S3 存储桶存储不安全的存储:缺少

    9.9K30

    优步使用谷歌云平台实现大数据基础设施的现代化

    译者 | 张卫滨 策划 | 丁晓昀 最近,优步在其官方工程博客上发布了一篇 文章,阐述了将批数据分析和机器学习(ML)训练的技术栈迁移到 谷歌云平台(GCP) 的战略。...迁移计划的战略包括两个步骤,即初始迁移和利用云原生服务。优步的初始战略包括利用 GCP 的对象存储作为数据湖存储,同时将数据技术栈的其他部分迁移到 GCP 的基础设施即服务(IaaS)上。...迁移前和迁移后的优步批数据技术栈(图片来源:优步博客) 优步团队重点关注迁移过程中的数据桶映射和云资源布局。将 HDFS 文件和目录映射到一个或多个桶中的云对象至关重要。...他们需要在不同的粒度水平上应用 IAM 策略,同时要考虑对桶和对象的限制,比如读 / 写吞吐量和 IOPS 限流。...在迁移过程中,优步的数据访问代理会将查询和作业流量路由至这些基于云的集群,确保平稳迁移。 优步向谷歌云的大数据迁移将面临一些挑战,比如存储方面的性能差异和遗留系统所导致的难以预知的问题。

    50410

    ArcGIS中的Ortho Mapping模块(三)

    航空影像其内部方向(IO)与外部方向(EO)由照相机表与帧表描述,扫描航空影像的扫描方式和基准也影响内部方向。无人机影像方向信息作为元数据存在图像的EXIF 标头。 3....处理工作始终在图像的源分辨率下进行 - 先计算源图像中的连接点,然后根据计算的连接点执行三角测量。 无人机图像和扫描的航空图像通常质量较差,或无外部方向和粗略的 GPS 信息。...重新投影误差的定义:如果在重叠图像中识别连接点集,则可在区域网平差中计算对应点的 3D 坐标。然后将 3D 点重新投影到与之相交的所有图像上,重新投影的点和初始连接点之间的距离称为重新投影误差。...运行分析连接点工具 分析连接点 以生成 coverage 要素类和重叠面要素类;这些要素类将添加到 QA/QC数据实体并包含在图像检查器表中。...添加检测点:GCP 转换为检测点以进行精度评估,并不将其用作控制平差过程的输入。

    2K50

    每周云安全资讯-2022年第48周

    1 多租户AWS漏洞暴露账户资源 Amazon Web Services (AWS) 中存在一个多租户漏洞,可导致攻击者滥用 AWS AppSync 获得对组织机构账户中的资源。...https://mp.weixin.qq.com/s/MfDnEFPIN7RdRuVYt04lgg 3 谷歌云平台存储桶枚举与提权 云安全是一个极其重要的研究领域,对于这些云平台的用户来说,理解和接受它变得越来越重要...与竞争对手AWS相比,GCP安全是一个似乎未触及的研究领域。本文将对GCP下的存储桶枚举与提权技术进行介绍。...https://mp.weixin.qq.com/s/yYCHl5W5LEOE7t4oien1CQ 10 服务网格:管理对外部服务的访问 这篇文章就来为大家介绍如何使用服务网格的流量管理功能,来轻松管理外部服务的访问...团伙的勒索软件攻击,此次攻击事件泄露了500万乘客和所有雇员的个人数据。

    67840

    Tekton实现java项目部署到k8s的完整CICD流程

    使用 helm 部署应用,镜像参数使用前一步动态生成的值 在实际使用过程中,helm可能被设计的比较小,每个微服务单独一个,便于独立交付。...PipelineResource数据源 存放源码的git数据源 首先通过PipelineResource定义源代码的配置信息,存在在 gcp-git-resource.yaml 文件中 type 指定了类型为...执行的脚本内容是 helm upgrade --install --wait --values xxx.yaml .... params 指定了部署过程中用到的参数,可以通过外部传入,也可以使用 default...定义默认值 resources 字段定义了执行过程中用到的两个数据源 helm-git-repo:描述应用程序使用 helm 部署时的chart包的 git 存放地址 image-repo:镜像信息...中 resource 里面声明了一个 from,表明这里的输入数据源依赖 gcp-maven-kaniko-build 的输出数据源,因此会等待 gcp-maven-kaniko-build 执行完才开始执行

    2.8K20

    如何在 Google Cloud 上部署 EMQX 企业版

    您可以轻松地将 IoT Core 上的设备迁移到 EMQX Enterprise,然后继续与 GCP 中的数据服务无缝集成,实现快速迁移而不影响现有业务。...图片 2.找到创建的 VM instance,您可以看到 GCP 已经为它分配了一个唯一的外部 IP,单击 SSH 打开您的 SSH 终端。...在 GCP 上打开防火墙端口 在 GCP 上安装服务或应用程序后,您需要手动开放所需的端口才能够从外部访问它,请按照以下步骤在 GCP 上打开所需端口。...,您也可以配置从特定 IP 地址接收数据的规则 Protocols and ports: 如果要打开所有端口,请选择 Allow all。...在 Dashboard 上您可以轻松管理和监控 EMQX,管理设备列表,并配置安全、数据集成等各项功能。 写在最后 现在我们已经了解了如何在 GCP 上部署 EMQX 企业版。

    3.6K10

    Kro威力初显,Kubernetes资源编排的巨大飞跃

    从头开始开发此类控制器可能既复杂又耗时,需要对编码和 Kubernetes 内部结构有深入的专业知识。 这就是 kro 的用武之地。kro 通过提供基于配置的框架来简化此过程,从而无需自定义代码。...kro 适用于 任何 Kubernetes 资源,并且可以安装在 任何 Kubernetes 集群上。kro 专门与 Kubernetes API 交互,这意味着它不直接与任何外部 API 交互。...将应用程序部署到 Kubernetes 的开发人员必须在多个界面之间切换——一个用于部署到 Kubernetes,另一个用于请求云基础设施资源、配置数据库和配置块存储。...通过其基于配置的自定义 API 定义方法,kro 使组织能够创建标准化的、可重用的组件,从而提供以下好处: 提高开发人员速度: 平台团队可以将应用程序及其云资源依赖项打包到一个可部署的单元中,嵌入组织最佳实践并确保隐式的中心治理...简化数据和 MLOps 基础设施管理: 数据平台工程师可以将所有必需的组件打包到 kro RGD 中,包括云资源(如 GPU 节点、网络和存储),以及 Kubernetes 对象(如 StorageClasses

    72010

    【云存储前沿技术报告】-25.5

    支持在S3 Express One Zone中追加数据以及在AWS专用本地区域中的目录桶等功能。...Amazon S3 Storage Browser 7: 这是一个开源界面组件,供开发人员嵌入应用程序中,允许最终用户通过可配置的权限(只读、上传、下载、复制、删除)浏览S3存储桶中的数据。...,转变的底层逻辑是:处理海量数据过程面临的检索效率和可扩展性。...主要更新 (2025年5月及近期) PolarDB for MySQL 数据库与表恢复速度可配置 22: 用户可以选择恢复速度(快速、标准、安全),这将影响IOPS消耗。...背景与重要性: 减少了数据库模式演进过程中的停机时间和性能影响,通过最大限度地减少对大型表的破坏性、重I/O操作,间接使存储受益。

    39310

    Tekton实现java项目部署到k8s的完整CICD流程

    使用 helm 部署应用,镜像参数使用前一步动态生成的值 在实际使用过程中,helm可能被设计的比较小,每个微服务单独一个,便于独立交付。...定义源代码的配置信息,存在在 gcp-git-resource.yaml 文件中 type 指定了类型为 git apiVersion: tekton.dev/v1alpha1 kind: PipelineResource...执行的脚本内容是 helm upgrade --install --wait --values xxx.yaml .... params 指定了部署过程中用到的参数,可以通过外部传入,也可以使用 default...定义默认值 resources 字段定义了执行过程中用到的两个数据源 - helm-git-repo:描述应用程序使用 helm 部署时的chart包的 git 存放地址 - image-repo:镜像信息执行脚本中...中 resource 里面声明了一个 from,表明这里的输入数据源依赖 gcp-maven-kaniko-build 的输出数据源,因此会等待 gcp-maven-kaniko-build 执行完才开始执行

    5.7K30

    一次近乎完美的PostgreSQL版本大升级实践

    以下是 PostgreSQL9.6 和 11 版本 之间的主要区别: 表分区支持 LIST、RANGE,以及 HASH 存储过程支持事务 即时编译(JIT)加快查询表达式的运行速度 并行查询,增加并行化数据定义功能...HA 集群通过 Patroni 进行管理和配置,以保证 Consul 集群及其所有复制体在异步流复制中,使用复制槽和 WAL 对 GCS 存储桶进行复制工作时的 leader 选举一致性。...接下来启动应用程序,让我们的 QA 团队能运行一些测试。他们在升级后的数据库上运行了本地单元测试,我们对负面结果进行了调查。...这里有几点细节需要注意:PostgreSQL 的主要版本会添加新功能,这些新功能经常会改变系统表的布局,但内部数据存储格式基本会保持不变。...对团队来说,数据库测试在升级过程中是至关重要的一步,根据生产过程中的查询数额来进行性能测试,将结果存到 pg_stat_statement 表中。

    2K10

    快速建立企业级开发者平台

    为了加快这个过程,Humanitec 公开了基于亚马逊网络服务(AWS)和谷歌云平台(GCP)平台的参考架构实现代码。...集成和交付平面 这个平面是关于构建和存储镜像,从开发人员提供的抽象中创建应用程序和基础架构配置,以及部署最终状态。这是开发人员和平台工程师领域的交汇点。...机密管理器存储诸如数据库密码、API 密钥或 TLS 证书等配置信息,应用程序在运行时需要这些信息。它允许平台编排器引用机密并将其动态注入到工作负载中。...参考体系结构的示例实现使用 Humanitec SaaS 系统附带的机密存储。 资源平面 这一平面是实际基础设施所在的位置,包括集群、数据库、存储或 DNS 服务。...用于 AWS 和 GCP 设置的新开源实现代码是平台工程社区的一个令人兴奋的新发展,它将为您节省设计过程中的数小时时间。 祝您搭建开发者喜爱的 IDP 的过程充满乐趣!

    41010

    Apache Hudi 0.11 版本重磅发布,新特性速览!

    多模式索引 在 0.11.0 中,默认为 Spark writer 启用具有同步更新的元数据表和基于元数据表的file listing,以提高在大型 Hudi 表上的分区和文件listing的性能。...索引器在时间线上添加一个名为“indexing”的新action。虽然索引过程本身是异步的并且对写入者来说是非阻塞的,但需要配置锁提供程序以安全地协调运行中的写入者进程。...集成 Google BigQuery 在 0.11.0 中,Hudi 表可以作为外部表从 BigQuery 中查询。...Bucket 索引 0.11.0增加了一种高效、轻量级的索引类型bucket index。它使用基于记录键的散列函数将记录分配到存储桶,其中每个存储桶对应于单个文件组。...保存点和恢复 灾难恢复是任何生产部署中的关键特性。尤其是在涉及存储数据的系统中。Hudi 从一开始就为 COW 表提供了保存点和恢复功能。在 0.11.0 中,我们添加了对 MOR 表的支持。

    4.1K30
    领券