首页
学习
活动
专区
圈层
工具
发布
首页标签大数据

#大数据

腾讯云大数据解决方案,助力客户快速构建企业级数据架构,获取数据时代核心竞争优势

别再拍脑袋上线了:用大数据把 A/B 测试和在线实验平台这件事干“正经”

Echo_Wish

听着是不是很熟?产品拍板、技术加班、运营祈祷,最后一看数据——效果好不好,全靠感觉。

800

源代码:大批量SQL代码语法转换简单实例:ORACLE START WITH CONNECT 语法改写

用户12032828

### 问题:如果存在大量代码需要改写的情况,靠人工处理会很耗时,且容易出错。能不能通过工具实现代码语法的大批量自动转换?

1700

Spark SQL Catalyst 优化器详解

ETL 小当家

宏观来看:Spark SQL 语句,经过一个优化器(Catalyst),转化为 RDD,交给集群执行。

2800

模型说不清,人就不敢用:可解释性,往往死在数据准备那一步

Echo_Wish

模型在验证集上 AUC 0.92,线上效果也不错,结果一到评审会,被业务同学一句话打回原形:

4110

数据不够用?别急着骂业务,数据增强和合成数据真能救命

Echo_Wish

但真干几年你就会发现一个残酷现实:大多数业务场景,数据从一开始就不够,而且永远不够。

4510

从零开始学Flink:Flink SQL 极简入门

用户4160816

Flink SQL 是 Apache Flink 的核心模块之一,它让开发者可以使用标准的 SQL 语法来编写流处理和批处理作业。对于不想深究 Java/Sca...

10210

源代码:大批量SQL代码语法转换实战:PIVOT函数改写(案例2)

用户12032828

### 背景:在不同数据库迁移的项目中,往往会遇到SQL语法不兼容的情况。比如有的数据库支持PIVOT函数,有的不支持。遇到这种情况,就必须对PIVOT函数进行...

8610

模型服务化这件事:从 Batch 到 Stream,不只是改个部署方式那么简单

Echo_Wish

训练时 AUC 飞起、离线评估美如画,一到线上就翻车——延迟高、数据对不上、效果漂、被业务嫌弃。这事儿我见太多了。

9210

Palantir深度分析:9. 价值验证逻辑

IAN李车

在当代企业数字化转型的宏大叙事中,传统的"先治理,后应用"模式正面临前所未有的信任危机。长久以来,企业CIO和CDO们被灌输了一种观念:必须首先构建一个包罗万象...

13510

Palantir深度分析:10. AIP Bootcamps(AI 训练营)的运作SOP

IAN李车

在当今的企业级软件市场中,传统的"概念验证"(Proof of Concept, POC)模式正面临前所未有的危机。这种以PPT宣讲、静态演示和冗长合同谈判为特...

25610

第 2 篇|Apache DolphinScheduler 的核心抽象模型

Apache DolphinScheduler

本文为《深入理解 Apache DolphinScheduler:从调度原理到 DataOps 实战》系列专栏第 2 篇,从源码与调度模型视角,解析 Dolph...

6910

Palantir深度分析:8. 前向部署工程师(FDE)的工具箱

IAN李车

前向部署工程师(Forward Deployed Engineer, FDE)的角色,本质上是处于企业理想架构与现场数据"混乱现实"之间的突击队员。在项目进场的...

31410

第 1 篇 | 调度系统,不只是一个“定时器”

Apache DolphinScheduler

很多团队一开始都把调度系统当成“定时跑任务的工具”,直到任务规模上来、依赖变复杂、失败开始难以恢复,才意识到问题的根源并不在脚本本身。

9810

Palantir深度分析:7.隐私增强技术

IAN李车

随着《通用数据保护条例》(GDPR)的实施以及全球范围内数据主权要求的日益严苛,传统的"边界防御"式数据安全模型已无法满足现代政府与大型企业的合规需求。数据不再...

15610

为什么海外大厂开始重新评估 Airbyte?

Apache SeaTunnel

在数据集成领域,Airbyte 曾凭借开源和丰富的连接器库迅速流行。但在与架构师聊天的过程中我发现,随着企业级使用需求增加,在复杂企业环境中,Airbyte 仍...

12310

担心 DataX 迁移到 Apache SeaTunnel 成本高?一篇指南手把手带你平滑切换

Apache SeaTunnel

不少正在使用 DataX 的团队,都面临任务维护成本高、扩展能力受限的问题,却又担心迁移代价过大。本文从 DataX 用户的实际需求 出发,介绍如何快速上手 A...

8110

Serverless 实战:基于车辆过户查询API构建低成本风控云函数

天远数科

在现代汽车金融与交易平台中,用户体验的核心往往取决于“等待时间”。当用户站在一辆心仪的二手车前,或者信贷员正在审核一笔车贷申请时,他们需要的是即时的车况反馈,而...

11510

云原生风控架构:基于车辆过户查询API的清洗与聚合策略

天远云服

在车源拍卖、网约车准入审核或大型保险定损场景中,系统往往需要在短时间内处理成千上万次的车辆信息查询请求。传统的单线程同步查询方式极易成为性能瓶颈,导致业务响应延...

8710
领券