datartisan

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

doris 有三大表模型，分别为 Duplicate 模型（明细模型）、Aggregate 模型（聚合模型）、Unique 模型（唯一模型），具体要创建哪种类型的表模型，取决于数据场景。

doris 建表规范（一）

之前一直以为，飞书多维表格是专门用来协作的，除了漂亮一点也没啥。近期偶然得知飞书多维表格已经新增了 AI 的加持，变得不得了了，今天就来分享一个场景：不同数据库 SQL 格式的批量转换。

飞书多维表格批量转换

在数字化时代，及时获取信息至关重要。而微信则是当下最重要的信息获取渠道。解锁微信消息推送服务，将给我们带来极大的便利。

微信消息推送自由！！

现实工作中，有一些场景需要关联，然而却不能直接进行关联，因为关联键并不直接存在，只有经过处理后才可以进行关联，今天，我们通过一个例子来学习一下。

DuckDB 复杂关联

业务过程中，经常遇到需要计算连续天数的场景，比如：连续打卡天数、连续评优的同学、连续下单的客户等。

PowerBI 连续天数通用计算模型

DuckDB 中的正则表达式，基本上遵循了正则表达式的一些通用的规则，比如元字符、转义序列等，但是也有自己的特色（方言），在某些方面可以更好的实现需求。

DuckDB 正则这么玩

Excel 于今年推出了一系列正则函数，给文本处理带来的极大的便捷性，今天咱们就来看看最常用的 REGEXEXTRACT 是怎么使用的。

Excel 正则 REGEXEXTRACT

读取数据是操作数据的第一步。本文将详细介绍如何使用 DuckDB 进行数据读取，包括各种文件格式数据的读取方法及其适用场景。

DuckDB 读取数据

DuckDB 的安装过程可以说非常简单，一般情况下，1 分钟即可搞定，与其他数据库几个小时的安装过程相比，简直不要太爽，今天咱们就来看看具体怎么安装。

1 分钟安装 DuckDB

目前世面上已经存在很多种数据库管理系统，但没有一种可以适合所有场景。数据库管理系统的选取应该基于其应用场景及其实施成本。

Why DuckDB

今天在问题排查问题过程中，无意中搜索到了数据库领域泰斗级人物 Mike Stonebraker。

Vertica：如何计算下个月的第一天

在数据可视化的世界里，灵活性和交互性常常决定了报告的成功。Power BI 中的动态轴 提供了这一点——允许用户动态地从不同角度探索数据。这个特性增强了用户的参与度和洞察力的发现。今天，我将带你一步步地实现在 Power BI 中使用字段参数创建动态轴，包括测试数据。让我们深入到一个实际的例子中，了解一下如何将动态轴集成到报告中。

如何在 Power BI 中使用字段参数创建动态轴

分别将近两个学期的得分情况构造为子查询，然后将两个子查询相关联（ JOIN ），便可以对两次得分情况进行比较，这是一种比较简单的解题思路，具体的解题过程留给你思考。

SQL面试题003-行与行的比较

复兴集团公司中有一份组织架构信息，包括部门信息及部分具有领导职务的雇员信息，详见下图示例：

SQL每日一题-Q001

Atlas 部署之后就可以导入 Hive 元数据，这部分工作由 Atlas 组件 Hook 来完成。初次导入 Hive 元数据需要通过执行 shell 脚本来完成，然后，Atlas 就可以自动同步增量元数据信息了。下面我介绍一下如何完成这些工作。

Atlas Hook 导入 Hive 元数据

无监督数据挖掘算法和有监督数据挖掘算法的主要区别在于数据集的标签信息。
有监督数据挖掘算法：
1. 特点：有监督数据挖掘算法适用于已知数据集的输入和输出关系的情况。 
2. 过程：算法通过已知的输入和输出数据，学习建立映射关系，然后用这个映射关系对新数据进行预测。 
3. 例子：分类算法（如决策树、朴素贝叶斯、SVM 等）和回归算法（如线性回归、逻辑回归等）。
无监督数据挖掘算法：
1. 特点：无监督数据挖掘算法适用于没有标签信息的情况。算法的主要目标是发现数据内部的结构和规律，而不是建立输入和输出之间的映射关系。 
2. 过程：无监督算法通过聚类、降维、关联规则挖掘等方法，对数据进行内部组织，从而找出数据之间的关联性或相似性。 
3. 例子：聚类算法（如 K-Means、DBSCAN 等）、关联规则挖掘（如 Apriori、FP-growth 等）和降维算法（如 PCA、t-SNE 等）。
总结：
有监督数据挖掘算法关注于建立输入和输出之间的映射关系，用于预测未知数据的输出。而无监督数据挖掘算法关注于发现数据内部的结构和规律，用于挖掘数据之间的关联性或相似性。这两种算法在实际应用中可以根据具体问题和需求进行选择和组合，以达到更好的挖掘效果。

无监督or有监督？

“删库跑路”作为一种历史悠久、后果严重的公司资产损坏事故，一旦发生，后果难以估量，轻则业务短时间不可用，重则公司倒闭关门，甚至有人为此坐牢。已经发生的事件历历在目，希望大家引以为戒。

Hive 删库跑路

Hive 性能优化，可以从三个方面来考虑，即存储优化、执行过程优化和作业调度流程优化。

Hive 性能优化

笔者使用 Canal 将 MySQL 数据同步至 Kafka 时遇到了不少坑，还好最后终于成功了，这里分享一下极简教程，希望能帮到你。

利用 Canal 将 MySQL 数据实时同步至 Kafka 极简教程

其实这是相当错误的理解，但有这种错误观念也不怪大家，因为这两者都是大数据时代下的数据工具，两者的功能确实也有所重合，但两者在本质上还是存在较大差异。

BI和报表的区别，终于有人说清楚了！

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了datartisan专栏，为你提供了datartisan的相关文章，致力于帮助开发者快速成长与发展。

datartisan

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐