腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
腾讯云架构师技术同盟
返回腾讯云官网
数据社
专栏成员
举报
130
文章
207178
阅读量
35
订阅数
订阅专栏
申请加入专栏
全部文章(130)
大数据(45)
数据库(33)
sql(33)
数据分析(27)
编程算法(23)
存储(15)
kafka(15)
spark(11)
hadoop(11)
数据处理(11)
flink(11)
hive(10)
数据结构(9)
apache(8)
机器学习(7)
云数据库 SQL Server(6)
神经网络(6)
深度学习(6)
TDSQL MySQL 版(6)
https(6)
数据湖(6)
python(5)
node.js(5)
人工智能(5)
企业(5)
hbase(5)
模型(5)
数据挖掘(4)
api(4)
文件存储(4)
yarn(4)
网络安全(4)
产品(4)
数据(4)
bash(3)
html(3)
oracle(3)
ide(3)
bash 指令(3)
mapreduce(3)
日志数据(3)
分布式(3)
tcp/ip(3)
数据可视化(3)
数据仓库(3)
专用宿主机(2)
批量计算(2)
消息队列 CMQ 版(2)
电商(2)
serverless(2)
运维(2)
shell(2)
jdk(2)
numpy(2)
决策树(2)
线性回归(2)
zookeeper(2)
微服务(2)
云计算(2)
任务调度(2)
sdk(2)
迁移(2)
es(2)
chatgpt(2)
prompt(2)
this(2)
行业(2)
设计(2)
视频(2)
官方文档(1)
tensorflow(1)
javascript(1)
xml(1)
css(1)
json(1)
android(1)
nosql(1)
云数据库 Redis®(1)
postgresql(1)
matlab(1)
linux(1)
unix(1)
云数据迁移(1)
日志服务(1)
大数据解决方案(1)
数据安全(1)
http(1)
游戏(1)
开源(1)
自动化(1)
缓存(1)
爬虫(1)
jvm(1)
yum(1)
keras(1)
windows(1)
架构设计(1)
特征工程(1)
实时数仓(1)
数据库管理(1)
数据集成(1)
architecture(1)
case(1)
data(1)
distinct(1)
etl(1)
matching(1)
max(1)
min(1)
openai(1)
表格(1)
部署(1)
工作(1)
管理(1)
规范化(1)
监控(1)
开发者(1)
权限(1)
事务(1)
数据存储(1)
数据管理(1)
算法(1)
腾讯(1)
系统(1)
腾讯混元大模型(1)
搜索文章
搜索
搜索
关闭
大模型时代下的数据治理:AI序幕拉开,垂直行业模型如何加速突破?
企业
存储
行业
模型
数据
随着ChatGPT和其他大语言模型(LLM)的快速发展,AI已成为我们工作和生活中不可或缺的一部分,并从简单的文本生成逐渐演变成为能够处理复杂语义理解和生成的高级AI系统。
数据社
2024-05-30
841
0
浅谈数据治理之主数据识别(水利水电行业)
事务
数据
系统
产品
行业
大家好,我是一哥,好久没有发技术文章了,最近和一位老同事聊到数据治理,关于主数据他说了一些见解,于是就写了一篇文章。这篇文章紧贴水利行业,聊了作者自己的一些思考,欢迎大家评论区留言~
数据社
2024-05-01
266
0
小米数据平台
表格
工作
管理
权限
数据
导读: 业界一直希望统一元数据,从而实现多产品间的一致体验:无论是数据开发、数据消费还是数据治理,所有用户都能基于一套元数据体系,采用相同的资源描述方式,这无疑能极大地提升用户体验。 然而真正做到 “多云多数据源多引擎” 下的元数据统一,是非常难的,首先面临的是组织障碍,很多大厂也并未真正实现 “资源坐标统一、权限统一、资产一体化”,这些问题本身就很有挑战。得益于开源与组织时机,小米基于 HMS 与 Metacat 实现了元数据的统一,也借此实现了将 7 个数据平台统一为 1 个平台。 随着湖仓与 AI 的发展,统一元数据面临新的挑战,尤其是 Data AI 资产一体化,Metacat 很难满足需要,小米希望借助 Gravitino 替代 HMS 与 Metacat,真正实现元数据的多场景统一,从而获得元数据在湖仓与 AI 方面的持续迭代。 背景和概要介绍
数据社
2024-04-10
297
0
“ChatGPT 之父”奥特曼被 OpenAI解雇
人工智能
chatgpt
openai
开发者
模型
美国时间11月17日,人工智能公司OpenAI突发声明,宣布公司首席执行官山姆·奥特曼将离开公司,公司现首席技术官米拉·穆拉蒂被任命为临时首席执行官。OpenAI称,接任CEO的人选仍在确认过程中。
数据社
2023-11-22
198
0
腾讯混元大模型文生图操作指南.doc
游戏
模型
算法
腾讯
腾讯混元大模型
今天上午,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能。升级后的腾讯混元中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
数据社
2023-10-30
1.5K
0
腾讯混元大模型文生图操作指南.doc
游戏
模型
算法
腾讯
腾讯混元大模型
今天上午,腾讯混元大模型迎来全新升级,并正式对外开放“文生图”功能。升级后的腾讯混元中文效果整体超过GPT3.5,代码能力大幅提升20%,达到业界领先水平。
数据社
2023-10-30
1.5K
0
Prompt Engineering
prompt
this
产品
模型
设计
在这里,我们讨论了几个撰写提示(输入模型的内容)的原则和技巧,这些提示将帮助您为您的任务获得最佳的生成结果。选择正确的温度也会对生成质量产生很大的影响,我们会在这里单独讨论温度。
数据社
2023-10-22
147
0
Prompt Engineering
prompt
this
产品
模型
设计
在这里,我们讨论了几个撰写提示(输入模型的内容)的原则和技巧,这些提示将帮助您为您的任务获得最佳的生成结果。选择正确的温度也会对生成质量产生很大的影响,我们会在这里单独讨论温度。
数据社
2023-10-22
216
0
使用ChatGPT与Hadoop集成进行数据存储与处理
hadoop
chatgpt
部署
数据
数据存储
Hadoop是一个开源的分布式存储和分布式计算框架,主要用于处理大量非结构化或半结构化的数据。它最初是由Apache基金会开发的,灵感来自于Google的MapReduce和GFS(Google文件系统)论文。Hadoop的核心是Hadoop Distributed File System(HDFS,Hadoop分布式文件系统)和MapReduce编程模型,如图1所示。
数据社
2023-09-11
369
0
2022年度数据人的书单盘点
大数据
hadoop
数据挖掘
数据库
sql
这一年,数据圈口碑炸裂的好书,今天给大家做个大盘点。也希望大家能多了解一些领域,或许还能从中培养出新的兴趣。
数据社
2023-01-04
602
0
复盘一件关于数据的糟心事!
存储
数据分析
最近郑州的疫情挺严重的,已经居家一个月了,错过了整个秋天。从10月初小区封控到月末小区有几十例异常,上周才刚刚解封,可以下楼。
数据社
2023-01-04
332
0
大数据应用型产品设计方法及行业案例介绍(附110页PPT)
产品
最近有不少读者问数据产品的一些知识,昨天分享了一篇文章,大家可以看下,今给大家分享一个干货材料
数据社
2023-01-04
1.1K
1
漫谈实时数仓
实时数仓
spark
云计算
数据库
sql
数据仓库大家非常熟悉,在1991年出版的“Building the Data Warehouse”,数据仓库之父比尔·恩门首次提出数据仓库的概念,数据仓库是一个面向主题的,集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。
数据社
2023-01-04
741
0
数据仓库的下一阶段该是什么?
大数据
api
企业
自动化
在大数据时代,大家都意识到数据已经成为了公司宝贵的资产,但如何让数据发挥价值,一直困扰着大家。数据技术人员需要长时间去理解某一个业务,业务人员也很难使用现代化数据分析工具赋能业务。那么,如何让公司数据能够快速和业务融合起来成为了广大数据从业者和数据服务厂家一直以来思考的问题。
数据社
2022-11-01
330
0
浅谈数仓的数据治理
distinct
etl
监控
数据管理
绝大数公司建立数仓之初是没有考虑好数据治理怎么做的,因为数据部门刚开始成立,必然要有一些“数据驱动”的成果,而数据治理不能很好的体现这些业绩。所以,都是在业务发展的过程中,逐渐遇到了一些数据问题,才考虑做这件事的。
数据社
2022-05-26
655
0
漫谈未来数仓架构如何设计
架构设计
serverless
数据库
编程算法
大家好,我是峰哥,夏天已经来了,小麦马上要丰收了,今天分享一篇关于未来数仓架构发展方向的文章。
数据社
2022-05-26
460
0
漫谈数据仓库的分层架构与演进
数据库
大数据
数据处理
sql
分层架构很容易在各种书籍和文档中去理解,但是把建模方法和分层架构放在一起就会出现很多困惑了。接下来,我会从数据研发与建模的角度,演进一下分层架构的设计原因与层次的意义。
数据社
2022-05-26
331
0
Apache Airflow 2.3.0 在五一重磅发布!
apache
数据库
sql
任务调度
json
大家好,我是一哥,在这个五一假期,又一个Apache项目迎来了重大版本更新——Apache Airflow 2.3.0 在五一重磅发布!
数据社
2022-05-26
1.9K
0
搞数仓也得懂几个常用机器学习算法
编程算法
决策树
机器学习
神经网络
深度学习
首先讲回归模型,回归模型研究的是因变量(目标)和自变量(预测器)之间的关系,因变量可以是连续也可以离散,如果是离散的就是分类问题。思考房价预测模型,我们可以根据房子的大小、户型、位置、南北通透等自变量预测出房子的售价,这是最简单的回归模型,在初中里面回归表达式一般这样写,其中x是自变量,y是因变量,w是特征矩阵,b是偏置。
数据社
2022-04-08
473
0
「原创」大数据岗位总结和相关书籍推荐
大数据
数据分析
运维
机器学习
hadoop
最近有几个群友问我大数据怎么入门,作为一个零基础大数据入门学习者该看哪些书呢?我结合自己看过的书和了解到的比较好的数据,给大家分享一下。
数据社
2022-04-08
453
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档