腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据指象
专栏成员
举报
138
文章
64618
阅读量
23
订阅数
订阅专栏
申请加入专栏
全部文章(138)
编程算法(28)
数据分析(23)
sql(14)
python(10)
大数据(9)
神经网络(7)
腾讯云开发者社区(7)
机器学习(6)
数据(6)
数据库(5)
深度学习(5)
人工智能(5)
企业(5)
r 语言(4)
mapreduce(4)
线性回归(4)
data(4)
统计(4)
腾讯云测试服务(3)
存储(3)
数据处理(3)
教育(3)
其他(2)
NLP 服务(2)
github(2)
hadoop(2)
数据可视化(2)
https(2)
数据集成(2)
lm(2)
select(2)
基础(2)
模型(2)
生命周期(2)
算法(2)
图表(2)
官方文档(1)
c 语言(1)
c++(1)
ruby(1)
node.js(1)
git(1)
apache(1)
TDSQL MySQL 版(1)
SSL 证书(1)
文字识别(1)
网站(1)
开源(1)
缓存(1)
爬虫(1)
网络安全(1)
spark(1)
决策树(1)
微信(1)
小程序(1)
hbase(1)
云计算(1)
聚类算法(1)
分类算法(1)
flink(1)
Elasticsearch Service(1)
汽车(1)
analysis(1)
app(1)
attributes(1)
csv(1)
distribution(1)
etl(1)
excel(1)
factory(1)
ggplot2(1)
ip(1)
it(1)
max(1)
min(1)
models(1)
object(1)
olap(1)
path(1)
plot(1)
point(1)
scaling(1)
series(1)
similarity(1)
structure(1)
time(1)
txt(1)
变量(1)
编码(1)
磁盘(1)
大数据处理(1)
管理(1)
规范化(1)
计算机(1)
监控(1)
可视化(1)
配色(1)
苹果(1)
入门(1)
数学(1)
网络(1)
异常(1)
语法(1)
中国数据库前世今生(1)
搜索文章
搜索
搜索
关闭
一个SQL,让人头秃
sql
大数据处理
SQL查询中 不同类型的字段 比较时,会强制做字段类型转换。保证比较字段二者类型的一致。
herain
2024-09-27
85
0
学会5个图表,让数据分析简洁高效
数据分析
数据可视化
图表
根本原因:一维抽象的文字语言很难描述三维的世界, 文字语言译成“具象的事物 ”很难做到“信达雅”。
herain
2024-09-27
94
0
大国信息化之路:中国数据库发展史
中国数据库前世今生
数据库开始从网状数据库(NDBMS)到 层次数据库(HDBMS)再到关系数据库的过程不断进化中。
herain
2024-09-19
182
0
多元回归:残差分析与异常值诊断
变量
模型
数据
异常
lm
基础分析数据为27位糖尿病者的 血清总胆固醇(X1)、甘油(X2)、空腹胰岛素(X3)、糖化血红蛋白(X4)、空腹血糖(Y)的测量值。我们可以使用R语言建立 空腹血糖与其他四个变量的多元回归方程,从中学习如何分析残差和异常值诊断。
herain
2024-07-18
130
0
高考人数预测:2032高考人数冲顶1489万
基础
模型
入门
统计
收集了从1978年~2024年的高考人数 以及 历史的新出生人口数据,结合模型预测未来10年高考人数变化。
herain
2024-06-16
1.5K
0
惊艳汇聚:Python可视化工具集
网络
python
可视化
数据
图表
数据可视化是数据科学分析的重要环节,是有效传达数据价值的重要渠道。辛苦整理了一天,我们一睹Python可视化工具的精彩之处。
herain
2024-06-04
137
0
向智而行:浅谈文本相似度的计算
大数据
编码
计算机
算法
语法
文本是由多种词性的字词通过系统的语法规则组成而成的 具有上下文语义的字词串。根据文本的定义,我们可以将文本的相似度分为两种:一,是文本包含字词的相似度;二,是文本内含语义的相似度。
herain
2024-05-22
113
0
“数据质量”就是生命线
企业
管理
监控
生命周期
数据
随着三网融合、移动互联网、云计算、物联网的快速发展,数据的生产者、生产环节都在急速攀升,随之快速产生的数据呈指数级增长。在信息和网络技术飞速发展的今天,越来越多的企业业务和社会活动实现了数字化。全球最大的零售商沃尔玛,每天通过分布在世界各地的6000多家商店向全球客户销售超过2.67亿件商品,每小时获得2.5PB的交易数据。而物联网下的传感数据也慢慢发展成了大数据的主要来源之一。有研究估计,2015年全球数据量为8ZB,而到2020年则高达35.2ZB,是2015年数据量的44倍之多。此外,随着移动互联网、Web2.0技术和电子商务技术的飞速发展,大量的多媒体内容在指数增长的数据量中发挥着重要作用。
herain
2023-09-01
285
0
TF-IDF:数据分析岗位最看重什么?
企业
数据分析
基础
数据
统计
我们随机打开招聘网站,随机抽取13家公司招聘数据分析岗位的要求。数据分析岗位薪酬分布:8-50k,岗位要求描述:总计61行,用词 2899个。
herain
2023-09-01
191
0
抽转腾挪:python玩转csv数据
python
csv
select
数据
统计
用python处理结构化的CSV数据,我们自然而然会想到结构化查询语句(SQL),如果在python用sql语法来处理数据,肯定很丝滑。
herain
2023-09-01
153
0
谈谈大数据的核心技术
大数据
磁盘
数据
数学
算法
这些都不是大数据的核心技术:Hive、Spark、Mahout、Storm、HBase。只是大数据核心技术的衍生技术。 我们知道大数据的发展经历了或者正在经历着:搜索引擎时代、数据仓库时代、数据挖掘时代、机器学习时代。
herain
2023-09-01
136
0
揭秘:最小二乘法的重要特性
学过统计学的同学,深知最小二乘法是线性回归的基础,也是从描述统计到统计推断的必经之路。今天我们一起从线性代数的求解过程中,揭秘最小二乘法的重要特性。
herain
2022-12-12
358
0
建议:学习一门计算机语言
python
中国14亿人口,约8.54亿人使用互联网,人均使用时长高达4~5个小时。更多的人花更多的时间在互联网上,是一种生活方式的转变,也是经济新增长点的体现。顺势而为,才有可为。人与人紧密的沟通本质将体现在人与计算机的频繁交互之上。互联网的触角无处不在,拥抱互联比闭门不出的拒绝更理智。
herain
2022-12-12
470
0
妙计:布隆过滤器
存储
编程算法
在谈布隆过滤器算法的之前,我们先说一说查找,比如在1亿数据中 查找数字X是否存在。 常见的方法是: 1,遍历查找,随着数据量的增长,查询的时间复杂度O(n)也是线性增长的。 2,对数据排序之后,进行二分查找,查找的时间复杂度 O(logn) 3,使用哈希表k-v结构存储,这样通过判断X是否在K的集合,时间复杂度是O(1)。 这些方法都不可避免的需要存储所有数据,随着数据量的增加,存储空间也不断增加。 一,布隆过滤器的原理: 当然还有一种不需要存储数据,快速判断数据X是否存在的神奇方法:松下问童子。 童子具有先验的知识,能够判断师傅(X)在山中采药。 若有多个童子都判断 师傅(X)在在山中采药。 我们是不是就可以更准确的判断X存在了。
herain
2022-12-12
277
0
谈:女孩子要不要转数据岗
大数据
数据分析
回答这个问题需要解开三个关键点,一是女孩子更适合哪一个数据岗位?二是如何转行?三是数据岗位值不值转?
herain
2022-09-01
433
0
谈 “数仓与数分” 的4层级标杆能力
大数据
数据分析
公司恰如一辆汽车,不同的能力对标不同的职业等级,职业等级决定我们在什么地方做什么事?
herain
2022-06-21
794
0
手撕-基尼系数
编程算法
基尼系数是国际上最常用的分析国民收入分配格局的方法,度量分配的均衡性或差异程度。常用两种计算方法,一是:拟合曲线法、二是:直接计算。
herain
2022-06-21
584
0
谈谈ETL
数据集成
ETL绝不是三个单词直译这么简单,三个数据环节紧密连接构成体系庞大、技术复杂度的数据生态系统。
herain
2022-06-21
1.1K
0
谈谈ETL
数据集成
ETL绝不是三个单词直译这么简单,三个数据环节紧密连接构成体系庞大、技术复杂度的数据生态系统。
herain
2022-05-05
2.2K
1
经济分析中常用公式
lm
效用:指消费者在消费商品所获的感受的满足感,一个商品对某用户边际的满足感约等于某一常数。
herain
2022-04-27
1.3K
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档