腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
圈层
工具
返回腾讯云官网
share ai happiness
专栏成员
举报
77
文章
75753
阅读量
13
订阅数
订阅专栏
申请加入专栏
全部文章(77)
编程算法(17)
sql(11)
java(10)
spark(8)
hive(8)
大数据(8)
机器学习(7)
神经网络(7)
深度学习(7)
mapreduce(7)
存储(7)
网络安全(7)
https(7)
数据库(6)
人工智能(6)
hadoop(6)
文件存储(5)
node.js(4)
git(4)
http(4)
jvm(4)
数据结构(4)
flink(4)
python(3)
云数据库 SQL Server(3)
api(3)
TDSQL MySQL 版(3)
yarn(3)
开源(3)
hbase(3)
负载均衡(2)
tensorflow(2)
html(2)
ide(2)
github(2)
jar(2)
linux(2)
负载均衡缓存(2)
网站(2)
缓存(2)
yum(2)
面向对象编程(2)
zookeeper(2)
rabbitmq(2)
数据处理(2)
kafka(2)
数据挖掘(1)
php(1)
erlang(1)
json(1)
nosql(1)
云数据库 Redis®(1)
mvc(1)
全文检索(1)
unix(1)
centos(1)
spring(1)
专用宿主机(1)
访问管理(1)
SSL 证书(1)
腾讯云测试服务(1)
svg(1)
分布式(1)
运维(1)
黑客(1)
爬虫(1)
ssh(1)
卷积神经网络(1)
numpy(1)
二叉树(1)
pytorch(1)
rpc(1)
安全(1)
windows(1)
微服务(1)
腾讯云开发者社区(1)
processing(1)
云计算(1)
mvcc(1)
es(1)
数据湖(1)
汽车(1)
for循环(1)
photoshop(1)
precision(1)
ps(1)
动态规划(1)
搜索文章
搜索
搜索
关闭
精简版 — Hive开发常用操作
hive
mapreduce
直接使用cross join关联只会分配一个reduce,导致耗时严重,因此我们可以将小表扩充一列,并且复制n倍,然后进行left join操作。这样扩充几倍,就会分配几个reduce。
木野归郎
2023-02-25
1.3K
0
灵魂拷问JVM,你被干趴了吗
jvm
编程算法
java
jar
jvm将.class类文件信息加载到内存并解析成对应的class对象的过程,注意:jvm并不是一开始就把所有的类加载进内存中,只是在第一次遇到某个需要运行的类才会加载,并且只加载一次
木野归郎
2023-02-25
240
0
什么是数据湖?
数据湖
大数据
数据处理
编程算法
存储
数据存储是人类千百年来都在应用并且探索的主题。在原始社会,人类用树枝和石头来记录数据。后来,人类制造了铁器,用铁器在石头上刻画一些象形文字来记录数据,而此时,语言还没有形成,人们记录的东西只有自己才可以看懂。从使用树枝和石块记录数据和用铁器在石头上刻画一些形象文字,到通过竹简和纸张,再到通过计算机保存在软盘,硬盘等设备上。随着技术的发展,信息数据的量越来越大和复杂度越来越高。特别是在近几十年,数据已经呈几何指数增长,早在2012年,就已经宣称大数据时代到来。随着物联网的普及,越来越多的数据将被生产出来。
木野归郎
2023-02-25
991
0
《hive编程指南》读书笔记:模式设计
存储
hive
jvm
文件存储
按天划分表就是一种模式,每天一张表的方式在数据库领域是反模式的一种方式,按天划分的表建议使用分区表,hive通过where子句中的表达式来选择查询所需要的指定的分区,这样查询执行效率高。
木野归郎
2023-02-25
360
0
(学习之路)Hive数据倾斜解决办法
hive
mapreduce
文件存储
hive是基于大数据开发的一组用于数据仓库的api,其主要功能是将HQL(HIVE SQL)转换成MapReduce执行。所以对hive的优化几乎等于对MapReduce的优化,主要在io和数据倾斜方面进行优化。
木野归郎
2023-02-25
1.1K
0
《大数据之路》读书笔记:维度设计
存储
编程算法
维度是维度建模的基础和灵魂。在维度建模中,将度量称为“事实”,将环境描述称为“维度”,维度是用于分析事实所需要的多样环境。
木野归郎
2023-02-25
832
0
安装 | 企业版CDH服务器集群配置(详细)
云数据库 SQL Server
centos
windows
yum
专用宿主机
此方案为暂定方案,有可能会变更。如果直接使用CDH会更加方便,但是如果进行自行配置,需要做实验。
木野归郎
2022-04-14
3.4K
0
【推荐】Spark知识点
spark
java
linux
yarn
node.js
客户那边需要快速出一个版本,开发的这块使用到的之前没怎么用过,比如用oozie调度spark程序时候,你可能在你本地调试代码没有问题,上传到集群上之后,运行就出各种错,加上我们使用的服务器配置很差,导致各种服务需要的资源都不都用,然后每天就是在各种配置,话不多说了,赶紧来复习一下spark;
木野归郎
2022-04-14
360
0
Java中四种遍历Map的方式
编程算法
java
Map中采用Entry内部类来表示一个映射项,映射项包含Key和Value (我们总说键值对键值对, 每一个键值对也就是一个Entry)
木野归郎
2022-02-25
523
0
安装 Anaconda 的正确姿势(带图)
python
ide
tensorflow
Win10下Anaconda、TensotFlow安装和Pycharm配置详细教程
木野归郎
2022-02-25
1.1K
0
学了又忘又学的 LSTM RNN(二)
文件存储
机器学习
深度学习
人工智能
在上一篇文章学了又忘又学的RNN(一)中回顾了什么是RNN,以及RNN和普通神经网络有什么不一样
木野归郎
2022-02-25
300
0
学了又忘又学的 RNN(一)
深度学习
机器学习
人工智能
神经网络
任务也涉及到NLP领域方面的知识,关于这个领域我就不做过多的介绍了,我也是个小白,现在连脚趾头都还没有迈过门槛
木野归郎
2022-02-25
238
0
一文看懂机器学习指标(二)
机器学习
这几天跑的模型是以论文摘要,说的再详细一些就是对摘要进行标记,然后用标记后的数据在模型中训练
木野归郎
2022-02-25
259
0
一文看懂机器学习指标(一)
precision
这几天在训练一个模型,模型结果中涉及到一些参数,不太理解什么意思,就差了一些资料
木野归郎
2022-02-25
437
0
数据分析中常见的存储方式
存储
json
编程算法
hadoop
numpy
CSV(逗号分隔值)是一种纯文本文件格式,用于存储表格数据(例如电子表格或数据库)
木野归郎
2022-02-25
2.7K
0
简单聊聊分布式系统架构
运维
负载均衡
spring
文件存储
负载均衡缓存
架构解决的问题:结构拆分,就是把大的问题拆解成小的系统,然后把小的系统拆分成若干个层去实现。
木野归郎
2022-02-25
486
0
力扣-反转链表
编程算法
问题描述 定义一个函数,输入一个链表的头节点,反转该链表并输出反转后链表的头节点。 示例: 输入: 1->2->3->4->5->NULL 输出: 5->4->3->2->1->NULL 限制: 0 <= 节点个数 <= 5000 有三种方案: 使用栈解决 双链表解决 递归解决 使用栈解决 链表反转在面试中经常被问到。使用栈解决,具体流程如下: 代码如下: public ListNode reverseList(ListNode head) { Stack<ListNode> stack =
木野归郎
2022-02-25
208
0
一篇文章让你理解Java继承那些事
面向对象编程
java
继承是面向对象最显著的一个特性。继承是从已有的类中派生出新的类,新的类能吸收已有类的数据属性和行为,并能扩展新的能力。
木野归郎
2022-02-25
221
0
金九银十,金三银四(下)
缓存
数据库
sql
云数据库 SQL Server
MySQL日志主要包括查询日志、慢查询日志、事务日志、错误日志、二进制日志等。其中比较重要的是 bin log(二进制日志)和 redo log(重做日志)和 undo log(回滚日志)。
木野归郎
2022-02-25
563
0
金九银十,金三银四(上)
全文检索
编程算法
mvc
mvcc
数据结构
所谓金九银十,金三银四,眼看十月份最后一天已经快要结束了,当初那个充满斗志,充满梦想的你在哪里?
木野归郎
2022-02-25
813
0
点击加载更多
社区活动
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·干货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档