后台开发工程师

从部署到实践，即刻拥有你的专属龙虾助手

OpenClaw开发者专区🦞🦞🦞

自行/邀约他人一键搬运博客，享价值百万资源包

腾讯云自媒体同步曝光计划

往期视频·干货材料·成员作品 最新动态

腾讯技术创作特训营知识专栏

新邀入驻腾讯云开发者社区，福利多多！

大数据平台的采集功能是从外部数据源采集数据存储到hive，采集方式分为全量采集、增量采集，增量采集适用于数据规模较大情况，有很多使用场景，但是在增量采集时，平台只能感知数据新增、更新，无法感知到数据删除，为了解决这个问题，本文选用了常用的外部数据源mysql为例进行binlog采集方案介绍。

大数据平台之binlog采集方案

项目开发中经常会用到很多外部组件，比如mongo、mysql、redis等，虽然在公有环境中使用云上的组件一般都会有完整的监控视图，但是有些项目是部署在私有环境中，使用的都是自建组件，没有完整的监控视图，其次，业务侧也希望将所有组件收归到一起进行统一的监控管理，这样就需要业务侧有一个多组件的监控平台，并且能够方便进行扩展。像笔者目前所在的项目组开发的大数据处理平台，使用了很多外部组件，元数据存储方面有：mongo、mysql、elasticsearch、redis、postgres，大数据存储方面有：hadoop（spark、hive、hbase、hdfs、yarn），为了更好的发现和定位问题，我们需要一个统一的监控管理中心。

可扩展多组件监控方案

在实际生产中，我们经常会遇到类似kafka这种流式数据，并且原始数据并不是我们想要的，需要经过一定的逻辑处理转换为我们需要的数据。鉴于这种需求，本文采用NiFi+Spark Streaming的技术方案设计了一种针对各种外部数据源的通用实时采集处理方法。

基于NiFi+Spark Streaming的流式采集

      最近参与开发的java项目存在比较严重的性能问题，前端访问经常需要很长时间才能获得回包，为了定位系统中的热点区域，需要对系统进行profile，然后针对性的优化。所谓工欲善其事必先利其器，一个好的profile工具需要具备：1、能以图形化形式统计各种性能指标的详细信息，包括内存、CPU、函数调用耗时等信息。2、对原应用影响小。3、能方便进行远程profile。基于以上几点，最终我选择了JProfiler，这个工具的功能非常强大，能满足profile的各种需求。

Java性能分析

      最近参与开发一个java项目，每次修改调试时就需要重启进程，由于工程较大，进程初始化任务较多，重启较慢，严重影响了开发效率，因此花了点时间研究java热更新机制，在项目中引入热更新后，每次的修改可以立即看到结果，提高了开发效率。

Java热更新

文章

问答

视频

教程

学习中心

腾讯云实验室

直播

竞赛

腾讯云代码分析专区

腾讯iOA零信任安全管理系统专区

腾讯云架构师技术同盟交流圈

腾讯云数据库专区

腾讯云智能顾问专区

腾讯云原生专区

腾讯混元专区

腾讯云TCE专区

腾讯云Lighthouse专区

腾讯云HAI专区

腾讯云Edgeone专区

腾讯云存储专区

腾讯云智能专区

腾讯轻联专区 

腾讯云开发专区

TAPD专区

腾讯轻量云游戏服专区

EdgeOne AI 安全实战专区

腾讯云最具价值专家

腾讯云架构师技术同盟

腾讯云创作之星

腾讯云开发者先锋

腾讯云代码助手

云原生构建

TAPD 敏捷项目管理

Cloud Studio

SDK中心

API中心

命令行工具

涵盖代码开发、场景应用、自动测试全流程，助你从零构建专属AI助手

一站式MCP教程库，解锁AI应用新玩法

聚焦“写作效率、视觉美观与运行性能”三方面进行全面升级，为您提供更高效、稳定的创作环境

社区富文本&Markdown编辑器全新改版上线，欢迎大家体验!

诚挚邀请您参与本次调研，分享您的真实使用感受与建议。您的反馈至关重要，感谢您的支持与参与！

社区新版编辑器体验调研

腾讯云开发者社区推出了Sun专栏，为你提供了Sun的相关文章，致力于帮助开发者快速成长与发展。

Sun-腾讯云开发者社区

Sun

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐