摘要 日前,腾讯云大数据数据湖计算 DLC 与国内两家知名云厂商的数据湖产品进行了性能对比,其中腾讯云 DLC 在三款产品中SQL平均执行查询时间短,性能表现优。腾讯云大数据 DLC 在存算分离和大数据量查询场景下,海量查询性能较 A 厂商 产品提升 248%,较 B 厂商产品提升36%。 在存算分离大数据量查询场景下,腾讯云大数据 DLC 较 A 厂商 、B 厂商表现更优,同时在较大任务上的任务执行成功率更高,所有任务均成功执行。结合性能、性价比、使用体验等因素,腾讯云 DLC 在云原生数据湖选择上整体上
当前小红书消息引擎团队与 AutoMQ 团队正在深度合作,共同推动社区建设,探索云原生消息引擎的前沿技术。本文基于 OpenMessaging 框架,对 AutoMQ 进行了全面测评。欢迎大家参与社区并分享测评体验。
导读 / Introduction 数据湖解决了海量异构数据的入湖和存储需求。通过对海量数据的分析挖掘,提升对数据的洞察,助力数字化决策,进而促进业务发展,是每个企业构建数据湖的根本目的所在。随着业务迭代的不断加速,企业对数据时效性和数据分析敏捷性提出了更高的要求。为此,腾讯云推出了数据湖计算(Data Lake Compute,DLC)。DLC采用存储和计算分离的架构,结合腾讯云对象存储COS和弹性容器服务EKS,打造了一个开箱即用、弹性扩展、按量付费的交互式分析服务。 图1 DLC架构图 高性
ClickHouse 在执行分析查询时的速度优势很好的弥补了 MySQL 的不足,但是对于很多开发者和DBA来说,如何将MySQL稳定、高效、简单的同步到 ClickHouse 却很困难。本文对比了 NineData、MaterializeMySQL(ClickHouse自带)、Bifrost 三款产品,看看他们在同步时的差异。
Python生产力提升技巧不仅能帮助开发者更快速、更高效地编写代码,还能提升代码的性能和可读性。以下是10个实用的技巧,每个技巧配有具体应用场景、案例代码、时间复杂度和空间复杂度分析,以及使用前后的性能对比。
腾讯云服务器标准型实例包括很多种不同机型的型号。本文主要说S2实例、sa1实例和sa2实例。这三款实例都是腾讯云页面比较常见的机型。这样对于新用户就容易产生困扰,不知道该选择哪个。下面详细说说在腾讯云常看到的这几款云服务器区别在哪,又该依据什么选择。
随着大数据数仓技术的发展,业务或商业决策对快速、准确数据支持的依赖日益加深,对数据仓库的数据实时更新技术提出了更高要求。当前,社区版 ClickHouse 不支持唯一索引,通常使用 ReplacingMergeTree 或者 CollapsingMergeTree 等表引擎进行数据的去重和更新操作,针对新写入数据通过后台异步任务合并 Part 或者查询时实时合并 Part 来实现精确去重。但是,这种数据聚合方式的实时性和查询性能不佳,难以满足业务场景。
作者 | 屠正松 苏钰 责编 | 梦依丹 出品 | APISIX 技术团队投稿 云原生时代下,企业逐渐向云上迁移,越来越多的应用和服务都在进行容器化改造,服务之间的流量也开始爆发性的增长。为了能高效地管理这些规模庞大的 API,API 网关开始在技术领域大展身手。 用户除了需要 API 网关提供请求代理、熔断限流、审计监控等常规能力外,更多开始关注云原生兼容性、支撑场景的多样性,以及更好的性能及稳定性。在这样的背景下,以 Apache APISIX 和 Kong 等为代表的云原生 API 网关
CSG存储网关是基于腾讯云高性能、高可靠性的对象存储系统COS对外提供iSCSI、NFS和CIFS/SMB访问协议。作为一种混合云方案, 帮助用户不用修改本地应用就可以把数据上传到COS。网关可以部署在用户IDC也可以部署在腾讯云上,产品形态如下所示。
前言 2021年8月,腾讯OAV1正式赋能腾讯云数据万象, 为其提供最前沿的AVIF图片压缩技术,在图片主观质量相同的情况下大幅降低码率,节省储存空间。 背景介绍 腾讯云数据万象(Cloud Infinite,CI)是依托腾讯云对象存储的数据处理平台,涵盖图片处理、内容审核、内容识别、媒体处理、文档服务等功能,能够实现对云上的图片、视频、音频、文档等数据的处理,为客户提供专业一体化的数据处理解决方案,满足客户多种场景维度的需求。作为腾讯云集大成的数据处理产品, 很早前便推出了图片压缩服务 [1]。
导语 H.264/AVC标准在当前视频应用场景中仍然是应用最广、兼容性最高的视频编码标准,因此任何视频产品如果希望在支持最大范围用户流畅使用的同时保障视频质量,H.264/AVC软件编解码必不可缺。在开源编码器实现中,x264经过资深软件工程师多年的持续优化,是当下公认性能较为优异且使用最多的选择。但x264的开源协议对商业软件并不友好,会带来昂贵的软件授权费用,所以对商业化视频产品来说,自研编码器性能成了硬核技术实力比拼的关键。 为此腾讯多媒体实验室推出了自研的O264RT编码器,并且与TRTC团队强强联
RocketMQ 最早诞生于淘宝的在线电商交易场景,经过了历年双十一大促流量洪峰的打磨,2016年捐献给 Apache 社区,成为 Apache 社区的顶级项目,并在国内外电商,金融,互联网等各行各业的广大客户落地验证,得到广泛认可。
Plato 开源地址:https://github.com/tencent/plato
在数据库查询中,JOIN和IN是两种常见的查询方式,它们分别用于在多个表之间建立关联和过滤数据。然而,在实际应用中,开发者经常会面临一个问题:到底是使用JOIN还是使用IN更能提高查询性能呢?本文将对这两种方式进行性能对比,并探讨在不同情境下的最佳实践。
转自:https://github.com/alibaba/RocketMQ/wiki/rmq_vs_kafka 淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用MySQL作为消息存储媒介,可完全水平扩容,为了进一步降低成本,我们认为存储部分可以进一步优化,2011年初,Linkin开源了Kafka这个优秀的消息中间件,淘宝中间件团队在对Kafka做过充分Review之后,Kafka无限消息堆积,高效的持久化速度吸引了我们,但是同时发现这个消息系统主要定位于日志传输,对于使用在淘宝交易、订
PaxosStore是微信设计的一套分布式存储系统,并已对核心业务存储做了架构改造。内存云是微信PaxosStore存储体系的组成部分,本文将分享内存云的Paxos改造过程。
提升SQL生产力是数据库管理和优化的关键。以下是五个关键技巧,每个技巧都配有具体应用场景、案例代码以及使用前后的性能对比。
ActiveMQ(默认采用的KahaDB做消息存储)可选用JDBC的方式来做消息持久化,通过简单的xml配置信息即可实现JDBC消息存储。由于,普通关系型数据库(如Mysql)在单表数据量达到千万级别的情况下,其IO读写性能往往会出现瓶颈。在可靠性方面,该种方案非常依赖DB,如果一旦DB出现故障,则MQ的消息就无法落盘存储会导致线上故障。
本文介绍了TXSQL项目,主要关注于解决金融、运营商等行业的核心系统对分布式数据库的依赖问题,以及满足业务对数据库的高可用、高弹性、高安全等需求。TXSQL在数据一致性、高可用、高性能等方面具有优势,能够有效地支持分布式数据库的部署要求。同时,TXSQL还提供了丰富的数据复制和数据迁移工具,以及数据恢复和故障转移功能,以满足高安全业务场景的需求。此外,TXSQL还提供了基于云平台的运维管控和运维工具,以实现对分布式数据库的高效运维。
Paper: https://arxiv.org/abs/1906.04979v1
日前,腾讯视频云直播、点播均已支持AVS2标准,据悉,腾讯云也是国内首家直播+点播同时支持AVS2视频处理业务的公有云厂商。
本文提出一种高效多尺度Vision Transformer:ResT,它可作为图像中识别的通用骨干架构。不同于现有采用固定分辨率+标准Transformer模块的Transformer模型,它有这样几个优势:
论文: Not All Images are Worth 16x16 Words: Dynamic Transformers for Efficient Image Recognition
本文介绍了TXSQL项目,旨在解决分布式系统中数据一致性和数据可用性的问题,通过自研的基于Paxos协议的一致性算法,配合多种数据复制方式,确保数据的一致性、可靠性、容错性,同时提供了丰富的数据复制方式,并支持跨园区、跨可用区、跨数据中心的部署,并支持多种隔离级别和审计日志,以满足不同业务的需求,同时提供了一些基础监控和运维工具,以确保服务的稳定和可靠,可以作为企业数据库服务的一个基础组件,支持企业的业务运行和发展。
作为腾讯唯一的时序数据库,CTSDB 支撑了腾讯内部20多个核心业务(微信彩票、财付通、云监控、云数据库、云负载等)。
结构重参数(Structural Re-parameterization)已在多领域证实了其优秀的"涨点"优势
容器技术改变了应用交付、运行的方式,几乎各种Linux环境下的应用程序都可以使用容器来运行。但是否能在容器环境里运行数据库应用,以及数据库应用是否适合在容器里运行,一直都是大家很关注的问题,今天我们就来深入分析一下容器环境运行MySQL数据库的事。
https://github.com/tinyvision/damo-yolo (上图源自官网)
大核卷积的实用往往伴随着性能与速度的下降,为此,我们总结了5条大核卷积高效使用的指标方针。
RocketMQ作为一款分布式的消息中间件(阿里的说法是不遵循任何规范的,所以不能完全用JMS的那一套东西来看它),经历了Metaq1.x、Metaq2.x的发展和淘宝双十一的洗礼,在功能和性能上远超ActiveMQ。
网络的管理控制、鉴权认证等关键功能,主要由核心网负责。核心网的能力是否强大,直接影响了整个网络的性能表现。
腾讯云日志服务 CLS 团队联合北京大学软件工程国家工程研究中心、Tencent ES Oteam,在传统搜索引擎的基础上,引入了时序概念,实现了时序搜索引擎。该研究成果《TencentCLS: The Cloud Log Service with High Query Performances》已经被数据库顶会 VLDB 2022 接收,将于 2022 年 9 月份澳大利亚悉尼举行的 VLDB 学术会议上发布。
arXiv:https://arxiv.org/pdf/2112.10175.pdf
机器之心发布 机器之心编辑部 2022年3月21日,寒武纪正式发布新款训练加速卡MLU370-X8。MLU370-X8搭载双芯片四芯粒思元370,集成寒武纪MLU-Link™多芯互联技术,主要面向训练任务,在业界应用广泛的YOLOv3、Transformer等训练任务中, 8卡计算系统的并行性能平均达到350W RTX GPU的155%,并已实现商业化部署。 寒武纪训练加速卡MLU370-X8 双芯思元370架构 MLU370-X8智能加速卡提供250W最大训练功耗,可充分发挥AI训练加速中常见的FP32
视频理解是计算机视觉领域中的重要问题,它有很多应用,如视频自动标注、行为识别和机器人感知。视频理解对自动智能体在现实世界中的应用有重大影响,目前它仍是一道难题。现有的解决方案计算成本高昂,最快速的算法需要在强大的 GPU 上运行才能处理超过 0.5 秒的视频片段。
EdgeOne作为下一代CDN,是腾讯云发布的首款面向全球客户服务的一站式整合型服务产品,也是国内市场上首款真正意义上的一站式边缘安全加速产品。与传统CDN相比,EdgeOne具备安全、灵活、高效及敏捷等多重优势,可以基于腾讯全球边缘节点,为全球客户提供TCP/UDP/HTTP/HTTPS安全防护和加速一体化服务,满足各种行业与场景的多种业务需求!
随着人工智能、云计算等技术的兴起,5G 网络的不断成熟,万物互联时代应用需求日益多样化的同时,对于芯片架构的需求也越来越多样化。ARM 架构在提供可靠性能的基础上,以低功耗、低开销的特点被广泛应用到数据中心和云计算领域,并成为必不可少的部分。 在此背景下,腾讯云重磅推出搭载 ARM 架构处理器的新一代 CVM 标准型 SR1,并于即日起正式开启公测。标准型实例 SR1 搭载主频达 2.8GHz 的 Ampere® Altra® 处理器,基于全新优化虚拟化平台,提供了平衡、稳定的计算、内存和网络资源。
全球顶级嵌入式会展Embedded Word2020这个月底就开了,各路厂家都将拿出看家本领。
论文《ByteTransformer: A High-Performance Transformer Boosted for Variable-Length》提出了字节跳动的 GPU Transformer 推理库 ——ByteTransformer。针对自然语言处理常见的可变长输入,论文提出了一套优化算法,这些算法在保证运算正确性的前提下,成功避免了传统实现中的冗余运算,实现了端到端的推理过程的大幅优化。另外,论文中还手动调优了 Transformer 中的 multi-head attention, layer normalization, activation 等核心算子, 将 ByteTransformer 的推理性提升至业界领先水平。与 PyTorch, TensorFlow, NVIDIA FasterTransformer, Microsoft DeepSpeed-Inference 等知名的深度学习库相比,ByteTransformer 在可变长输入下最高实现 131% 的加速。论文代码已开源。
本文创造性的将MobileNet与Transformer进行了两路并行设计,穿插着全局与特征的双向融合,同时利用卷积与Transformer两者的优势达到“取长补短”的目的。 >>加入极市CV技术交流群,走在计算机视觉的最前沿
本文创造性的将MobileNet与Transformer进行了两路并行设计,穿插着全局与特征的双向融合,同时利用卷积与Transformer两者的优势达到“取长补短”的目的。
Maven 作为经典的项目构建工具相信很多人已经用很久了,但如果体验过 Gradle,那感觉只有两个字“真香”。 前段时间测评了更快的 Maven 构建工具 mvnd,感觉性能挺高的,貌似有了种“没必要再用 Gradle”的感觉了,而本文通过三者的性能对比,告诉你到底谁才是王者。
论文: Coordinate Attention for Efficient Mobile Network Design
TBN:Convolutional Neural Network with Ternary Inputs and Binary Weights ECCV_2018 paper
安妮 编译整理 量子位 出品 | 公众号 QbitAI 今天凌晨,英特尔推出Movidius Myriad X视觉处理单元(VPU),它是一种低功耗系统芯片(SoC),引入了神经计算引擎(Neural Compute Engine)的新结构。 神经计算引擎是一种集成在芯片上的DNN加速器,有了它的助力,Myriad X功率低且性能强,可为无人机、相机、安全系统、VR/AR设备、360度摄像头等设备的视觉和AI应用提供高效解决方案。 这也被视为英特尔在边缘计算(Edge Computing)领域的重要步骤。
本文主要介绍论文《Graph-Based Trace Analysis for Micro-service Architecture Understanding and Problem Diagnosis》,由复旦大学CodeWisdom团队、eBay统一监控团队(UMP)、北京大学软件工程研究所共同发表。该篇论文采用图方法对微服务系统中的trace数据进行聚合和分析,并用于eBay监控场景的故障诊断。论文链接如下:
接着之前的《浅谈动作识别TSN,TRN,ECO》,我们来谈谈最近 MIT和IBM Watson 的新文 Temporal Shift Module(TSM)[1]。
Tools SIG Community:主要涵盖 TiDB 数据处理工具,包含 TiDB 数据备份/导入导出,TiDB 数据变更捕获,其他数据库数据迁移至 TiDB 等。
作者 | 温芳 360 系统部数据开发高级工程师 一年前,360 系统部开始研究云舟项目——打破传统存算一体结构、保持近实时的弹性,云原生计算存储分离类似 Snowflake 的 DaaS 数仓平台,并支撑公司日益增多的机器学习任务 。 我们遇到的第一个挑战就是线下存储如何与云上的计算资源适配,数据依然存储到云下的 PoleFS 存储中,无法对接云上的 Serverless 弹性容器实例。我们倾向于使用 serverless 容器,因为它简单易用、极致弹性、最优成本、按需付费;但同时 Serverless
领取专属 10元无门槛券
手把手带您无忧上云