开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何使用MongoDB将几个小时的行数合并为一天？

基础概念

MongoDB 是一个基于分布式文件存储的开源数据库系统，旨在为 Web 应用提供可扩展的高性能数据存储解决方案。它支持的数据结构非常松散，且支持多查询语言和建立索引。

相关优势

高性能：MongoDB 提供高性能的数据持久化。
易扩展性：支持水平扩展，适合大数据量和高并发的场景。
灵活的数据模型：支持动态模式，易于存储不同结构的文档。
丰富的查询语言：支持丰富的查询操作。

类型

MongoDB 中的数据以文档的形式存储在集合（collection）中，文档是 JSON 格式的 BSON（Binary JSON）。

应用场景

MongoDB 适用于需要高可扩展性、高性能、灵活数据模型的应用，如大数据分析、实时分析、内容管理系统等。

问题解决

假设我们有一个集合 logs，其中存储了每小时的行数记录，每个文档包含 timestamp 和 count 字段。我们需要将这些记录合并为一天的总行数。

示例数据

{ "_id": 1, "timestamp": ISODate("2023-04-01T00:00:00Z"), "count": 100 }
{ "_id": 2, "timestamp": ISODate("2023-04-01T01:00:00Z"), "count": 150 }
{ "_id": 3, "timestamp": ISODate("2023-04-01T02:00:00Z"), "count": 200 }
...

解决方案

我们可以使用 MongoDB 的聚合框架来实现这一需求。聚合框架允许我们对数据进行复杂的转换和计算。

db.logs.aggregate([
  {
    $match: {
      timestamp: { $gte: ISODate("2023-04-01T00:00:00Z"), $lt: ISODate("2023-04-02T00:00:00Z") }
    }
  },
  {
    $group: {
      _id: { $dateToString: { format: "%Y-%m-%d", date: "$timestamp" } },
      total_count: { $sum: "$count" }
    }
  }
])

解释

$match：过滤出指定日期范围内的记录。
$group：按日期分组，并计算每组的总行数。

示例代码

db.logs.aggregate([
  {
    $match: {
      timestamp: { $gte: ISODate("2023-04-01T00:00:00Z"), $lt: ISODate("2023-04-02T00:00:00Z") }
    }
  },
  {
    $group: {
      _id: { $dateToString: { format: "%Y-%m-%d", date: "$timestamp" } },
      total_count: { $sum: "$count" }
    }
  }
])

参考链接

MongoDB 聚合框架文档

通过上述方法，我们可以将几个小时的行数合并为一天的总行数。

相关搜索:如何使用MongoDB将多个查询合并为一个查询？如何在熊猫数据帧上找到一天中几个小时的记录数量趋势？如何将一天中的小时和小时中的分钟转换为日期时间？使用模板将几个向量中的所有元素合并为一个如何使用MongoRepository更新mongodb中的几个字段？如何将行数限制为3，并将一周中每一天的行数相加？如何将多行数据合并为1行不同列名的数据？如何将几个txt文件合并为一个文件，包括它们的名称(使用python)？如何将几个数据帧相互添加，并找出重复的行数？我需要知道如何在几个小时内自动删除，而不是一天的Javascript解析云代码如何将现有的每小时分区合并为hive中的每日分区如何将固定值分配给pandas中一天中的所有小时如何使用mongodb API将随机的nodeJS对象保存到mongodb中？使用cdo和shell脚本将每小时一次的netcdf文件合并为每日文件如何使用MongoDB中的聚合框架来查找每小时、每天、每周、每年的温度数据？如何使用python将数组中的CSV文件转换为MongoDB 如何使用各自的列值将两行合并为一行如何使用php将重复的值键合并为一个数组如何使用FFmpeg将图像的某些部分合并为一个图像？如何使用numpy将嵌套数组合并为维数更大的数组？

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

腾讯云数据库核心集群索引优化实践

腾讯云数据库MongoDB天然支持高可用、分布式、高性能、高压缩、schema free、完善的客户端访问均衡策略等功能。云上某重点用户基于MongoDB这些优势，选用MongoDB作为主存储服务，该用户业务场景如下： · 存储电商业务核心数据 · 查询条件多变、查询不固定，查询较复杂，查询组合众多 · 对性能要求较高 · 对存储成本有要求 · 流量占比：insert较少、update较多、find较多、峰值流量较高 · 高峰期读写流量数千/秒通过和业务沟通，了解业务使用场景和业务述求后，通过一系列的索

03

没有三年实战经验，我是如何在谷歌云专业数据工程师认证中通关的

注：本文专用于2019年3月29日前的谷歌云专业数据工程师认证考试。此后我也做了一些更新，放在了Extras的部分。

05

MongoDB学习笔记：TTL 索引的原理、常见问题及解决方案

MongoDB 提供了 TTL 索引自动在后台清理过期数据，该功能广泛应用在数据清理和分布式锁等业务场景，但是有些业务在使用过程中却发现并非那么理想。本文结合 4.2.11 版本的内核代码，以及腾讯云 MongoDB 产品多年的运营经验，对 TTL 索引原理、缺陷和优化措施进行描述，并对常用业务场景的解决方案进行探讨。

大数据架构的未来

作者：Matt Kalan 原文：The Future of Big Data Architecture 译者：孙薇本文讲述了大数据的相关问题，以及“大数据架构”得名的由来。大数据的问题或许所有读者都明白这一点：数据正在飞速增长。若是能够有效利用的话，我们能从这些数据中找到非常有价值的见解；传统技术有很多都是在40年前设计的，比如RDBMSs，不足以创造“大数据”炒作所宣称的商业价值。在大数据技术的使用上，常见的案例是“客户单一视图”；将关于客户所知道的一切内容放在一起，以便最大化服务提供与自身收入，

07

金融风控数据管理——海量金融数据离线监控方法

作者：housecheng 腾讯WXG工程师 |导语解决金融风控数据监控“开发门槛高”“重复工作多”的痛点，实现PSI计算性能十倍速提升。背景在金融业务上，质量和稳定是生命线，我们需要对所有已经上线的风控要素，如策略、模型、标签、特征等构建监控。在过去，我们部署监控的方式为：风控要素负责同学在要素上线前，通过spark\sql完成对监控指标的运算并例行化；将监控指标运算结果出库mysql\tbase，用于指标的展示和告警；告警系统轮询指标是否异常，如异常则通过企业微信等推送告警消息。这种

01

吴磊：友盟移动大数据平台的架构与实践

友盟数据平台负责人吴磊移动互联网的无处不在催熟了大数据平台，而中国互联网正在面临从IT时代到DT时代的变革，移动互联网与大数据几乎是一种相生相伴的关系。回归到App研发，到后期尤其需要数据与运营。友盟从2010年开始就专注于移动大数据，5年来不仅积累了大量的数据，而且拥有着丰富的技术与经验，那么，友盟大数据平台有着怎样的架构与实践？今天在这里与大家分享一下。一、架构架构思想友盟架构主要参考了Twitter提出的Lambda架构思想。如上图所示，最下面是快速处理层，新增数据在快速处理层计算，这部

03

【最佳实践】巡检项：云数据库（MongoDB）备份是否成功

备份对于数据库是非常重要的一个能力，为防止因系统故障等因素而导致的数据丢失，云数据库 MongoDB 支持对数据进行备份，在系统恢复后并进行数据回档，以保证数据完整性。

00

如何为顶级连锁赌场打造中心化客户数据平台？

L Casino 的挑战主要源自于其内部的信息孤岛问题——其客户信息分散在包括 SQL Server、Oracle 和 PostgreSQL 等在内的多个数据库系统中，这就导致数据管理和访问变得复杂，阻碍了高效运营。

01

B站用户行为分析非官方报告

上次，我们做了一个B站/知乎大V排名监控工具（用python爬虫追踪知乎/B站大V排行）。

01

MongoDB 在Python中的常用方法

MongoEngine 是一个用于 Python 的 ODM（对象文档映射）库，可以让你方便地与 MongoDB 数据库进行交互。它提供了面向对象的方式来定义模型，并对 MongoDB 的数据进行 CRUD（创建、读取、更新、删除）操作。

01

一种基于实时分位数计算的系统及方法

在实际工作中，我们发现许多业务场景中都有对某一数值型指标实时统计分位数的需求，一般要求计算结果有很高准确率同时具备极低的计算延迟，实现这类需求给数据RD的开发工作带来一定的挑战，其中主要的技术挑战包括以下三个方面：

02

技术干货| MongoDB时间序列集合

点击下方公众号关注并分享，获取MongoDB最新资讯！名词解释 Glossary bucket：带有相同的元数据且在一段有限制的间隔区间内的测量值组。 bucket collection ：用于存储时序型集合的底层的分组桶的系统集合。复制、分片和索引都是在桶级别上完成的。 measurement：带有特定时间序列的K-V集合。 meta-data：时序序列里很少随时间变化的K-V对，同时可以用于识别整个时序序列。 time-series：一段间隔内的一系列测量值。 time-series coll

01

亿级月活全民K歌Feed业务如何玩转腾讯云MongoDB

导语 | 腾讯云MongoDB当前服务于游戏、电商、社交、教育、新闻资讯、金融、物联网、软件服务等多个行业；MongoDB团队(简称CMongo)致力于对开源MongoDB内核进行深度研究及持续性优化(如百万库表、物理备份、免密、审计等)，为用户提供高性能、低成本、高可用性的安全数据库存储服务。后续持续分享MongoDB在腾讯内部及外部的典型应用场景、踩坑案例、性能优化、内核模块化分析。引言全民K歌作为腾讯音乐集团四大产品线之一，月活超过1.5亿，并不断推出新的音娱功能及新玩法，极大丰富了数亿用户

01

事务分类---innodb存储引擎笔记+闲扯

事务想必大家都比较熟悉，我们可能张口就来ACID，但是事务的分类，之前我没怎么关心过，今天看姜大神的书MySQL技术内幕---innodb存储引擎看到了这样的几个分类，我把它记录一下：

01

深圳市共享单车数据分析、热力图展示【文末附共享单车数据集清单】

目前最新的共享单车公开数据可能只有深圳市政府数据开放平台[1]发布的共享单车企业每日订单表了，数据量包含2017-04-03到2021-08-30的 2.4 亿条数据，总计约 24G 大小：

01

亿级月活全民K歌Feed业务在腾讯云MongoDB中的应用及优化实践

全民K歌作为腾讯音乐集团四大产品线之一，月活超过1.5亿，并不断推出新的音娱功能及新玩法，极大丰富了数亿用户的音乐娱乐活动。 MongoDB天然支持高可用、分布式、高性能、高压缩、schema free、完善的客户端访问均衡策略等功能。作为腾讯音乐集体核心部门，K歌Feed等业务采用腾讯云MongoDB作为主存储服务，极大的方便了K歌业务的快速迭代开发。本文主要分享K歌技术演进过程中的一些踩坑过程、方案设计、性能优化等，主要包括以下技术点：全民K歌业务特性 Feed业务读写选型 Feed数据吐出控制策

05

行业独家 | 腾讯云ES：PB日志查询大提速，自治索引查询裁剪详解！

作者：腾讯云大数据ES团队背景概述日志场景一般具有明显的冷热特点，比如保留7天的日志数据，但P90查询都集中在近12小时，并且在查询日志时一般使用索引前缀查询，比如filebeat-*，这种查询比指定索引名查询，耗时会长3倍以上。而日志场景一般具有近热远冷的特性，例如刚上报的日志数据，往往读写频率较高，而随着时间推移，频率则慢慢降低，因此，通配查询的必要性并不强，如果能根据该特性进行查询剪枝，将能够极大的提升查询效率。 Search流程浅析在ES中，客户端请求可以发送到集群的任何节点，每个节点都知道任

02

仅378条数据居然导致合服失败？！

| 作者：伍旭飞，腾讯云数据库高级工程师，主要负责腾讯云Redis、MongoDB开发。 ---- 故事从一个MongoDB数据库连接超时案例说起。该异常导致2次合服失败，前面已在服务器上抓包并dump下来，下方是客户端超时现场截图：从截图不难看出，这是一个Nodejs服务出错信息，推测DBA应该是用的nodejs mongodb来实现连接数据库并进行操作，找到这个driver的官网https://github.com/mongodb/node-mongodb-native，clone了一份代码

01

Docker严重错误导致企业数据被黑客擦除，已存在七年之久

编译 | 刘志勇、Tina 谨慎对待那些承诺让工作变得轻松的热门技术——它们通常会偷工减料，而安全性往往是其中之一。几天前，由于 Docker 中存在多年的一个错误，导致 NewsBlur（一种基于 Web 的 RSS 阅读器）的数据库被黑客删除。在本周的一篇博客文章中，NewsBlur 的创始人 Samuel Clay 详细讲述了他的遭遇：在将 MongoDB 集群迁移到 Docker 容器过程中，一名黑客获得了 NewsBlur 数据库的访问权限，删除掉了 250GB 的原始数据，并要求他支付 0.

02

Hive 大数据表性能调优

Hive表是一种依赖于结构化数据的大数据表。数据默认存储在 Hive 数据仓库中。为了将它存储在特定的位置，开发人员可以在创建表时使用 location 标记设置位置。Hive 遵循同样的 SQL 概念，如行、列和模式。

03

秒级SQL查询性能提升方案

1、建立高效且合适的索引因为索引既有数据特征、也有业务特征，数据量的变化会影响索引的选择，业务特点不一样，索引的优化思路也不一样。通常某个字段平时不用，但是某种触发场景下命中“索引缺失”的字段会导致查询瞬间变慢，所以实现要明确业务场景，建立合理的索引。

02

OpenTSDB简介

OpenTSDB(Open time series data base)，开发时间序列数据库。DB这个词很有误导性，其实并不是一个db，单独一个OpenTSDB无法存储任何数据，它只是一层数据读写的服务，更准确的说它只是建立在Hbase上的一层数据读写服务。行业内各种db都很多了，为什么还会出现它？它到底有什么好？它做了什么？别着急，我们来一一分析下。　　其实OpenTSDB不是一个通用的数据存储服务，看名字就知道，它主要针对于时序数据。什么是时序数据，股票的变化趋势、温度的变化趋势、系统某个指标的变化趋势……其实都是时序数据，就是每个时间点上纪录一条数据。关于数据的存储，我们最熟悉的就是mysql了，但是想想看，每5分钟存储一个点，一天288个点，一年就10万+，这还是单个维度，往往在实际应用中维度会非常多，比如股票交易所，成千上万支股票，每天所有股票数据就可能超过百万条，如果还得支持历史数据查询，mysql是远远扛不住的，必然要考虑分布式存储，最好的选择就是Hbase了，事实上业内基本上也是这么做的。（我对其他分布式存储不了解，就不对比了）。　　了解Hbase的人都知道，它可以通过加机器的水平扩展迅速增加读写能力，非常适合存储海量的数据，但是它并不是关系数据库，无法进行类似mysql那种select、join等操作。取而代之的只有非常简单的Get和Scan两种数据查询方式。这里不讨论Hbase的相关细节，总之，你可以通过Get获取到hbase里的一行数据，通过Scan来查询其中RowKey在某个范围里的一批数据。如此简单的查询方式虽然让hbase变得简单易用，但也限制了它的使用场景。针对时序数据，只有get和scan远远满足不了你的需求。　　这个时候OpenTSDB就应运而生。首先它做了数据存储的优化，可以大幅度提升数据查询的效率和减少存储空间的使用。其次它基于hbase做了常用时序数据查询的API，比如数据的聚合、过滤等。另外它也针对数据热度倾斜做了优化。接下来挨个说下它分别是怎么做的。

01

关于高性能的那点儿事

对于大部分应用来说，想要高性能，主要是要做到尽可能的减少网络请求(含DB、Redis、MongoDB、MQ)等。几乎所有的应用，性能瓶颈永远是在带宽那里；关于各个组件到CPU的时间周期，文字描述如下：L1>L2>memory>disk>internet。

02

aic准则和bic准则_用户故事准则

免责声明：这篇文章摘自内部Codurance文档，该文档用于帮助我们的学徒学习我们的工作方式。我们都知道每个项目都是不同的，而且我们绝不能在任何地方应用完全相同的技术和实践。但是，以下文字不仅作为基础，而且还是我们所有人涉及用户故事时的指南。有很多关于用户故事的好书和帖子。这篇文章绝不是该领域所有良好实践的总结。

01

性能最佳实践：查询模式和分析

欢迎阅读MongoDB性能最佳实践系列博客的第二篇。在本系列中，我们将讨论在大规模数据下实现高性能，需要在许多重要维度上进行考虑的关键因素，其中包括：

02

MongoDB的设计规范

1.在JSON中，要跳过一个文档进行数据读取，需要对此文档进行扫描才行，需要进行麻烦的数据结构匹配,遍历比较慢

01

SparkStreaming如何解决小文件问题

使用sparkstreaming时，如果实时计算结果要写入到HDFS，那么不可避免的会遇到一个问题，那就是在默认情况下会产生非常多的小文件，这是由sparkstreaming的微批处理模式和DStream(RDD)的分布式(partition)特性导致的，sparkstreaming为每个partition启动一个独立的线程来处理数据，一旦文件输出到HDFS，那么这个文件流就关闭了，再来一个batch的parttition任务，就再使用一个新的文件流，那么假设，一个batch为10s，每个输出的DStream有32个partition，那么一个小时产生的文件数将会达到(3600/10)*32=11520个之多。众多小文件带来的结果是有大量的文件元信息，比如文件的location、文件大小、block number等需要NameNode来维护，NameNode会因此鸭梨山大。不管是什么格式的文件，parquet、text,、JSON或者 Avro，都会遇到这种小文件问题，这里讨论几种处理Sparkstreaming小文件的典型方法。

03

直播分享| 腾讯云 MongoDB 智能诊断及性能优化实践

点击下方公众号关注并分享获取 MongoDB 最新资讯互动有奖！为了感谢社区小伙伴一直以来的关注与支持，社区又来发送福利啦~ 100%精选留言喜欢这篇文章的小伙伴们要积极活跃起来！社区将会在本文评论下方抽取点赞前5名的评论各赠送社区精美马克杯！评论6月24日（周五）18点结束关闭，19点在公众号底部公布幸运用户！本次直播分享主要分为五个部分展开：第一部分：主要介绍 MongoDB 的核心优势；第二部分：主要总结云上 MongoDB 用户常见的一些问题；第三部分：介绍腾讯云 MongoDB

01

GoSnaps：如何支持5天50万用户服务器只花100元

创业者们似乎有这样一个共识：初创公司应尽快推出MVP(最简可行产品)而不应该把扩展性这样的细节放在心上。总是有人给我说推产品是最高的也实际上是唯一的目标，扩展性这样的问题可以先停留在计划书和PPT上。他们认为在验证产品的市场接受度和融到钱之前搞什么扩展性纯粹是浪费时间。然而这种认识并不正确，而且最近Pokémon GO(宠物小精灵/口袋妖怪GO)的流行又给我们上了一课。 Jonathan Zarra为Pokémon GO开发的聊天应用GoChat只用了5天时间注册用户数就达到了100万。他确实抓住了一个发财

Git 如何优雅地回退代码

从接触编程就开始使用 Git 进行代码管理，先是自己玩 Github，又在工作中使用 Gitlab，虽然使用时间挺长，可是也只进行一些常用操作，如推拉代码、提交、合并等，更复杂的操作没有使用过，看过的教程也逐渐淡忘了，有些对不起 Linus 大神。

04

Git 如何优雅地回退代码

从接触编程就开始使用 Git 进行代码管理，先是自己玩 Github，又在工作中使用 Gitlab，虽然使用时间挺长，可是也只进行一些常用操作，如推拉代码、提交、合并等，更复杂的操作没有使用过，看过的教程也逐渐淡忘了，有些对不起 Linus 大神。

01

Git 这样回退代码，才足够优雅

从接触编程就开始使用 Git 进行代码管理，先是自己玩 Github，又在工作中使用 Gitlab，虽然使用时间挺长，可是也只进行一些常用操作，如推拉代码、提交、合并等，更复杂的操作没有使用过，看过的教程也逐渐淡忘了，有些对不起 Linus 大神。

05

呀！原来这就是前端监控系统

在刚开始学前端的时候，那时候开发的应用总是在用户的设备中出现一些报错，开发者只知道这个型号的设备出现这个问题，但对其他信息却全然不知，比如说其他操作系统、其他设备型号、其他页面会有这个报错吗，这个报错出现的频率又是多少。每次出问题只能等待用户反馈，不能第一时间去解决问题，甚至用户没反馈的话永远也无法发现某些报错。

02

SparkStreaming如何解决小文件问题

使用sparkstreaming时，如果实时计算结果要写入到HDFS，那么不可避免的会遇到一个问题，那就是在默认情况下会产生非常多的小文件，这是由sparkstreaming的微批处理模式和DStream(RDD)的分布式(partition)特性导致的，sparkstreaming为每个partition启动一个独立的线程来处理数据，一旦文件输出到HDFS，那么这个文件流就关闭了，再来一个batch的parttition任务，就再使用一个新的文件流，那么假设，一个batch为10s，每个输出的DStrea

03

【链家2018春招笔试面试帖：18届，数据分析岗】

岗位：数据分析师【如果有小伙伴也是这个岗位，可以加我微信（xuqiugui_）大家以后一起交流，备注：牛客】时间：3-22 现场笔试+两轮技术面+hr面／3-26 VP面试状态：4-3日邮件收到o

04

使用模式构建：模式版本控制模式

有一种说法，生命中唯一不变的东西就是变化。这同样适用于数据库模式。我们会想要获取我们曾经认为不需要的信息。或者一些新上线的服务需要包含在数据库记录中。不管变更背后的原因是什么，一段时间之后，我们不可避免地需要对应用程序中的底层模式设计进行更改。虽然这经常会在传统的表格数据库系统中带来一些挑战甚至是麻烦，但在MongoDB中，我们可以使用模式版本控制来简化这一过程。

03

如何从 MongoDB 迁移到 MySQL

最近的一个多月时间其实都在做数据库的迁移工作，我目前在开发的项目其实在上古时代是使用 MySQL 作为主要数据库的，后来由于一些业务上的原因从 MySQL 迁移到了 MongoDB，使用了几个月的时间后，由于数据库服务非常不稳定，再加上无人看管，同时 MongoDB 本身就是无 Schema 的数据库，最后导致数据库的脏数据问题非常严重。目前团队的成员没有较为丰富的 Rails 开发经验，所以还是希望使用 ActiveRecord 加上 Migration 的方式对数据进行一些强限制，保证数据库中数据的合法。

05

巧用 Redis Hyperloglog，轻松统计 UV 数据

如果你正在开发一个基于“事件”的应用程序，该应用程序可以处理来自不同用户的许多请求，那么你很大可能希望能够计算滑动窗口或指定时间范围内不同的用户操作。

01

asp.net常用函数

Abs(number) 取得数值的绝对值。 Asc(String) 取得字符串表达式的第一个字符ASCII 码。 Atn(number) 取得一个角度的反正切值。 CallByName (object, procname, usecalltype,[args()]) 执行一个对象的方法、设定或传回对象的属性。 CBool(expression) 转换表达式为Boolean 型态。 CByte(expression) 转换表达式为Byte 型态。 CChar(expression) 转换表达式为字符型态。 CDate(expression) 转换表达式为Date 型态。 CDbl(expression) 转换表达式为Double 型态。 CDec(expression) 转换表达式为Decimal 型态。 CInt(expression) 转换表达式为Integer 型态。 CLng(expression) 转换表达式为Long 型态。 CObj(expression) 转换表达式为Object 型态。 CShort(expression) 转换表达式为Short 型态。 CSng(expression) 转换表达式为Single 型态。 CStr(expression) 转换表达式为String 型态。 Choose (index, choice-1[, choice-2, ... [, choice-n]]) 以索引值来选择并传回所设定的参数。 Chr(charcode) 以ASCII 码来取得字符内容。 Close(filenumberlist) 结束使用Open 开启的档案。 Cos(number) 取得一个角度的余弦值。 Ctype(expression, typename) 转换表达式的型态。 DateAdd(dateinterval, number, datetime) 对日期或时间作加减。 DateDiff(dateinterval, date1, date2) 计算两个日期或时间间的差值。 DatePart (dateinterval, date) 依接收的日期或时间参数传回年、月、日或时间。 DateSerial(year, month, day) 将接收的参数合并为一个只有日期的Date 型态的数据。 DateValue(datetime) 取得符合国别设定样式的日期值，并包含时间。 Day(datetime) 依接收的日期参数传回日。 Eof(filenumber) 当抵达一个被开启的档案结尾时会传回True。 Exp(number) 依接收的参数传回e 的次方值。 FileDateTime(pathname) 传回档案建立时的日期、时间。 FileLen(pathname) 传回档案的长度，单位是Byte。 Filter(sourcearray, match[, include[, compare]]) 搜寻字符串数组中的指定字符串，凡是数组元素中含有指定字符串，会将它们结合成新的字符串数组并传回。若是要传回不含指定字符串的数组元素，则include 参数设为False。compare 参数则是设定搜寻时是否区分大小写，此时只要给TextCompare 常数或1 即可。 Fix(number) 去掉参数的小数部分并传回。 Format(expression[, style[, firstdayofweek[, firstweekofyear]]]) 将日期、时间和数值资料转为每个国家都可以接受的格式。 FormatCurrency(expression[,numdigitsafterdecimal [,includeleadingdigit]]) 将数值输出为金额型态。numdigitsafterdecimal 参数为小数字数，includeleadingdigit 参数为当整数为0 时是否补至整数字数。 FormatDateTime(date[,namedformat]) 传回格式化的日期或时间数据。 FormatNumber(expression[,numdigitsafterdecimal [,includeleadingdigit]]) 传回格式化的数值数据。Numdigitsafterdecimal 参数为小数字数，includeleadingdigit 参数为当整数为0 时是否补至整数字数。 FormatPercent(expression[,numdigitsafterdecimal [,includeleadingdigit]]) 传回转换为百分比格式的数值数据。n

03

2021年大数据HBase（十三）：HBase读取和存储数据的流程

1、由客户端发起读取数据的请求, 首先先连接 zookeeper , 从zookeeper获取hbase:meta表被哪个regionServer所管理meta表中主要记录了 hbase中各个表有那些region,以及每个region被哪个regionServer所管理hbase中非常特殊的元数据存储表, 此表只会有一个region

01

SQL Server代理作业的巨大性能飞跃：从2天到2小时的调优

在本文中，麦老师将给大家介绍如何调优SQL Server的代理作业JOB，并结合实际生产案例将一个运行时间从长达2天的作业调优缩短至令人欣喜的2小时。

01

青胜于蓝！这里有数据库的一点新资讯！

导语 | 腾讯云MongoDB目前广泛应用于游戏、电商、ugc、物联网等场景，为了更好地为客户提供服务，腾讯数据库团队对MongoDB进行升级，诞生了青胜于蓝的腾讯云MongoDB 4.2版本，并且已经正式在腾讯云发布啦，让我们一起来看看新版有哪些亮点吧~ 一、 CMongo 介绍 MongoDB作为时下最流行的nosql数据库，是一款集高性能、分布式、易扩展等特性为一身的文档型数据库，同时其易用性和功能丰富程度是其他同类产品所不能比拟的。 CMongo是腾讯云数据库联合团队基于开源Mongo

06

我这几年踩过的十个坑，每一条都是血泪教训

我维护了60多台服务器，理论上，我把他们分成了多个组，每个组部署不同功能的程序。可是有一天，当我要找某个程序的时候，我发现它不在它应该在的那个组中的任何一台服务器上面。但是它确实每小时又都在定时跑。那么，它到底在哪里跑？

01

八十、归并排序及其分而治之思想

归并排序（Merge sort）是建立在归并操作上的一种有效的排序算法。该算法是采用分治法（Divide and Conquer）的一个非常典型的应用。

02

MongoDB开发系列-数据集设计分桶范式

数据集设计模式，MongoDB在官方文档https://docs.mongodb.com/ecosystem/ 中的use cases部分提供了详细的参考内容。

03

构建高并发高可用的电商平台架构实践2

上次发布内容：如没有接上，可以查看下面原文： 6) 搜索在电子商务平台中搜索是一个非常的重要功能，主要有接搜索词类目导航、自动提示和搜索排序功能。开源的企业级搜索引擎主要有lucene, sphinx，这里不去论述哪种搜索引擎更好一些，不过选择搜索引擎除了基本的功能需要支持外，非功能方面需要考虑以下两点： a、搜索引擎是否支持分布式的索引和搜索，来应对海量的数据，支持读写分离，提高可用性 b、索引的实时性 c、性能 Solr是基于lucene的高性能的全文搜索服务器，提供了比lucen

MongoDB的安全和权限控制（一）

MongoDB是一种广泛使用的NoSQL数据库，它提供了一种非常灵活的数据模型，以及可伸缩性和可靠性。然而，正如其他任何数据库一样，MongoDB也需要在安全性方面采取措施来确保用户数据的机密性、完整性和可用性。

04

又动歪脑筋--利用windows上的虚拟机执行定时爬虫并存入本地数据库！！

今天在畅游的主要工作内容是爬取百度贴吧的内容，今天上玩班就要三天碰不到公司的电脑，所以想搞一个定时任务，能在这三天里面每半个小时执行一次爬虫，但是自己不太熟悉windows下定时执行爬虫，所以想到了一

08

关于Cube碎片管理，你需要知道这些!

在上一篇博客中，博主已经为大家介绍了如何进行kylin的增量构建。在最后也讨论了增量构建会导致Segment越来越多，进而降低数据查询的效率。本篇博客，为大家带来的就是如何对Cube进行碎片化的管理

02

一万多条拼车数据，看春运的迁徙图

这篇文章，作者对北京、上海、广州、深圳、杭州等地 1万多条出行数据进行分析，得出了一些有意思的结论，并且绘制了这几个城市春运的迁移图。虽然数据在取样公平性上不能完全符合标准，但是思路还是值得大家学习参考的~

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭