首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

首次揭秘双11双12背后的云数据库技术!| Q推荐

从 2009 年到 2021 年,从千万交易额到千亿交易额,双 11 已经开展了 12 年。如今,每年的双 11 以及一个月后的双 12,已经成为真正意义上的全民购物狂欢节。...是什么样的数据库撑起了 2021 年的双 11 双 12 的稳定进行?...《数据 Cool 谈》第三期,阿里巴巴大淘宝技术部双 12 队长朱成、阿里巴巴业务平台双 11 队长徐培德、阿里巴巴数据库双 11 队长陈锦赋与 InfoQ 主编王一鹏,一同揭秘了双 11 双 12 背后的数据库技术...让历史订单能够实时检索 第二个被满足的业务层诉求就是双节期间历史订单能被实时检索。这个功能也是过往在大促高峰时会被降级的功能。...在 2021 年的双 11 双 12 中,ADB 3.0 真正实现了无论是否在峰值场景,都能让历史订单实时检索。 具体而言,ADB 3.0 解决了三方面的问题: 全量数据迁移与实时同步。

31.8K50

java爬虫实时采集小说+springboot推荐算法+实现在线小说免费阅读推荐系统

总结,本文从系统建设涉及到的技术介绍到框架搭建,对系统涉及到的商品推荐算法给出了详细的设计流程及核心代码块,从整体上完成了本应用商品推荐系统的开发过程。...如何针对互联网各大小说阅读网站的小说数据进行实时采集更新,建立自己的小说资源库,针对海量的小说数据开展标签处理特征分析,利用推荐算法完成针对用户的个性化阅读推荐?...基于以上问题,本次小说推荐系统,建设过程主要分为小说推荐网站前端系统,小说运维管理后台系统,小说数据实时采集爬虫三个部分。...小说推荐网站前端系统主要采用开源前端框架搭建小说推荐网站,提供用户登录注册,小说阅读等功能,小说运维管理后台,提供管理员用户使用完成系统内部小说,用户等数据的管理,小说数据采集爬虫支持各大小说阅读网站的内容采集及更新...一、程序设计本次小说推荐系统主要内容涉及:主要功能模块:小说推荐网站前台,系统管理后台,小说爬虫采集平台主要包含技术:springboot,mybatis,mysql,javascript,vue.js

1.5K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Apache Pulsar 在微信大流量实时推荐场景下的实践

    导语 本文整理自 8 月 Apache Pulsar Meetup 上,刘燊题为《Apache Pulsar 在微信的大流量实时推荐场景实践》的分享。...微信的业务场景包括推荐业务、风控、监控系统、AI 平台等。数据通过 SDK 和数据采集方式接入,经由 MQ、Kafka、Pulsar 消息中间件,其中 Pulsar 发挥了很大的作用。...非持久化 Topic 在大流量实时推荐场景中有应用,但具体的应用场景必须满足“可容忍少量数据丢失”的要求。...实践中有三种场景满足这一要求: 大流量 + 消费端处理能力不足的实时训练任务; 时效性敏感的实时训练任务; 抽样评测任务。...: 团队还在实时推荐场景下优化了 Broker 缓存。

    97720

    Apache Pulsar 在微信大流量实时推荐场景下的实践

    作者 | 刘燊 编者按:本文整理自 8 月 Apache Pulsar Meetup 上,刘燊题为《Apache Pulsar 在微信的大流量实时推荐场景实践》的分享。...微信的业务场景包括推荐业务、风控、监控系统、AI 平台等。数据通过 SDK 和数据采集方式接入,经由 MQ、Kafka、Pulsar 消息中间件,其中 Pulsar 发挥了很大的作用。...中间件下游接入数据计算层 Hadoop、Spark、Flink、ClickHouse、TensorFlow 等计算平台,由于本次介绍实时推荐场景,因此较多使用 Flink 和 TensorFlow。...非持久化 Topic 在大流量实时推荐场景中有应用,但具体的应用场景必须满足“可容忍少量数据丢失”的要求。...: 团队还在实时推荐场景下优化了 Broker 缓存。

    63620

    搜索,大促场景下智能化演进之路

    演进概述 阿里搜索技术体系目前基本形成了offline、nearline、online三层体系,分工协作,保证电商平台既能适应日常平稳流量下稳定有效的个性化搜索及推荐,也能够满足电商平台对促销活动的技术支持...演进的背景 运用机器学习技术来提升搜索/推荐平台的流量投放效率是目前各大互联网公司的主流技术路线,并仍然随着计算力和数据的规模增长,持续地优化和深入。...,并将计算结果实时更新同步给主搜、商城、店铺内引擎、天猫推荐平台、流量直播间等下游业务。...第一次在双11大促场景下实现了大规模的实时计算影响双11当天的流量分配。 2014年双11当天,Pora系统首次经受了双11巨大流量的洗礼,系统运行可以说是一波三折。...随着时针跨过12点,流量风暴如期而至。Pora QPS飙升到40万/秒,接近日常QPS的10倍。

    6.5K40

    大数据实时链路备战——数据双流高保真压测

    2.2 双流憋坝的压测目标制定 压测目标设定,一般会参照历史峰值和市场预估,给出核心交易、流量主题链路峰值预估,例如22年双11的1.2倍。...2.3 双流憋坝的压测方案 (1)交易的憋坝方式,通过停止同步任务憋单 ,交易双流架构图如下所示: 图1.交易双流架构图 (2)流量的憋坝方式,流量无损憋坝压测是通过停止采集服务写JDQ写集群的方式憋流...3.2 不参与压测的业务方的迁移方案 (1)切换集群: A、交易不涉及,交易从源头topic都是双流双活,业务可以切换消费到不压测机房对应的topic即可 B、流量直接消费点击流吐出的topic,需要切换到无损压测集群...如果迁移过程中看不到集群“JDQ4澜沧江_点击流新建流”,可以联系运维同学支持 (2)切换topic鉴权 A、交易是双流,廊坊和汇天都有对应的topic,不参与压测的业务方可以申请,消费非压测机房对应的topic即可 B、流量不是消费采集服务直接吐出的...topic,消费的是流量实时数仓及以下链路的topic,也是双流双活,切换消费到非压测机房对应的topic即可 04 总结 理解,首先 MCube 会依据模板缓存状态判断是否需要网络获取最新模板

    38320

    数据分析高级教程(一)

    :31:122012-01-01 12:31:12/a/......基于点击流数据我们可以统计出许多常见的网站分析度量 1.2网站流量数据分析的意义 网站流量统计分析,可以帮助网站管理员、运营人员、推广人员等实时获取网站流量信息,并从流量来源、网站内容、网站访客特性等多方面提供网站分析的数据依据...造成流失的原因很多,如: 不恰当的商品或活动推荐 对支付环节中专业名词的解释、帮助信息等内容不当 2、迷失 ?...造成迷失的主要原因是转化流量设计不合理,访问者在特定阶段得不到需要的信息,并且不能根据现有的信息作出决策 总之,网站流量分析是一门内容非常丰富的学科,本课程中主要关注网站分析过程中的技术运用,更多关于网站流量分析的业务知识可学习推荐资料...转化数据的应用 ·在报告的自定义指标中勾选转化指标,实时掌握网站的推广及运营情况。 ·结合“全部来源”、“转化路径”、“页面上下游”等报告分析访问漏斗,提高转化率。

    1.4K30

    淘宝大数据体系之数据采集

    UV(独立ip地址的浏览量)、PV(页数被查看的数量)解决了流量来源统计、页面流量统计的问题,但随着互联网业务的发展,这些分析数据已经远远不能满足用户细分研究的需求。 2、扩展信息。...采集脚本执行时,会向日志服务器发一个日志请求,将采集到的数据发送到日志服务器。在多数情况下,事件发生后会被立即执行,但在个别情况,会延迟发送。...并通过消息中间件,将数据送给实时、或离线大数据分析工具中。 三、APP端的数据采集方法 APP分为两种:纯Native APP、嵌入H5的Hybrid APP。...Native页面一般采用采集SDK进行日志采集,而H5的App则采用浏览器的页面日志采集方式进行采集。 四、高峰时期日志采集的处理办法 以双11时段,客户端的日志采集量非常惊人,因此需要做特殊处理。...2、在实时处理方面,也做了很多优化,提高吞吐量。 3、延时上报。即让满足条件的日志被暂存在客户端,待流量下降后,再将数据上传到服务器端。

    1.7K20

    聊聊淘宝天猫个性化推荐技术演进史

    回到杭州之后,团队全员进入备战状态,我们的努力在双11当天得到了回报。2015年11月12日凌晨,推荐算法团队、手淘及天猫的众多小伙伴们并不觉得疲乏,大家的脸上都闪烁着喜悦。...除了常规的个性化推荐之外,我们在2016年双11开始尝试融合商家流量分配的个性化推荐。...随着个性化场景的不断升级,商家很多时候都对流量的波动束手无策。对那些有运营能力的商家来说,我们希望其通过更多优质的商品和优秀的服务换来更多的流量或销量上的部分确定性。...因为推荐各场景大小不一、定位差异大,有导购类场景、有成交类场景等,我们需要根据场景本身的特性来进行流量智能调控。因此,商家赋能个性化推荐系统 — Matrix应运而生。...随着用户对不同推荐场景的持续浏览和交互,推荐系统对于用户实时需求和意图的理解会越来越清晰,因此也可以更准确地为用户推荐更为合适的内容。

    3.4K10

    14亿人的大项目,拿下!

    一、高并发、高复杂度实时统计和分析查询的要求 在这个普查过程中,700万普查员使用微信小程序进行数据采集,约一亿人使用微信自主填报小程序进行信息录入,海量数据全部实时入库;与此同时,为了便于假如数据采集出现问题能够在第二天及时补充采集...有了这么一道缓存墙,业务运行中既能从容应对暴涨的流量,也能防止小程序突然崩溃,给这次普查上了一道“双保险”。...TDSQL,通过“双引擎”设计支撑人口普查工作完成。...双引擎技术能力的融合,完整、平稳、高效地支撑了全国人口普查数据登记及统计分析整个体系化工作。 ?...- End -  直播推荐 明天(5月13日) 19:00-20:00,腾讯云老司机分享《萌新云数据库学习指南》,手把手带你入门数据库。还有免费培训课、Q币、周边大礼包等你来拿,扫码即可参与~ ?

    87640

    浅谈容量测试与容量规划

    ,有以下几种方式: ①、埋点采集:即在系统的各个节点,根据需要添加埋点,针对性的进行数据采集; ②、日志/数据库:通过日志服务(比如ELK)或者运维监控(现在很流行的Devops),采集分析数据; ③、...Agent/探针:在需要采集的节点添加Agent/探针,实时采集,数据存入时序数据库(比如influxdb),实时展示; 3、注意事项 ①、采集对比的数据一定要采集线上的真实数据,这样才能反映真实客观的系统压力...(比如双十一,大促,秒杀) ②、为了双 11 、促销、秒杀、渠道拓展引流等业务需求,需要扩充到什么数量级的服务,才能即保证系统的可用性、稳定性,又能节约成本?...2、容量规划四步走 ①、业务流量预估阶段:通过分析历史数据以及实时的线上监控,预估未来某个时间点或者某个业务可能会有多少多少的流量冲击; ②、系统容量评估阶段:根据具体的业务场景,分析每个业务场景的流量配比...:根据压测的结果,设定限流、服务降级等系统保护措施,来预防当实际流量超过系统所能承受的最大流量时,系统无法提供服务; 3、扩容手段 ①、垂直扩容 升级服务的硬件配置,让单个服务节点的容量更大,来提供更高的系统服务能力

    3.3K10

    干货 | 携程代码分析平台,快速实现精准测试与应用瘦身

    例如精准测试场景,平台可以与发布流程结合起来,开发提测后自动识别变更内容,并智能推荐自动化用例并执行,将执行结果实时同步给开发和测试人员,实现变更→发布→用例推荐、执行、反馈→修复变更的闭环。...综合考虑,推荐使用第二种方式,另外为了最大程度的降低采集流量期间STW对业务的影响,需要选取最适合采集的实例并提前停止对外服务(集群部署可以通过实例拉出实现)。...4.3.1 生产流量采集 生产流量采集主要包含两部分内容,入口流量采集和应用内部方法流量采集。 入口流量主要指api(job任务/消息处理)被外部调度的情况。...应用内部方法流量采集的原理(动态分析)前面已经介绍过,这里重点介绍集群部署的场景下,采集实例选取的三个基本原则。 首先是保障采集对生产影响最小。...最后是保障采集过程可持续。随着业务快速迭代,生产流量是不断变化的,因此流量采集需要周期性的持续进行。

    70411

    不仅仅是双11大屏—Flink应用场景介绍

    双11大屏 每年天猫双十一购物节,都会有一块巨大的实时作战大屏,展现当前的销售情况。 这种炫酷的页面背后,其实有着非常强大的技术支撑,而这种场景其实就是实时报表分析。...在整个计算链路中包括从天猫交易下单购买到数据采集,数据计算,数据校验,最终落到双十一大屏上展示的全链路时间压缩在5秒以内,顶峰计算性能高达数三十万笔订单/秒,通过多条链路流计算备份确保万无一失。...应用场景 在实际生产过程中,大量的数据不断的产生,例如金融交易数据、互联网订单数据、GPS定位数据、传感器信号、移动终端产生的数据、通信信号数据等,以及我们熟悉的网络流量监控,服务器产生的日志数据,这些数据最大的共同点就是实时从不同的数据源中产生...实时智能推荐 智能推荐会根据用户历史的购买行为,通过推荐算法训练模型,预测用户未来可能会购买的物品。...推荐系统本身也在飞速发展,除了算法越来越完善,对时延的要求也越来越苛刻和实时化。

    5.6K21

    在视觉检测上使用万兆POE+解决工业相机高清需求

    摘要:紧跟工业4.0步伐,工业相机应用,双口万兆PoE图像采集卡   随着经济进入新常态,工业也步入4.0时代。...整个机器视觉系统分为图像采集与图像处理两大板块,采用模拟工业相机的图像采集系统中,图像采集卡就是连接这两大板块的重要组件。...由于模拟视频输入端可以提供不间断的信息源,视频采集卡要采集模拟视频序列中的每帧图像,并在采集下一帧图像之前把这些数据传入PC系统。因此,实现实时采集的关键是每一帧所需的处理时间。...因为如果流量超负荷,则会出现丢包现象。   面对如此的市场空间,LR-LINK工业相机图像采集供电网卡成为众多客户商家的首选产品。...联瑞电子有一款双口万兆的PoE网卡,在连接万兆工业相机上,轻松应对供电及带宽需求,已在客户的灰点、巴斯勒等相机上使用实现对了客户的需求。

    1.3K1211

    专访 | 阿里搜索事业部研究员徐盈辉:剖析阿里背后的强化学习技术

    在双 11 推荐场景中,阿里巴巴使用了深度强化学习与自适应在线学习,通过持续机器学习和模型优化建立决策引擎,对海量用户行为以及百亿级商品特征进行实时分析,帮助每一个用户迅速发现宝贝,提高人和商品的配对效率...在阿里巴巴搜索事业部,搜索和推荐算法团队的研究重点是,电商平台下的智能化流量投放系统,消费者权益智能化分发系统。...其技术特点是运用多种机器学习技术,通过用户、query、商品以及对商家的理解,来提升搜索/推荐平台的流量投放效率。...2014 年双 11 通过排序特征实时,引入商品实时转化率,实时售罄率模型进入搜索 match 和 rank,让售罄商品额无效曝光大幅减少,并实现了成交转化的大幅提升;2015 年双 11 推出双链路实时计算体系...,在特征实时的基础上,引入排序因子的在线学习,预测,以及基于多臂机学习的排序策略决策模型,在预热期和双 11 大幅提升了搜索流量的成交转化效率;2016 年实时学习和决策能力进一步升级,实现了排序因子的在线深度学习

    2.5K110

    影视行业大变革:HarmonyOS 下AI类目标签技术深度剖析

    本文聚焦HarmonyOS NEXT API 12及以上版本,为开发者全面解析如何运用这一技术,推动影视行业在鸿蒙生态下实现创新发展。...其分布式能力可实现多设备协同,影视创作者在电脑、平板、手机等不同设备上创作时,能无缝切换,数据实时同步。...AI类目标签在鸿蒙系统中的运行机制在鸿蒙系统下,AI类目标签技术运行分为数据采集、模型训练和标签应用三个阶段。数据采集阶段,通过网络爬虫、视频平台接口等方式收集影视内容数据,包括视频帧、音频、字幕等。...最后,在标签应用阶段,将训练好的模型部署到影视制作工具、视频平台等应用中,实时为新上传的影视内容打上标签,实现内容的智能管理和推荐。...某视频平台引入该技术后,用户对推荐内容的点击率提高了15%,有效提升了平台的流量和收益。

    9000

    流沙:宜信安全数据平台实践

    采集的数据主要包括: 流量数据——使用packetbeat进行解析 日志数据——文件形式的日志使用filebeat进行采集;syslog形式的数据采用rsyslog进行采集 运维数据——为方便故障排查和集群性能监控...OpenSOC同样存储了流量数据和日志数据,数据采集之后先发送到kafka,然后通过storm进行格式化和字段扩充之后分别写入hive、ES和HBase,最后通过webservise或者分析工具对数据进行分析...网络流量使用packetbeat进行网络数据解析,日志文件采用filebeat进行采集,系统性能监控和ybridge性能监控使用的是metricbeat。...首先,整个平台除了beats和kibana,均为冗余部署,甚至流沙平台的日志接受服务器也采用了双活部署的方式;其次,预处理程序可以随时启停,实现程序的平滑升级,用户无感知;最后,为了确保稳定性,流沙平台添加了大量监控告警...硬件分流由于其更加简单而且可靠,比较推荐。

    1.7K30

    金融科技&大数据产品推荐:达观数据—金融平台产品及资讯个性化推荐引擎

    应用场景二:构建金融平台个性化资讯内容生态 金融平台目前都面临用户体验提升和服务生态构建的需求,达观数据提供个性化资讯推荐技术服务,围绕用户在平台的消费、投资、理财、生活等金融场景,整合采集第三方优质内容...第三,内容排行榜; 使用多融合算法对推荐内容进行排序,根据用户行为反馈实时更新排行。...6、产品优势 第一,达观独有专利-双叠组合算法,多次获得国际算法竞赛冠军:达观业界顶尖专利算法,为客户深度调优,为企业带来最优推荐转化;达观的离线-近线-在线三层系统架构,兼顾强大算法和灵活服务;基于机器学习的重排序框架...伴随着移动互联网发展,互联网金融平台大量出现和金融行业资讯泛滥,如何让用户高效获取信息,提升平台留存和付费转化变的至关重要,达观个性化推荐引擎通过精准用户画像和算法模型让平台金融产品利用已有流量提升运营指标...,全平台精准推荐服务,也可根据平台需求采集第三方资讯内容数据,为平台构建产品、电商、资讯等生态化内容推荐服务。

    3.4K50
    领券