文章作者:Tyan 博客:noahsnail.com | CSDN | 简书
本文为美团文章学习的笔记整理。
美团配送业务场景复杂,单量规模大。在大规模的业务场景下,配送智能化就变得非常重要,而智能配送的核心就是做资源的优化配置。
外卖配送既有线上的业务,也有线下的复杂运营。配送连接订单需求和运力供给。为了达到需求和供给的平衡,不仅要在线下运营商家、运营骑手,还要在线上将这些需求和运力供给做合理的配置,其目的是提高整体的效率。只有将配送效率最大化,才能带来良好的顾客体验,实现较低的配送成本。资源优化配置的过程,实际上是有分层的。在美团的理解中,可以分为三层:
Note:
如上图所示,右边三个子系统分别对应这三层体系,最底层是规划系统,中间层是定价系统,最上层是调度系统。运筹优化是调度系统、定价系统、规划系统的核心技术。
Note:
配送连接的是商家、顾客、骑手三方,配送网络决定了这三方的连接关系。当用户打开App,查看哪些商家可以点餐,这由商家配送范围决定,每个商家的配送范围不一样。用户在美团点外卖,为他服务的骑手是谁呢?又是怎么确定的呢?这些是由配送区域边界来决定的,配送区域边界指的是一些商家集合所对应的范围。
Note:
在传统物流中,影响末端配送效率最关键的点,是配送员对他所负责区域的熟悉程度。越熟悉,配送效率就会越高。即时配送场景也类似,每个骑手需要尽量固定地去熟悉一片商家或者配送区域。对于管理而言,站点的管理范围也比较明确。如果有新商家上线,也很容易确定由哪个配送站来提供服务。所以,这个问题有很多运营管理的诉求在其中。
区域规划项目要解决的问题:1.配送区域里的商家不聚合;2.区域奇形怪状,空驶严重;3.站点的大小不合理。什么是好的区域规划方案?基于统计分析的优化目标设定。
优化的三要素是:目标、约束、决策变量。
在目标和约束条件确定了之后,整体技术方案分成三部分:
在区域规划过程中,人工介入还是非常必要的。
外卖配送场景的订单“峰谷效应”非常明显。上图是一个实际的进单曲线。
配送团队最终选用的是按组排班的方式,把所有骑手分成几组,规定每个组的开工时段。然后大家可以按组轮岗,每个人的每个班次都会轮到。算法要有自己的优化目标,为了解决这个问题,首先要做设计决策变量,把时间做了离散化,以半小时为粒度。对于一天来讲,只有48个时间单元,决策空间大幅缩减。然后,目标定为运力需求满足订单量的时间单元最多。在建模层面,标准化和通用的模型才是最优选。美团把人数做了归一化,算法分配每个班次的骑手比例,但不分人数。在算法决策的时候,不决策人数、只决策比例,这样也可以把单量进行归一化。每个时间单元的进单量除以每天峰值时间单元的单量,也变成了0~1之间的数字。如果某个时间单元内人数比例大于单量比例,叫作运力得到满足。
算法核心思想:基于约束条件,根据启发式算法构造初始方案,再用局部搜索迭代优化。
骑手的路径规划问题,不是简单的路线规划,一个骑手身上有很多配送任务,这些配送任务存在各种约束,怎样选择最优配送顺序去完成所有任务,这是一个NP难问题。当有5个订单、10个任务点的时候,就存在11万多条可能的顺序。系统派单、系统改派,都依赖路径规划算法。在骑手端,给每个骑手推荐任务执行顺序。路径规划算法核心的诉求是优化效果必须是稳定的好。不能这次的优化结果好,下次就不好。另外,运行时间一定要短。
求解路径规划这类问题经历过的阶段:起初,采用类似遗传算法的迭代搜索算法,但是随着业务的单量变大,发现算法耗时太慢,根本不可接受。然后,改为大规模邻域搜索算法,但算法依然有很强的随机性,因为没有随机性在就没办法得到比较好的解。而这种基于随机迭代的搜索策略,带来很强的不确定性,在问题规模大的场景会出现非常多的Bad Case。另外,迭代搜索耗时太长了。在这个项目中,基本可以确定这样的技术路线。首先,只能做启发式定向搜索,不能在算法中加随机扰动。不能允许同样的输入在不同运行时刻给出不一样的优化结果。然后,不能用普通迭代搜索,必须把这个问题结构特性挖掘出来,做基于知识的定制化搜索。
美团认为,最重要的是看待这个问题的视角。这里的路径规划问题,对应的经典问题模型,是开环TSP问题,或是开环VRP的变种么?可以是,也可以不是。美团做了一个有意思的建模转换,把它看作流水线调度问题:每个订单可以认为是job;一个订单的两个任务取餐和送餐,可以认为是一个job的operation。任意两个任务点之间的通行时间,可以认为是序列相关的准备时间。每一单承诺的送达时间,包括预订单和即时单,可以映射到流水线调度问题中的提前和拖期惩罚上。
美团把一个经典的基于问题特征的启发式算法做了适当适配和改进,得到了非常好的效果。相比于之前的算法,耗时下降70%,优化效果不错。
配送调度场景,可以用数学语言描述。它不仅是一个业务问题,更是一个标准的组合优化问题,并且是一个马尔可夫决策过程。并非对于某个时刻的一批订单做最优分配就足够,还需要考虑整个时间窗维度,每一次指派对后面的影响。要考虑长周期的优化,而不是一个静态优化问题。
这个问题的挑战: