九月初,一篇“困在系统里的骑手”的文章,展现了外卖行业险象环生的现状。

当前,激烈的竞争环境正推动外卖平台不断改进算法和骑手绩效考核方式。社会在收获良好顾客体验、较低配送成本和极高配送效率的同时,也付出了骑手权益和行人安全降低的代价。

作为致力于大数据、运筹学,以及人工智能方法在智慧城市领域应用的学者和研究者,我们期望,用更科学的运营流程和算法逻辑,构筑健康、温暖、高效、可持续且具有社会责任的外卖生态体系。

篇幅所限,

针对每项内容,部分介绍了经管等相关学科原理,或数据科学、人工智能和优化算法的可能技术实现路线,以供参考,直接跳过阅读不影响理解全文。

2020年初秋的上海,在写字楼和食肆之间穿行的骑手们。澎湃新闻记者 周平浪 图

一、骑手激励机制设计

在外卖骑手困境的讨论中,改善激励和奖惩机制是关注焦点。

在基于人工智能算法的外卖配送系统中,从顾客成功下单起,该系统便自动化计算最优的订单分派和骑手配送路线,并预测订单“预计送达时间”,以考核“准点率”;一旦配送超时,骑手将面临降低收入甚至淘汰的惩罚。

而这套“最优”方案是在给定的历史数据和预设的模型参数下、通过模拟现实得到的“理想值”或“乐观值”。面对复杂的现实场景,激励机制需具备容错性和灵活性,以抵抗市场不确定性的冲击,降低其收入波动。这不仅可提升骑手的福利水平,也将增强平台总体运力。

预计送达时间容错

面对无法避免的外卖订单配送超时,平台可考虑引入“超时容错机制”,订单的“预计送达时间”设置和显示为时间段,并根据商家备餐状态和骑手配送情况动态调整、提前向顾客提醒可能的超时送达,而非精确到具体时刻,甚至故意将顾客端显示的“预计送达时间”设定为早于骑手端。

技术层面,即便采用先进的深度学习算法,模型学习的结果也只是关于“预计送达时间”的统计分布,不能做到对每个样本的预测值都有绝对准确的“信心”。ETA参数的区间估计结果比点估计结果更可信,后者不能告诉顾客真实送达时间与差距,而前者可反映真实送达时间所处的大致可信范围 。

管理层面,区间形式的“预计送达时间”,是应对预测算法的误差和外部配送环境的变化的容错策略,体现的是对骑手和顾客负责任的态度。与此相关,平台还可根据送达时间区间,设置弹性的实际送达时间考核标准:如实际送达时间在“预计送达时间”前后N分钟,则该笔订单配送记录判定为“正常”,如实际送达时间超过“预计送达时间”N分钟,则该笔配送记录判定为“超时”而纳入超时评估体系;如实际送达时间早于“预计送达时间”N分钟,则该笔配送记录判定为“快速”而纳入高效奖励体系。类似思想已被外卖平台的ETA预估算法采纳,也可作为超时容错策略体现在骑手激励机制设计中。

弹性的超时奖惩

平台可考虑将“超时率”划分多个区间、设计更有弹性的阶梯式超时奖惩规则:超时率分成多个区间段,例如,[0%, 5%]、 ,在指定场所配备专职终端配送人员,将增加固定人力成本,但值得关注的是,根据排队论,骑手每单平均派送时间和顾客等待时间等系统的服务质量指标之间存在强烈非线形关系,这意味着,通过配备专职终端人员以适当降低骑手在这些场所的派送时间可能显著提高系统服务质量指标,从而使得带来的配送效益可能高于额外的人力成本。

未来,平台还可推广机器人和无人机配送。平台可通过相关核心技术的资本投入和技术积累,转型为高科技公司。实际上,美团已尝试无人车和无人机配送:2月疫情期间,外卖平台利用无人配送车为北京顺义几个小区居民做订单配送,截至9月初,平台已累计使用无人车配送6000多用户实际订单,覆盖该站点超过80%的订单需求;目前平台也在深圳等地进行无人机运营测试。

考虑到无人车成本方面的优势和灵活性方面的不足,平台可基于实际配送场景、市场供需状态以及交通路况,采用马尔可夫决策过程,联合优化无人车和骑手之间的分配比例与配送路线。

三、供需调节机制

平台可根据配送距离和配送时段等因素,合理设计基础派送价格和骑手补贴;另外,平台也可针对突变的供需情况,实时调整骑手配送费用,缓解供需不平衡。

动态定价已被广泛使用,包括上世纪80年代采纳的航空业、90年代采纳的酒店业和租车业,以及当前的共享出行。

外卖行业,平台面临的市场供需不协调问题更突出,且市场供需随时间变化剧烈。采取不同形式的配送价格,对提高和使用供需弹性、缓解供不应求的负面影响有一定积极作用;但基于配送价格的动态定价机制不能解决所有问题,还需要平台对该策略的价值进行更深入探究。

基于区域和时间段的时空动态定价

平台可针对每笔订单实行基于配送区域、下单时间或送达时间的动态定价,并对愿意等待的顾客提供愿等打折。

基于区域和时间段的时空动态定价通常可分为“乘积溢价”和“加和溢价”两类:在特定区域和时段内,前者指在基础价格上乘以一定倍数,美国网约车平台Uber早期使用该类溢价策略;而后者指在基础价格上加上与距离无关的常数,这是Uber当前采用的最新溢价策略。研究表明,在供需动态变化环境下,相比乘积溢价策略,加和溢价策略是激励相容 的定价机制。这为外卖平台设计基于配送费的实时动态定价策略提供了方向。

实时动态定价策略仍存争议。理论研究显示,在共享出行背景下,理性的乘客和司机会策略性等待更合适的价格或收入。如果市场状态较平稳,那么平台没必要采用实时动态定价策略,尤其是可能造成乘客、司机、监管者之间的对立。

顾客灵活充值账户

为弥补实时动态定价在区分顾客对等待时间的实际需求和时间敏感性方面的不足,平台可建立灵活的用户充值账户:高峰期时段,如果需要外卖尽快送到,顾客可向个人在平台上的账户充入额外金额,这些资金不会流入骑手或平台,只是在低峰期时段点餐使用。

顾客在高峰时段的充值行为,将传递出其对派送等待时间较敏感的信号,作为系统派单算法的依据,并且,顾客在低峰期使用账户余额订餐,可激发低峰时段的整体需求,充分利用闲散的备餐和配送资源,平滑市场需求。针对网约车的研究表明,一定条件下,合理设计用户充值账户机制 可实现多方共赢,提升顾客、司机和平台的整体社会福利。

增加兼职和众包骑手

平台提升兼职和众包骑手的运力占比,有助于提高运力调整的空间和弹性,更有效地调节市场的供需平衡。

平台骑手分为专送全职和众包兼职,前者工作时间固定并接受系统派单,后者灵活决定工作时间并可有限次拒绝派单。为提升整体运力供给,尤其是满足高峰时段的配送需求,平台通常用现金奖励方式补贴骑手。实证研究表明,网约车市场中,平台补贴将从劳动者是否选择工作和工作时长两个维度影响劳动力供给,而且,兼职劳动者的收入供给弹性 更高。

这意味着外卖平台需更严密地研究骑手的运力供给,分析骑手针对期望收入水平变化而进行的运力供给调整,合理设计平台上全职和兼职骑手的比例,并精准地向骑手、尤其是兼职骑手提供补贴奖励。

1.《骑手 外卖骑手的解困之策(上):要让技术容错》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《骑手 外卖骑手的解困之策(上):要让技术容错》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guonei/360185.html