业务流量峰值检测和数据一致性

由学院君创建于3年前, 最后更新于 3年前版本号 #2 2198 views 0 likes 1 collects

业务流量有尖峰听起来不错，但是当尖峰到来时需要通知开发者以便有足够的资源（CPU、内存等）应对。

检测流量尖峰并发送通知

假设我们是一个监控平台，现在我们的需求是，需要为所有站点用户发送流量尖峰警告，基本实现代码如下：

这里的 $site->current_visitors 表示站点当前访问量，$site->threshold 表示该站点设置的警告阈值，当访问量超过阈值，则发送尖峰预警通知（推送到消息队列异步执行）。这段代码需要作为 CRON 任务每分钟调度一次，以便持续检测流量尖峰。

发送流量尖峰通知的任务类代码如下，这里我们发送的是短信通知：

但是，如果队列很繁忙的话，当用户收到通知时就有延迟了，此时的流量和当时并不一样。如果用户设置的阈值是 100000，发送消息时可能变成了 70000，这会导致用户很困惑，觉得我们的监控系统有问题。

优化流量预警数据延迟问题

模型序列化

这是因为 Laravel 默认会在执行队列时重新查询数据库获取最新数据。

当我们推送任务到队列时，data.command 字段存储的实际上是序列化之后的 SendSpikeDetectionNotification 对象：

这个序列化版本的对象持有的 site 属性也不是 App\Site 模型实例，而是 ModelIdentifier。ModelIdentifier 是一个持有模型信息的简单对象，队列处理器从队列获取到这个任务类进行处理时，会通过这些模型信息再去数据库查询对应的模型实例。

Laravel 这么做的原因主要是减小载荷数据的大小，防止在模型序列化和反序列化时出现问题。

这些底层实现源码位于 SerializesModels Trait 中，感兴趣的同学可以自行去查看。

让任务类自给自足

现在我们了解了消息队列中模型序列化是怎么做的了，每次从队列中取出任务类时，如果持有模型属性，则需要重新执行数据库查询获取最新值。此时的模型状态可能和推送任务类时不一样了。

要避免上面出现的数据延迟问题，必须让任务类可以做到「自给自足」：对于一些可能变动的模型属性，在推送任务时就通过传参将其固定下来，这样在处理任务类时使用的值和推送时就一致了。

修改任务类如下，新增 visitors 属性：

这样一来，序列化版本的任务数据就包含 ModelIdentifier 和 visitors 了。我们可以在 handle 方法中直接使用 visitors 属性获取推送任务时的流量：

就做到前后一致了，用户在收到通知后，也不会再有明明没有达到阈值，却发送警告通知的困惑了。

点赞取消点赞

收藏取消收藏

赞赏

发送邮箱验证消息

队列优先级

重试执行失败的队列任务

自动取消已放弃的订单

发送 Webhook 实现跨应用异步回调

取消会议和自动退款处理

通过幂等设计和原子锁避免重复退款

通过队列批处理退款订单

监控退款任务批处理过程

异步处理会议门票支付及竞态条件处理

业务流量峰值检测和数据一致性

定期生成并发送月账单

处理有访问频率限制的 API 请求

限制队列任务的并发数量

限制队列任务的执行频率

通过熔断器处理不稳定的外部服务

处理外部服务接口未响应

基于队列任务中间件重构服务熔断器

异步高效处理视频上传

通过云服务 API 创建无服务器（Serverless）数据库

基于任务链和批处理生成复杂报告

为用户聚合来自不同社交平台的消息流

通过事件监听器异步发放优惠券

异步发送应用部署通知

选择正确的 CPU 和内存配置

管理队列处理器进程和内存泄露问题

队列处理器进程的弹性伸缩

基于 Laravel Horizon 管理队列处理器进程和伸缩策略

处理队列任务生命周期的所有失败

如何选择正确的消息队列驱动

如何确保 Redis 驱动消息队列的高可用

在生产环境管理队列任务的重试

在应用部署时重启队列任务处理进程

如何设计可靠的消息队列任务

基于 Bus 门面或 dispatch 函数推送队列任务

Laravel 队列系统配置参考大全

业务流量峰值检测和数据一致性

检测流量尖峰并发送通知

优化流量预警数据延迟问题

模型序列化

让任务类自给自足

无评论