文章内容来源于公众号:微信派 点此可查看原文。若涉及版权问题或存在侵权情况,请及时与我们联系,我们将第一时间进行删除处理。
有时候,快比慢更好。
比如,“推荐系统模型”就是这样。
现在,微信的超大规模推荐系统模型低延时更新方案Ekko,全球模型更新生效延时低于2.4秒。
并且,微信基础架构团队关于Ekko方案详解的论文,入选了计算机系统领域顶级国际会议OSDI,这是腾讯首次以第一单位在该会议上发表论文。而OSDI是计算机系统领域最顶级的国际学术会议,被誉为“操作系统原理领域的奥斯卡”,创会以来近30年,国内单位在该会议发表论文总数仅20余篇。
Ekko不仅在学术上填补了业界在模型高效更新上的空白,相比之前的最佳方案提升高达100x。
现有推荐系统更新方案
Ekko系统架构
微信之所以打造Ekko,是因为微信的深度学习推荐系统必须要低延时地更新推荐系统模型——社交活动中,用户的兴趣会随时事热点不断发生变化,用户发布的新视频、新文章也在源源不断地流入系统中。简单来说,为了让用户每时每刻都能看到自己感兴趣的新内容,微信需要一个推荐系统实时更新系统。
微信这一空前的规模和实时社交特性使得业界之前最好的推荐模型更新方案都不能很好地进行适配,以前的方案需要十分钟以上,数十分钟甚至数小时才能进行一次模型更新。
异构带宽网络下Ekko的加速效果
Ekko 来源于微信的 WePS 项目,在 2021 年初全面上线。现在,微信使用了Ekko在数千台机器上存储了数百TB的模型,涵盖包括视频号、看一看和订阅号等场景,每天服务超过10亿用户。在视频号全量使用基于Ekko的在线推荐后,结合产品迭代与运营,半年内DAU增加40%,总VV增长87%。





















