您的位置首页休闲

掀翻传统引ot 效难题么一起 Rec 端到端模型怎果与本钱双吞噬qu荐One

AI 大模型LLM)掀起的生成式改造,正重塑各行各业,连咱们每天刷到的引荐体系也不破例。传统引荐体系像一条多环节的“流水线”级联架构),简单导致算力糟蹋、方针抵触,限制了开展。要打破瓶颈,要害在于用 …

AI 大模型(LLM)掀起的吞噬生成式改造 ,正重塑各行各业 ,掀翻型起效果连咱们每天刷到的传统引荐体系也不破例。

传统引荐体系像一条多环节的引荐“流水线”(级联架构) ,简单导致算力糟蹋 、端到端模方针抵触 ,本钱限制了开展 。双难要打破瓶颈 ,吞噬要害在于用 LLM 技能进行“一体化”重构,掀翻型起效果完成作用提高和本钱下降 。传统

快手技能团队最新提出的引荐 「OneRec」 体系 ,正是端到端模这一思路的打破。它初次用端到端的本钱生成式 AI 架构 ,完全改造了引荐体系的双难全流程 ,在作用和本钱上完成了“既要又要” :

  • 作用陡增 :有用核算量提高 10 倍!吞噬让强化学习技能在引荐场景真实“活”了起来 ,引荐更精准 。

  • 本钱锐减  :通过架构改造 ,练习和推理的算力使用率(MFU)别离飙升至 23.7% 和 28.8% ,运营本钱(OPEX)仅为传统计划的 10.6% !

现在 ,该体系已在快手 App / 快手极速版双端服务一切用户 ,接受约 25% 的 QPS(每秒恳求数量) ,带动 App 逗留时长提高 0.54%/1.24% ,要害目标 7 日用户生命周期(LT7)明显增加,为引荐体系从传统 Pipeline 迈向端到端生成式架构供给了首个工业级可行计划。

完好技能陈述链接 :https://arxiv.org/abs/2506.13695  。

image76580.png

(图: OneRec 体系概览)。

OneRec 根底模型分析 。

OneRec 选用端到端生成式架构,创始协同感知多模态分词器:通过交融视频标题、图画等多维信息与用户行为,使用 RQ-Kmeans 分层生成语义 ID 。其 Encoder-Decoder 结构将引荐转化为序列生成使命 :

● Encoder 整合用户终身 / 短期行为序列完成多标准建模;

● MoE 增强的 Decoder 通过 Next Token Prediction 精准生成引荐成果 。

● 试验验证其遵从 Scaling Law—— 参数量增至 2.633B 时练习丢失明显下降 ,结合特征 / 码本 / 推理级优化,完成作用与算力的协同打破。

强化学习(RL)偏好对齐。

OneRec 打破传统引荐依靠前史曝光的限制,立异引进强化学习偏好对齐机制。通过交融偏好奖赏(用户偏好) 、格局奖赏(有用输出)及事务奖赏(工业需求)构建归纳奖赏体系,并使用个性化 P-Score 作为强化信号。选用改善的 ECPO 算法(严厉切断负优势梯度)提高练习稳定性  ,在快手场景中完成不丢失曝光量前提下明显提高用户时长,到达工业级作用打破 。

image76581.png

功能优化。

在功能优化上 ,OneRec 打破传统引荐 MFU 个位数魔咒:通过架构重构 + 算子紧缩 92% 至 1,200 个,练习 / 推理 MFU 提高至 23.7%/28.6% ,算力效能达干流 AI 模型水平 ,完成 3-5 倍跃升 。初次让引荐体系到达与干流 AI 模型比肩的算力效能水平。

此外,快手技能团队还针对 OneRec 特性在练习和推理结构层面进行了深度定制优化  。练习侧选用恳求分组特征复用与变长 Flash Attention 提高核算密度 ,自研 SKAI 体系完成 Embedding 全流程 GPU 练习,完全消除 CPU 同步瓶颈;推理侧创始核算复用架构 ——Encoder 单次前向 + Beam 间 KV 同享 + Decoder 层 KV Cache ,支撑 512 大 Beam Size 生成需求 ,并根据 Float16 混合精度与 MoE / Attention 算子深度交融提高吞吐 。终究练习 / 推理 MFU 达 23.7%/28.8%(较传统模型提高 3-5 倍) ,运营本钱降至传统计划 10.6%  ,完成近 90% 本钱节约。

Online 试验作用。

该模型通过一周 5% 流量 AB 测验 ,在点赞  、重视、谈论等一切交互目标上均获正向收益 (如下图)。体系现已全量掩盖短视频引荐主场景  ,承当约 25% QPS 。除了短视频引荐的消费场景之外 ,OneRec 在快手本地生活服务场景相同体现冷艳 :AB 比照试验标明该计划推进 GMV 暴升 21.01%  、订单量提高 17.89%、购买用户数增加 18.58% ,其中新客获取功率更完成 23.02% 的明显提高。现在,该事务线已完成 100% 流量全量切换 。

图片

生成式 AI 方兴未已,正引发各范畴根本性技能革新与降本增效 。OneRec 不只证明了引荐体系与 LLM 技能栈深度交融的必要性,更重构了互联网中心根底设施的技能 DNA 。跟着其新范式的到来 ,引荐体系将加快迎来「端到端生成式觉悟」时刻。

广告声明:文内含有的对外跳转链接(包括不限于超链接 、二维码 、口令等方式),用于传递更多信息,节约甄选时刻,成果仅供参考 ,一切文章均包括本声明。

本文来自入驻作者,不代表权夜网立场,转载请注明出处:https://1p7.xyethdzxyey.org.cn/html/69d3399897.html

发表评论

邮箱地址不会被公开。 必填项已用*标注

返回顶部