Skip to main content

Command Palette

Search for a command to run...

生成式推荐的演进与工业实践

Updated
2 min read

生成式推荐系统正在快速重塑信息分发范式,其核心思想是把传统“粗召回—精排”多级流水线压缩为单一生成模型的序列到序列推理,从而同时输出推荐列表、顺序乃至解释文本或新内容。该方向的重要性在于:一方面,它为融合多模态、对话交互、冷启动外推等长期难题提供了统一框架;另一方面,在多家互联网公司的大规模线上实验中已显示出可观的商业收益,表明这不仅是学术概念,更是下一代工业推荐系统的现实选择。

1 推荐系统范式的演进

早期系统依赖基于相似度的记忆式协同过滤;Netflix Prize 之后,矩阵分解成为主流,通过潜向量刻画用户与物品关系。随后,深度两塔、Wide & Deep、DIN、GNN 等模型借助非线性表达提升刻画能力,但仍遵循“先召回候选,再多级排序”逻辑。生成式推荐系统则把用户历史、上下文、文本、图像等全部离散化为 token,通过大语言模型一次性生成推荐列表,彻底改变流水线结构与优化目标。

2 生成式推荐系统的技术框架与差异

组件传统推荐系统生成式推荐系统
输入表示ID 嵌入、数值/类目特征用户、物品、上下文统一编码为 token
模型主体协同过滤、两塔、GNN、Transformer 排序器LLM 或特化生成模型直接学习“输入→推荐”
目标函数评分回归、BPR、交叉熵排序语言建模或检索-生成混合损失
推理过程多级召回与排序单模型生成有序列表并可附加解释
输出形态固定长度候选集合可变长 ID 序列、解释、甚至新内容

与传统方法相比,生成式模型在表示统一、流程简化、交互友好与冷启动外推等方面具备显著优势;挑战则集中在高推理成本、评价体系缺失、幻觉风险和 ID token 化效率。

3 代表性研究进展

  • HSTU:采用稀疏自注意力处理超长序列,支持万亿级参数扩展。

  • P5:提出“预训练—个性化提示—预测”三阶段框架,把多种推荐子任务统一到文本到文本范式。

  • TokenRec:设计 Masked Vector-Quantized Tokenizer,将向量离散化为稳定 token,兼顾新用户/物品泛化与生成效率。

  • OneRec:在快手短视频场景中使用 Encoder-Decoder Transformer 与稀疏 MoE,直接生成 5-10 条视频列表,并通过迭代偏好对齐(IPA) 仅用 1 % 自生成样本提升观看时长 4.0 % 和 Like Through Rate 5.4 %;线上 A/B 显示总观看时长提升 1.68 %、人均观看时长提升 6.56 %。KV-Cache、FP16 量化与稀疏专家激活仅耗约 13 % 显存。

  • RecGPT、Fed4Rec:分别探索领域特化大模型和联邦场景下的隐私友好生成推荐。

4 “生成式检索仅做召回”观点的再评估

2022 年的 DSI 把搜索建模为“query→docid”生成,只覆盖召回阶段;SIGIR 2024 教程仍沿用这一描述。然而自 2024 年起,ROGER 与 Listwise GR 在训练期直接优化列表顺序,推理时无需外部 reranker;OneRec、UniGRF 等工作更在推荐场景中一次性完成检索与排序并上线验证。由此,“生成式检索只能做召回”已不再准确,检索-排序一体化成为明显趋势。

5 工业界的落地实践

5.1 短视频与内容平台

  • 快手 OneRec:撤销多级排序后,主链路观看时长提升 1.6 %,MoE-LLM 以轻量 FLOPs 实现十亿级参数。

  • 抖音 Next-User Retrieval:生成下一位潜在互动用户以缓解冷启动,DAU 提升 0.0142 %,投稿量提升 0.1144 %。

  • Meta Reels & Feed:基于 HSTU 的千亿级模型统一视频流,观看时长提升约 8-10 %;同构模型已拓展至广告系统,转化率提升 2-4 %。

5.2 本地生活与电商

  • 美团 MTGR:将 HSTU 嵌入传统特征管线,通过用户级压缩使推理 FLOPs 减少 65 倍,带来被内部称为“近两年最大增益”的线上提升。

  • 阿里巴巴 M6-Rec:超大模型统一多任务,Option-Tuning 只调整 < 1 % 参数,已在云端与手机端同步落地,支持零样本与对话推荐。

  • 亚马逊 Personalize & Rufus:生成式组件先切入内容文案,再结合智能助手实现电商场景的推荐—问答—下单闭环。

5.3 搜索与广告

  • 百度 COBRA:首先生成稀疏语义 ID,再补充稠密向量,广告转化率提升 3.60 %,ARPU 提升 4.15 %。

  • Meta 广告事件序列模型:与生成式检索融合,在部分广告段位实现 2-4 % 转化增长。

6 共性挑战与趋势

工业实践显示,生成式模型通常与传统向量检索及手工特征共存,通过稀疏 MoE、User-level Compression、Flash Attention 与缓存机制平衡效果和延迟。冷启动与多样性得益于生成模型“任意 token”能力得到强化,而偏好对齐则多采用迭代 DPO 或反事实回放。未来方向包括多模态统一、端侧隐私推理与基于代理的主动推荐。

7 结语

生成式推荐系统已从概念验证迈向大规模线上实用。千亿级模型与偏好对齐技术为端到端生成带来可观收益,检索-排序一体化趋势明确;同时,高效 token 化、评价体系完善与成本优化仍是决定其普及速度的关键因素。随着推理开销进一步下降,多模态生成与智能代理有望成为下一阶段突破口。


参考文献
Tay et al., “DSI: Differentiable Search Index,” 2022
Zhou et al., “ROGER: Listwise Generative Retrieval,” 2024
Tang et al., “Listwise Generative Retrieval,” 2024
Deng et al., “OneRec: Unifying Retrieve and Rank with Generative Recommender and Iterative Preference Alignment,” 2025
Zhang et al., “UniGRF: Killing Two Birds with One Model,” 2025
HSTU Technical Report, 2024 Q2
P5 Framework Paper, 2022-2024
TokenRec Technical Report, 2024
RecGPT Whitepaper, 2024
Fed4Rec Whitepaper, 2024

推荐系统

Part 1 of 1

More from this blog

中国房地产市场的未来走势及其经济影响分析

中国房地产市场一直是经济领域的重要话题,其价格波动对中国经济的各个方面产生了深远的影响。近年来,房价的高低成为了社会关注的焦点。围绕着房地产市场是否存在泡沫、未来房价是否会下跌,以及这些变化对整体经济可能产生的影响等问题展开了广泛的讨论。通过对这些问题的探讨,本文旨在分析中国房地产价格是否偏高,房价未来走势的可能性,以及这些变化对中国经济的潜在影响,最终提出适当的政策建议。 1 房地产市场的现状与房价是否偏高 中国房地产市场的价格波动存在着明显的地区差异,尤其是一线城市与二线、三线城市之间的差距...

Jul 7, 20251 min read

量化宽松与量化紧缩:资产负债表政策的逻辑与影响

全球金融危机以来,主要央行在传统政策利率逼近零下限后,通过大规模买入中长期国债和其他高等级证券来稳定金融体系、支撑经济增长;近年来又以缩减资产负债表的方式回收流动性、遏制通胀。这套“先扩表、后缩表”的非常规政策组合被称为量化宽松(QE)与量化紧缩(QT)。它究竟如何运作?买债所需资金从何而来?在银行体系内部又产生了怎样的准备金变化?梳理这些问题有助于理解现代中央银行的工具箱,以及它们对利率、资产价格、汇率乃至全球资本流动的深远影响。 1 量化宽松与量化紧缩的运行机理 量化宽松是在政策利率几乎降至...

Jul 6, 20251 min read

中美经济干预手段的近年实践对比

中国与美国作为全球最大的两个经济体,其宏观调控方式既有共性,也呈现鲜明差异。系统梳理双方近年来动用的财政、货币、产业与贸易等干预手段,能够揭示后疫情时代不同政策组合对经济增长、通胀、就业及金融稳定的影响,为学术研究与政策制定提供参考。 论述按照“工具箱—落地举措—成效评估”的顺序展开。首先概括两国常见政策工具;其次列举 2022–2025 年的关键干预及动机;最后从宏观指标与潜在副作用两方面加以评估,并进行对比分析。 两国干预工具箱概览 类别美国常用手段中国常用手段 货币联邦基金利...

Jul 6, 20251 min read

TikTok 美国业务潜在收购全景分析

美国立法与行政部门正敦促 TikTok 在美业务与中国母公司字节跳动彻底“去关联”,否则面临禁用。该议题涉及全球最大的短视频平台在美国数以亿计的活跃用户、数十亿美元的广告收入,以及字节跳动未来的资本路径。弄清潜在收购方案对估值、业务协同与员工权益的影响,有助于投资者、从业者及政策观察者把握中美科技与资本博弈的走向。 主要交易情景 场景主观概率关键特征主要阻力 / 推力 方案 B:少数股权 + 算法授权≈45 %字节跳动保留≤20 %股权;算法以 API 黑盒形式授权;Oracle ...

Jul 6, 20251 min read
T

Thyrix's Blog

6 posts