3.llm_rec_summary

概述

大模型=大语言模型或者多模态大模型

  • 引入大模型的模型结构

    • transformer结构的变种:tokenizer/位置编码/attention/ffn/moe/激活函数/norm等

    • loss:召回+排序loss

    • 生成式推荐:item粒度或sid粒度

  • 引入大模型的世界知识

    • item侧:跨模态内容理解、sid生成/映射

    • user侧:行为摘要、意图推理、embedding生成

  • 训练范式的创新

    • 预训练+sft+rl的流程:ExFM的蒸馏思路/搜广推的reward定义

    • 高效训练:LoRA、model merge(solar/sphinx等)等

    • 联合训练:大模型+搜广推模型联合训练

  • 推理范式的创新

    • 缓存:kvcache/pd分离等

    • 解码加速:beamsearch/speculative decoding/multi-token prediction等

    • 线上链路覆盖:召/粗/精/混

  • 探索性方向与未来趋势

    • 多智能体协同推荐

    • reasoning与链式思维的能力引入

    • 工具调用与RAG能力

    • 全模态的生成与沉浸式推荐

引入大模型的模型结构

transformer结构的变种

tokenizer/位置编码/attention/ffn/moe/激活函数/norm等

loss

召回+排序loss

生成式推荐

item粒度或sid粒度

引入大模型的世界知识

item侧

跨模态内容理解、sid生成/映射

user侧

行为摘要、意图推理、embedding生成

训练范式的创新

预训练+sft+rl的流程

ExFM的蒸馏思路/搜广推的reward定义

高效训练

LoRA、model merge(solar/sphinx等)等

联合训练

大模型+搜广推模型联合训练

推理范式的创新

缓存

kvcache/pd分离等

解码加速

beamsearch/speculative decoding/multi-token prediction等

线上链路覆盖

召/粗/精/混

探索性方向与未来趋势

多智能体协同推荐

reasoning与链式思维的能力引入

工具调用与RAG能力

全模态的生成与沉浸式推荐

最后更新于

这有帮助吗?