- 快召唤伙伴们来围观吧
- 微博 QQ QQ空间 贴吧
- 视频嵌入链接 文档嵌入链接
- 复制
- 微信扫一扫分享
- 已成功复制到剪贴板
云音乐推荐分享-任印涛
云音乐私人雷达上线一年多播放pv达到45.6亿,全网最高,采用了用户-歌曲-图片跨模态算法,建立了一种机器智能生成歌单的高效歌曲分发模式,属于业内首创的新型推歌模式。同时歌曲推荐列表采用多目标学习优化算法,综合考虑用户听歌时长,收藏评论等指标,提升用户体验。本次分享将介绍跨模态算法及多目标学习在云音乐私人雷达场景中的思考与实践。
个人介绍
任印涛,网易云音乐高级推荐算法工程师。
2018年7月加入网易云音乐,目前主要负责云音乐官方歌单歌曲推荐及心动模式歌曲推荐相关工作,曾就职vivo,2016年硕士毕业于西安电子科技大学。
展开查看详情
1 . . cn u g . aic ww w 跨模态联合优化及多目标建模 社 区 在云音乐推荐的应用 能 工 智 G人 ICU 任印涛 A
2 . . cn u g 目录 u MGC歌单业务介绍 . aic ww w u 歌单标题封面跨模态联合优化 社 区 u 歌单单曲推荐目标优化 能 u智 人工 多目标建模 U G u 总结展望 A IC
3 .MGC歌单业务场景 . cn g 3 u Ø 背景 ic • 为了高效分发歌曲,提升分发效率,MGC歌单在首页歌单个性化分发; . a ww w 社 区 智 能 人 工 U G A IC
4 .MGC歌单业务场景 . cn g 4 Ø 高效分发;how? ic u . a • 高点击(ctr) • 个性化标题封面提升点击 ww • 个性化标题(标题歌曲) • 个性化封面 w • 建模 社 区 • 跨模态(标题封面)联合优化 • 高转化(cvr) 智 能 • 个性化单曲提升消费转化 工 • 歌曲内容 人 • 红心歌曲(吸引用户) G • 推荐歌曲 U • 建模 C • 目标优化 A I • 多目标建模
5 .标题封面推荐框架 . cn g 5 u • 高点击(ctr) ic • 丰富封面素材 . a 标 用户实时行为召回 • 专辑封面 • 艺人封面 w 题 红心歌曲召回 歌 • 其他封面素材 w 曲 周播放歌曲召回 • 个性化推荐 w 召 回 其他召回 社 区 标题歌曲 封面召回 过滤 标题歌曲 封面排序 封 面 召 单曲-封面关联关系 智 能 工 回 推荐 单曲-专辑封面 G人 单曲-艺人封面 单曲-其他素材 IC U A
6 . 标题封面跨模态联合优化 . cn g 6 ic u • 封面+单曲跨模态特征模型 . a • 特征 ww w • 歌曲特征 • 用户特征 Concatenate 区 • 封面特征 歌曲检索模块 封面检索模块 • 收藏歌曲序列、 • 完整播放歌曲序列 • 点击ugc歌单序列 能 社 智 • 点击mgc歌单序列 attention1 attention2 attention3 attention4 倍提升; 人 工 • 效果:歌单点击率得到翻 G sub song end song Song User Image Mgc click Ugc click U seq seq feature feature feature seq seq A IC
7 . 歌单歌曲优化目标-自我演进 . cn g 7 ic u . a • 高转化 ww w • 推荐歌曲完整播放+收藏 区 • 目的:提升人均播放时长 • 歌曲完整播放目标 • 红心歌曲完整播放+收藏 • 内容:红心歌曲+其他歌 曲 能 社A B C • 目标优化: • 歌曲完整播放 工 智 人 • 完整播放+收藏 • 推荐歌曲完整播放+收藏 G • 多目标建模 • 红心歌曲完整播放 IC U A
8 .歌曲推荐label优化 . cn g 8 • 完整播放 ic u . a • 评估指标:人均听歌时长 w • 优化目标:用户完整播放歌曲 • 样本构造:歌曲完整播放正样本,跳过负样本 • 完整播放+收藏 w w 区 • 评估指标:人均听歌时长+歌曲收藏率(辅助) • 优化目标:用户完整播放歌曲+收藏歌曲 社 • 模型:推荐完整播放,推荐收藏,红心完整播放 能 • 样本构造: • 推荐歌曲完整播放正样本,跳过负样本; 工 智 • 推荐歌曲收藏正样本,未收藏负样本; • 红心歌曲完整播放正样本,跳过负样本 G人 • 线上inference: U • 推荐:推荐完整播放模型+推荐收藏模型 C • 红心:红心完整播放模型+虚拟红心收藏模型 I (推荐收藏模型) A
9 .业界多任务学习模型 . cn g 9 ic u . a ww w 社 区 智 能 人 工 U G A IC
10 . 多目标建模-自我演进 . cn g 10 ic u . a • 三个单目标模型 • shared-bottom结构三目标单 模型 ww • 改进的cgc结构三目标单 模型 w • 缺点:线上服务压力较大 • 不同目标采用各自训练样本 A B C 社 区 D E 智 能 工 • 两个单目标模型(完播+收藏) • 改进的mmoe结构三目 • shared-bottom结构两目标 标单模型 人 单模型 • 改进点:add->concat G • 为区分歌曲类型加入 U 私有特征 A IC
11 . 多目标建模-单目标模型 . cn g 11 ic u . a target w • 每个目标单独建模(三个模型) w • 模型 fcn w • 红心完整播放 • 推荐完整播放 区 • 推荐收藏 concat • 模型演进 • lr -》 dnn -》dfm -》 din+fm -》 能 attention1 社 attention2 智 dien+fm(测试中) fm cross sub seq playend seq • 缺点 工 feature feature • 线上服务压力较大 人 • 优化较繁琐,效率低 sub song playend song feature user feature context G seq song seq feature IC U A
12 . 多目标建模-shared-bottom结构三目标单模型 . cn g 12 rec play red play ic u red sub . a w • shared-bottom结构三目标模型 • 推荐完整播放目标 1 1 1 • 推荐收藏目标 • 红心完整播放 32 w w 32 32 • Loss = songtype1 * rec_play_loss + songtype2 * red_play_loss + 社 区 64 64 64 能 songtype1 * sub_loss 智 • songtype1 = if(红心) 0 else 1 工 • songtype2 = if(红心) 1 else 0 128 人 256 G • 注:各模型在其样本空间用各自样 U 本训练 400 A IC input
13 .多目标建模-mmoe结构三目标单模型 rec play red play . rec sub cn g 13 1 1 ic u 1 32 . a 32 32 w • mmoe结构三目标模型 w • 推荐完整播放目标 64 64 64 • 推荐收藏目标 • 红心完整播放 concat w concat concat 区 • Loss • loss = rec_play_loss + • 改进点 red_play_loss + rec_sub_loss 能 社 • mmoe结构里的tower输 工 入特征加权求和更改为 智 red/re 128 256 128 256 128 256 rec 人 concat更适合本场景 c play sub gate gate G • 效果 400 400 400 U • 推荐时长提升正向显著 A IC input
14 .多目标建模-mmoe结构三目标单模型 . cn g 14 ic u a • 思考: • why concat 效果优于 w . w concat add ? • 分析原因: w • tower网络层结构相 对简单,不能很好地 社 区 能 学习用户的兴趣偏好 • add方式将特征融合, 工 会造成用户兴趣覆盖, 智 而concat方式则不会 G人 • 想法验证 • 在之后尝试的cgc结构模 ICU 型验证了同样结论 A
15 .多目标建模-cgc结构三目标单模型 . cn g 15 rec play u red play rec sub • 单层PLE(cgc)结构 • 三个私有expert,每个 rec play . a red play ic rec sub 目标一个 • 两个公有expert,三目 tower ww tower tower w 标共享 concat concat concat • 特征 • 公有+私有 社 区 • 针对音乐推荐场景cgc结构 也验证了concat效果优于 智 能 Experts shared 工 add red/re Expert Expert Expert rec shared shared 人 c play rec red rec sub gate Expert Expert G play play sub gate 1 2 IC U A input
16 .模型融合 . cn g 16 ic u a • Loss调权 . • average w • 人工调权:a*loss1+(1-a)*loss2 w • 综合考虑不同目标loss w • 自主学习权重: • 同方差不确定性多任务学习(Multi-Task 区 Learning Using Uncertainty to Weigh 社 Losses for Scene Geometry and Semantics) • 多目标分数融合 智 能 工 • 加法公式 • score = w1 * score1 + w2 * score2 人 • 乘法公式 G • score = score1^a * score2^b ICU A
17 .总结展望 . cn g 17 ic u . a • 更多封面特征的跨模态联合优化 ww w • 封面图像特征 • 封面与歌曲的联动 • 多目标建模 社 区 • 不同目标特征拆分 智 能 人 工 U G A IC
18 . . cn g 18 ic u . a ww Thanks ! w 社 区 智 能 人 工 U G A IC