推荐序言
深度学习/机器学习,爆发于2015年
算法能力+工程能力
1992年,施乐创建了应用协同过滤算法的推荐系统
本书for:推荐、广告、搜索领域的从业者/爱好者
第1章 互联网的增长引擎──推荐系统
- 不同业务模式的公司定义的具体推荐系统优化目标不同,例如,视频类公司更注重用户观看时长,电商类公司更注重用户的购买转化率(Conversion Rate,CVR )
- YouTube推荐系统的主要优化目标就是观看时长,而不是CTR
- 工程论文:Deep Neural Networks for YouTube Recommenders
- 大致流程:构建深度学习模型,预测用户观看某候选视频的时长,按照预测时长进行候选视频的排序,形成最终的推荐列表
- 淘宝首页:千人千面(即使是1%的CTR提高,也会到来数十亿元收入增加)
- 推荐系统逻辑框架:f(U,I,C), User, Item, Context
- 推荐系统数据部分:实时数据、准实时数据、离线数据
- 推荐系统模型部分:召回层、排序层、补充策略与算法层(排序层是工业界与学术界研究的核心)
第2章 前深度学习时代──推荐系统的进化之路
- UserCF: 基于用户相似度进行推荐的协同过滤算法
- 互联网用户数的增长会导致矩阵维护复杂度急剧上升
- 用户的历史数据可能稀疏(导致UserCF不适用于酒店预订、大件商品购买等低频应用)
- 适用于发现热点、以及跟踪热点的趋势
- ItemCF:基于物品相似度进行推荐的协同过滤算法
- 更适用于兴趣变化较为稳定的应用
- 协同过滤的天然缺陷:推荐结果的头部效应较明显
- 其它模型:矩阵分解、逻辑回归、FM、FFM、GBDT+LR、LS-PLM (细节已经要看不懂了)
第3章 浪潮之巅──深度学习在推荐系统中的应用
- Google Play的推荐团队,基于对业务场景的深刻理解,提出了Wide&Deep模型
- 这张属于看不懂那种类型
第4章 Embedding技术在推荐系统中的应用
- Not Interested
第5章 多角度审视推荐系统
- 从7个不同的角度切入推荐系统
- 推荐系统如何选取和处理特征
- 召回层的主要策略有哪些?
- 实时性的重要性体现在哪里?有哪些提高实时性的方法?
- 如何根据具体场景构建推荐模型的优化目标
- 如何基于用户动机改进模型结构
- 冷启动问题的解决方法有哪些
- 什么是探索与利用问题?有哪些主流的解决方法
第6章 深度学习推荐系统的工程实现
第7章 推荐系统的评估
- 离线评估与AB测试
第8章 深度学习推荐系统的前沿实践
- YouTube视频推荐的实践
- 阿里巴巴商品推荐的实践
- FB的深度学习推荐系统
- Airbnb基于Embedding的实时搜索推荐系统
第9章 构建属于你的推荐系统知识框架
- 构建自己的知识框架
- 优秀的推荐工程师:兼具深度与广度(知识理论能力、工程能力),其实其它领域同样如此