We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode ep109 推荐算法的背后:如何正确地猜你喜欢?

ep109 推荐算法的背后:如何正确地猜你喜欢?

2024/8/28
logo of podcast 朝十晚久

朝十晚久

AI Chapters
Chapters

Shownotes Transcript

虽然拖更,但是没有消失… 还是一期技术向的入门科普。这次我们来聊一聊”推荐算法”:如果你有点好奇抖音/小红书这样的平台是怎么猜你喜欢的,复杂的推荐系统实际又是如何实现的,那么本期正好适合推荐给你!

  • 召回、粗排、精排、重排
  • 协同过滤
  • 双塔模型
  • LLM助力推荐算法

主播带伤录音,嗓子抱恙,请大家多多担待~

主播:松阴

节目开始前,请大家加入听友群(加群方法见播客介绍页),以及帮忙多多转发!

02:01 推荐系统的构成:召回、粗排、精排、重排

07:32 国内app的推荐好像做得比国外的好

09:55 协同过滤

10:29 基于物品的协同过滤 item CF

13:47 点赞收藏投币转发… 怎么刻画用户对物品的喜欢程度?

15:01 如何计算物品相似读:余弦相似度

18:00 基于用户的协同过滤 user CF

20:10 热门内容和冷门内容,不可一视同仁

24:42 embedding!用户特征+物品特征

27:10 双塔模型

30:05 双塔模型既可以用于召回,也可以用于排序

32:00 双塔模型是如何做线上召回的?向量数据库+ANN

35:06 为什么用户表征需要在线计算?物品表征则只需离线计算?

37:16 大模型来了

一些硬核的学习资料

小红书推荐系统专家王树森的推荐公开课)

Netflix的推荐系统)

经典双塔模型)