信息流推荐的用户增长机制

上传人:feng****heng 文档编号:189510229 上传时间:2023-02-22 格式:DOCX 页数:17 大小:422.97KB
收藏 版权申诉 举报 下载
信息流推荐的用户增长机制_第1页
第1页 / 共17页
信息流推荐的用户增长机制_第2页
第2页 / 共17页
信息流推荐的用户增长机制_第3页
第3页 / 共17页
资源描述:

《信息流推荐的用户增长机制》由会员分享,可在线阅读,更多相关《信息流推荐的用户增长机制(17页珍藏版)》请在装配图网上搜索。

1、信息流推荐的用户增长机制本文主要从偏向底层的推荐算法角度来阐述信息流推荐系统升 级如何助力用户增长。我们知道,内容信息流实际上已经算是信息流 中比较小的概念,其中包含图文信息流、短视频信息流和内容+电商 信息流,而对于用户来讲实际上是一个消费时间的产品体验,从而对 内容生态产生很大的助力(包括PGC、UGC的短内容生态),这就是 本文主要的问题内容信息流。本文旨在解决的问题是:基于推荐 算法视角,来解决信息流产品用户增长的问题。其中,主要问题就是 如何提升留存率。01关于用户增长做过推荐系统方面工作的同学应该清楚的知道,推荐工程里面主 要包含推荐算法和搜索算法。而我们往往关注的是Stoptim

2、e这样的 指标,使用有监督的模型来解决一系列问题,例如点击率、单次时长 等。对于留存问题和大盘规模问题在机制上,有很大的不足,比如: 推荐新的篇章,从用户方面和生态方面都存在着双边的幸存者偏差问 题。1. 问题分析首先看下大的背景,目前是移动互联网进入下半场的大趋势,过 去粗放式的买量、厂商合作等模式越来越受到掣肘,未来将更加依赖 精细化的用户增长策略、产品和用户体验的细致打磨。经典的AARRR 模式会逐步转向RARRA模式,提升产品留存、拉活、分享传播等方式 是构建增长的主要战场,对于一个内容型产品来说,个性化算法对于 用户留存、拉活起到了决定性的作用。在信息流产品增长上,有三种比较成功的模

3、式:头部内容模式:一种比较重的模式,该类产品利用精准的内 容采买,引入优质的头部内容创作者,利用头部内容的流量聚焦 效应,迅速圈定大批用户,并形成内容APP特有的用户心智;但 是由于内容头部化,个性化算法在其中发挥的空间和作用较小, 产品模式趋于同质化。下沉/激励模式:该类产品参考了网络游戏模式,从各个环节设 计用户里程碑和激励,不断引导新用户一步步完成点击、下刷、 完整阅读、分享、关注等目标里程碑,并给予虚拟货币和真实货 币的激励,在短时间内可以获取大量下沉用户。生态构建模式:该类产品构建了完善的内容生产和消费生态, 旨在通过推荐系统同时刺激生产和消费,实现两端的同时增长。因此,个性化的核心

4、问题主要分为两个:用户状态建模:深度建模用户状态和行为,通过对于大数据集 中分析,找到使用户从低阶状态到高阶状态转化的干预因子。也 就是如何把新用户转化成低阶用户,然后从低阶用户转化到高阶 用户,用户流失后如何召回,类似这样的用户状态转化。个性化分发的升级:将用户行为建模后,在多个场景下将这些干预动作转化为个性化推荐和营销,满足用户的消费需求。2. 增长要素增长要素增氐鑒靈优质内容/时效性个性化体验*多渠道获客匚兀vs LTV算袪如何助力增岳?*壻细此买提升留存*衡最Action的咖消除幸存咅偏差Acquisition:获客甘口廿畑Activation,:獗活 Retention:留存 Ref

5、erral: 分盘 Revenue:收入什么样的内容会让用户觉得好?我们来看看用户增长的要素:优质内容/时效性:内容的更新频率以及内容的质量是用户增长的关键。个性化体验:千人千面,推荐的内容符合当下的需求。多渠道获客:多渠道获客的能力也是增长的一个关键因素。CPC vs LTV:维持CPC (按点击收费)和LTV (用户对系统的长期价值 ) 的一个平衡。算法如何助力增长呢?主要有以下几点:精细化买量/外投;提升留存; 衡量推荐这样Act ion的效用; 消除幸存者偏差。02关于推荐算法推荐系统在国内大概已经有十多年的应用,模型架构和算法都有很大的升级。1. 推荐系统回顾炷敦如唯林恂tc-utu

6、ba, 2tlt)标裁召回Item cfUser rf城计側需学习NN blseffiffi表征学习MTL推荐系统回顾劣质系毓*曲(只嚴次碍求*岛理收窄* taffies麺啟席】*除旧内客无秫贻】良性系航:在各亍环节在不断增:a赠息量/渺样性*不冋层试的用户的引人(用户多样性)答荃高展内容的引人(内唇釘羊由*时却体嗣靈出用户中蕊光趣:当头卑内容过期时更合睡踊接问题在哪儿?貌计机器学匀按型的跳荷听观则幅的瓯乏/业爵短视诀乏音理刚阳別设计卩品视用首先回顾下推荐系统:劣质系统:只会推荐一些低俗 ( 只满足低层次需求 )、兴趣受窄、搬运内容 ( 无稀缺性 )、陈旧内容的信息。良性系统:区别于劣质系统,

7、在各个环节都会不断增加信息量 ( 多样性 ),不同层次的用户引入 ( 用户多样性 ),各类高质量 内容的引入 ( 内容多样性 ),内容更具时效性 ( 提升媒体属 性 ),探索出用户中长尾兴趣:当头部内容过期时从而更合理的 承接。问题在哪儿?主要存在以下问题:统计机器学习模型存在缺陷; 长期的指标观测体系匮乏以及业务短视;缺乏合理的机制设计和 产品视角。2. 信息流推荐的增长目标信息流推荐的增长目标用户満議度的衡盘捋标很新但主要归君于三舞&相坯、内容亦、内容旳效性时裁性一圭程度代表内昏稀緘性 Ct祇壷1也:一定需要Ct他?对内容无认珀:对列恵页素材的滿題度A对内容有认如:部分包含对内容本身的満自

8、度二用户对内客的真正认可;点甌分享、评進信息潑推荐的增抚目标A提升用户留存,LTV注过分站选出优盛内容,忧质生产当A传城的认知:詡fc什细跆什么更新的卿:创造需求和玩注持续优质内 容生产卜掏建内容主态”分涮刪-叩防主的胸:阳光.点击、粉生分成-4挟捲打压、滋驗用户满意度的衡量: 衡量用户满意度的指标有很多,但主要集中在三大方面:内容相关性、内容质量和内容时效性,时效性一定程度上代表内容的稀缺性。ctr代表什么:一定需要ctr吗?对内容无认知的用户需要衡量用户对列表页素材的满意度,对内容有认知的用户还需要衡量用户对内容本身的满意度。 用户对内容真正的认可是通过点赞、分享、评论这种互动的方 式来表

9、现的,目前很多产品注重对互动的引导。信息流推荐的增长目标,主要包括: 提升用户留存、LTV 通过分发筛选出优质内容、优质生产者:在传统的认知中,喜 欢什么就给什么;但是更新后的认知是创造需求和玩法,持续优 质内容生产 构建内容生态:提高分发时效性;增加对upgc主的激励(曝 光、点击、粉丝、分成 );通过准入、扶持打压、激励这种机制 维持一个好的生态和增长。只有通过用户和生态两端的同时增长, 才能让产品得到一个飞轮效应,良性发展03核心增长机制1.双边冷启动与流转机制 概述用户用户瑶價曲云itidhEp4cNtClon老用户双边冷启动与流转机制:概述 new ifinf. mbiafitT o

10、ld uirr:利币相捷性逍彳丁新内回冷启 utd H邮$屈putt!柚t柑寸戕*:冃百憎ffiJifrutiS行(#r)用户兴盍探衣基于旅证学习的徘序技K,带以赵N传度刁沁如皿CT齢问曲* Wf内容尚启技术迭理:QOA +品讪堂算法+叫伽就濒拈 ”血皿曲却法:塩程收逾性有一定劣労对生餉rw.t换:mtif厠雄壷的无僚绘矩券消闻应用*新用户冷启技术齟:遵化舉习、戦瞻习内香消加-w皿茁走対过實洁度对应密鬧强盟!| “cvMd的;06定里:烂过虺淙図的证斷内容帶启睛池n碾垠机制在管理上也有这样的一种思想,就是新人做老事、老人做新事, 促进事情稳定向前推进,这就是流转机制设计的主要思想。因此,如 何

11、对新用户和新内容做双边冷启动就成了核心的问题。从算法来看, 这是两个不太相同的问题,但从整体设计思想来讲,两者又比较相近。 新内容通过相关性分析可以达到探索、分发、推广的效果。进而新用 户如何探索他的兴趣?比如推荐股票,一定会先推荐近期走势最好的 股票;推荐科幻片,大概也是这样,推荐评分最高的,这样就可以实 现新用户规模本身的增长。对于新内容来讲,通过老用户面对热内容 的探索分析,也可以逐步推进内容生态的增长,其实这并不完全是算 法的问题,这同样是贯穿从内容运营到产品设计整个体系的一个哲学 思想。对于新和旧的定义是通过置信度对应到多峰兴趣级别,同时对应 到 topic 兴趣的级别;对于新和老的

12、准确定义应该是经过某些流量的 分发验证,而不是简单通过来的早晚;新内容冷启机制也叫爬坡机制。这里面带来的技术问题包含:基于表征学习的排序技术,难以表达置信度;神经网络技术很难表达最重要的概念。新内容冷启动技术选型业内有很多的方案:随机保量 (短期降效、对生态fairness问题相对友好、构建宝贵的无偏数据集,消 偏应用 ) +Bandit 类算法 ( 短程收敛性有一定劣势 ) +uncertainty预估(个人推荐) 新用户冷启动的技术选型和新内容还是有很大差别的,其主要 是通过强化学习、联邦学习这种人工智能的方式进行分析,而通 过统计学,很难分析出人的偏好。详细实现双边进启动与解机制:详细实

13、现早期盘匪式标签+貌计湮除值为主的推荐泵纫 Rank =11“唧几 eu * pCTRf itesu | 3禹炉 ci新MilW濫启揀索心抵讪变高侧虽fR辰说阿伽芯|尅州的值+预怙雜定性新用户冷启决趣探盂* W低夕衣变高Hem I tctpic)的值+预怙程定性纯m亠碱口高,推荐的班期效鞫旨嗣高以表征学习为主的推荐蔡址建S停模型却心如呻的方式 twer interejif itneeFlainfu) = rr /pdf/ p CTRftiu H * )- ft efficiency wtceriainiyfi) - er (pdf fpCTR(Vfi)f 叩打匚.) 构I建用.fipw亦? R

14、eenmmendatin趙養学駆谓控的目标今泵蜿全局私双边冷启动与流转机制的实现,主要包括:a. 早期以显式标签+统计连续值为主的推荐系统 Rank 二 pRelevance( to pic | user厂 cu*pCTR( item | to pic)ci 一方面用主题到用户的相关性,另一方面用item到主题的统计值或者模型的估分,这里面会有两个置信的概念,一个是用户兴趣的置信度,一个是item本身的置信度; 新item冷启探索:ci低会提高cu,侧重主题到用户的相关性值以及预估稳定性; 新用户冷启/兴趣探索:cu低会提高ci,侧重item到主题的统计值以及预估稳定性; 纯利用:对于老人做老

15、事,ci高,cu也高,推荐的短期效率指标是最高的,但是长期来看,如果只注重这种推荐的短期效率指标,不对新用户和新内容进行探索,那长期就很难发展下去。b. 以表征学习为主的推荐系统,这块主要是思考如何做成Risk-aware recommendation,目前构建排序模型 uncertainty 的一种方式如下: user interest uncertainty(u) = (pdf pCTR(j(u), i) ) item efficiency uncertainty(i) = (pdf pCTR(U(i). u) )c. 超参学习/调控的目标一系统全局E&E3. 消偏与因果推断:背景介绍消偏

16、与因果推断:背景介绍静長解理一个因瞇赫伺题 皿F 脸3冷:用户是什么样的AULTJHif),从而脚哪户会営欢的曲, 鮪的啟诚旧JM:我送么推用户会不会第?效用有多夭?为什么豪有幸存看編善*堆荐模型训幽的样為有幅2、吨備同的荐枉】linEULEfl*Di r- h I III v用户山害欺的用户R看了的 (推荐训竦样本看了就的肓了怛柿咔Yiitmtbti壮他:可S:山Ur嘶皿ddjjvg cJ I tif畔弹皿山霁导輩本廃 上具实最斎是心出羽胡后续药诸寥改进没有本眩睥决i肖 偏问聴.IterrvbasedlTQUKtl* 对应珈伽*就痒.胡叩沏阪讲申TiEE问恋对于幸存者偏差问题,我们是通过因果

17、推断的方式解决的。推荐 系统其实是一个因果推断的问题,通过用户是什么样的人,从而推测 用户会喜欢什么样的item;对于推荐的causal effect,用户会不会 喜欢?效用有多大?会不会成为高价值客户?如果推荐后,用户会有 hot momen t,我们可以判定,推荐效果是好的。为什么会存在幸存者偏差呢?推荐模型本身的样本就是有偏的,user和item偏同时存在, 比如用户没看喜欢的部分没有参与到模型训练中。对应到item,就是selection-bias和fairness问题。比较典 型的案例是 youtube net, user embedding average pooling 本 质上

18、,依然是item-embased,后续诸多改进没有本质的解决消偏问题。这样就会导致后续推的东西比较类似,如果第一次推的好 就会留下用户,推得不好用户就会很快流失。4. 消除幸存者偏差:Casual Inference推荐框架消除幸存者偏差:Causal InferenceBti架假设用户銮成低活、沉默的原目主妾是用户对之前推荐的内容不:获方諾构建反事卖瞌像九:利用无偏信月构楚相似度最”枸造低活UCf 到高活U沁曲匹配 Matching / P艸址血iy Sctire / 胪阳-CausQi E轿hedtfif堆causes去制氐舌沉歐用户的I脅详3皈推荐高話镜像人的乳町假设:在因果推断的推荐框

19、架中,假设用户变成低活、沉默的原因主要 是用户对之前推荐的内容不满意。方法:构建反事实镜像人:利用无偏信息构建相似度量,构建低活user 到高活 user 的匹配(Matching / Propensity Score / IPW, Causal Embedding )去除低活、沉默用户的leavecause,推荐高活镜像人的staycauses经过实践探索后发现,causal inference框架将成为用户增长方向的理论基石,对于消偏、效用衡量、归因和生态公平性问题都有解法;同时,causal inference也为经典推荐算法难题提供解法, 如selection-bias、低活用户画像和

20、推荐可解释性等问题。5.面向增长的用户画像状态里程碑表示法面向增长的用户画像:状态里程碑表示法曲用户画煽服务于运肓可解释性服务于推荐或广吿撕的瘓曙陨估*信息流产品貝备连壊型消題的蔣点(同主題下的消題.用户的俏费行沏可以在连续的时间 上遁御分状态表示对问量零示怯楠力补充* *将淮度駁大的“怩留存I可題拆分为目标达成”问 狈”通过胸0不断使得用户完成画盼里程锻”iBfiSSKfiE 向蔺维离議L 口=冷2打祖“耳,(tti.wn) *低维稠密gw辰血辰盟? U = e* 梦慢网bEddirtg: U - (fl. e2,. f em)状恶衰示陆活跌度/剛言度:离中低活梦峰畑的胃信滾活强度ft 从“

21、化叩从他cm2, w2). . J跃汪枇率宀W切1经典用户画像,主要要服务于运营的可解释性、推荐或广告系统 的模型预估;通常建模成向量:高维离散、低维稠密以及多峰 embedding。由于信息流产品具备连续型消费的特点(同主题下的消 费,upgc关注、直播),用户消费行为可以在连续的时间上进行切 分,因此状态表示法是对向量表示法的有力补充,状态表示法主要包 含活跃度、置信度,多峰兴趣的置信度、活跃度;这样将难度较大的臧1-打膚户曲*闔mt促留存问题拆分为目标达成问题,通过策略不断使得用户完成高阶里程碑,将促留存的抓手聚焦在用户状态跃迁速度的提升上。 全生命周期因果推断面向增长的用户画像:全生命

22、周期因果推断金生命周明时因樂推断1)狀奁跌迁效用衝番2找剁連用户氐阶钛态到高阶状杰转比的干预囲子 内容变化*新内容上下架*扌札点詡锚产生/消逝插捉冥趣的变化*分发幸呕 很据匚ausesActions推断后的数据统计今内容景塾生产干预场的设计.页面蛆如内容供给扌旨导(2BW链构蓟孑间述上的推荐系统夕个性此排序拭制全生命周期的因果推断: 在构建面向增长的用户画像时,需要采用全生命周期因果推断: 状态跃迁效用衡量找到使用户从低阶到高阶状态转化的干预因子:内容变化:新内容上下架、热点事件的产生和消逝捕捉兴趣的变化分 发幸存者偏差问题根据 causes 的 actions:推断后的数据统计到内容采买和生

23、产干预场的设计和页面组织 内容供给指导(2b供应链) 构建时间线上的的推荐系统来推断个性化排序机制6.效用理论应用 个性化排序机制效用理论应用:个性化排序机制Pointwise RewardSession Cumulative reward庐p fit鹹咻)YQUKU对于效用的普遍认知是: 新用户首次满意消费和活动 (内容质量控制) 低活用户浏览深度和ctr (内容质量控制) 高活用户要增加新颖性和多样性个性化排序机制通过multi-task learning、强化学习和causaleffect的方式,来进行分状态差异化的对用户进行跃迁效用最大化地排序推荐,无论是新用户、低活还是各个细分状态的

24、用户,都会让用户在平台中觉得不是兴趣收窄的,承担着各自的职责。这些内容在阿里都有落地并取得了很大的收益。 生态效用技术效用理论应用:生态效用技术供给归因*兴趣番盖糜、先点下的内客质鞏“时沁.竞争澈韻血*内容恨络把导尼B供应锥)- 内容采买/主产7激励旳制阳主劉励机制*叩圭质尉煖;玉注量曲塚生产效军生产质重:内容正负厦協 端人历史分:S数据傅光量.点击晟戏fi,叩圭质量体霍* tts:曝世园- 朋咸功率 晟大化效用:漱励函歆 孑(内客质毘,生产效輛 的拟合输出:一定时间內叩主内客的保民 Sge -4在践徘序的调控购束机制未来的方向細贺帀化更峯蜉济学、机制设计理论的引人演化越弈论分析剧分析效用理论

25、应用是一个比较开放的课题,对于电商、短内容的生态是不一样的。供给归因:兴趣覆盖度、兴趣点下的内容质量、时效性、竞争激烈程度内容供给知道(2B供应链-内容采买/生产/激励机制)up 主激励机制:up 主质量体系:关注量曲线、生产效率、生产质量,内容正负反馈输入就是历史分发数据(曝光量、点击量、关注量、up主质量体系)计算:曝光量-爆款成功率最大化效用:激励函数-内容质量和生产效率的拟合 输出就是一定时间内up主内容的保量、限量range-在线排序的调控约束机制未来方向: 流量货币化 更多经济学、机制设计理论的引入演化博弈论分析竞对 分析以上就是针对面向用户增长的信息流分发机制的分享,特别是短 内容领域利用推荐算法推动用户增长的思考,分享比较偏技术,是在 阿里多年积累所沉淀下来的东西,没有太多强调推荐算法模型的部 分,更多是以整体的算法架构和算法机制设计角度考量生态和用户增 长,里面很多问题也是特别难、特别开放的,欢迎大家一起交流探讨。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!