作者:江铭欣
今年七月,起点中文网进行了建站以来最大的新书推荐算法改革,免费期新书从固定推荐位的四轮“PK模式”改为个性化推荐展示的“流量包模式”。这一改革在作者中引起极大反响和广泛讨论,由此也引出一系列关键却缺乏讨论的问题:什么是网文的推荐算法?推荐模式的变化为何如此重要?PK模式是什么?流量包模式又是什么?
推荐算法在网文中的应用,实现了海量内容与读者的精准连接,也有效解决了长尾网文的分发与供给。免费平台番茄小说如今日活跃用户近亿,远超付费阅读平台,根本就在于以推荐算法为核心内容的分发模式。因此,原以编辑、运营为主导的,以分发精选为内容组织逻辑的老牌网文平台,也纷纷推出个性化推荐功能。
与短视频等平台的内容推荐系统一样,网文平台的推荐系统也主要由数据层、算法层和工程层组成。数据层主要分析用户、网文以及用户与网文的交互数据和特征,如用户性别、网文类型、阅读时长等数据。算法层负责从数据中挖掘规律,生成推荐结果。网文平台使用较多的两种推荐算法是基于内容的推荐和协同过滤。基于内容的推荐依赖对网文本身特征的分析,通过赋予内容的类型与标签,结合读者的偏好信息,推荐与读者兴趣相近的网文。例如,历史数据发现读者喜欢看规则怪谈类型的网文,算法就将更多和规则怪谈相关的网文推荐给读者。协同过滤推荐算法则不解析内容本身,主要依赖读者与网文的交互数据,可分为基于读者的和基于网文的。基于读者的协同过滤是找到和读者A相似的读者B,给读者A推荐读者B看过但是读者A没看过的网文。基于网文的协同过滤则是找到观看两个不同网文的用户群体,通过分析两个读者群体的重合度,推算两篇网文的相似度,相似度高则进行合并推荐。一般推荐系统都会混合以上的算法,根据用户操作行为选择不同的推荐策略,无操作时用热门默认推荐,少量操作时用基于内容的推荐,交互足够多时用协同过滤推荐。工程层则是对上述数据和推荐的处理、排序、评估与优化。