从PK到流量包：算法逻辑如何激活网文创作？

作者：江铭欣

今年七月，起点中文网进行了建站以来最大的新书推荐算法改革，免费期新书从固定推荐位的四轮“PK模式”改为个性化推荐展示的“流量包模式”。这一改革在作者中引起极大反响和广泛讨论，由此也引出一系列关键却缺乏讨论的问题：什么是网文的推荐算法？推荐模式的变化为何如此重要？PK模式是什么？流量包模式又是什么？

推荐算法在网文中的应用，实现了海量内容与读者的精准连接，也有效解决了长尾网文的分发与供给。免费平台番茄小说如今日活跃用户近亿，远超付费阅读平台，根本就在于以推荐算法为核心内容的分发模式。因此，原以编辑、运营为主导的，以分发精选为内容组织逻辑的老牌网文平台，也纷纷推出个性化推荐功能。

与短视频等平台的内容推荐系统一样，网文平台的推荐系统也主要由数据层、算法层和工程层组成。数据层主要分析用户、网文以及用户与网文的交互数据和特征，如用户性别、网文类型、阅读时长等数据。算法层负责从数据中挖掘规律，生成推荐结果。网文平台使用较多的两种推荐算法是基于内容的推荐和协同过滤。基于内容的推荐依赖对网文本身特征的分析，通过赋予内容的类型与标签，结合读者的偏好信息，推荐与读者兴趣相近的网文。例如，历史数据发现读者喜欢看规则怪谈类型的网文，算法就将更多和规则怪谈相关的网文推荐给读者。协同过滤推荐算法则不解析内容本身，主要依赖读者与网文的交互数据，可分为基于读者的和基于网文的。基于读者的协同过滤是找到和读者A相似的读者B，给读者A推荐读者B看过但是读者A没看过的网文。基于网文的协同过滤则是找到观看两个不同网文的用户群体，通过分析两个读者群体的重合度，推算两篇网文的相似度，相似度高则进行合并推荐。一般推荐系统都会混合以上的算法，根据用户操作行为选择不同的推荐策略，无操作时用热门默认推荐，少量操作时用基于内容的推荐，交互足够多时用协同过滤推荐。工程层则是对上述数据和推荐的处理、排序、评估与优化。