基于隐私保护的在线音乐平台群组推荐模式
音乐个性化推荐系统的出现,为在线音乐平台用户提供了极大的便利。但随着“存量红利”时代的来临,在线音乐平台唯有不断改进其为用户提供的个性化音乐推荐服务,弥补传统音乐推荐模式的薄弱环节,才可能实现长远发展。当下社会公众个人隐私保护意识越来越强,传统音乐推荐模式在用户个人隐私数据保护方面可能存在的隐患逐渐凸显,用户对个人数据的保护会对平台推荐服务质量造成严重制约。未来在线音乐平台的发力点应该是在服务质量与隐私保护之间找到平衡点。基于群组推荐算法在隐私数据保护方面的优势,将其引入音乐推荐领域以实现音乐推荐算法的改进,是一个值得期待的发展方向。
一、在线音乐平台的传统推荐模式
21世纪初,国外的在线音乐平台Pandora率先提出了音乐个性化推荐系统,其推荐模式比较简单,首先对不同歌曲的特征(如歌曲的节奏、流派、编曲和歌词等)进行标注并称之为音乐基因,然后根据相关人员标注的音乐基因计算歌曲之间的相似度,最后以用户之前喜欢的音乐列表为基础,将与该音乐列表中音乐基因相似度较高的作品推荐给用户。国内音乐个性化推荐系统的起步较晚,但发展迅速,出现了一些比较优秀的音乐个性化推荐服务商,如豆瓣音乐、网易云音乐、虾米音乐、腾讯音乐等等;而不同的在线音乐平台也相应发展了不同的音乐个性化推荐模式和推荐系统。
专就国内首个以个性化歌单为底层构架的在线音乐平台网易云音乐为例,其APP包括三种特色各异的音乐歌曲推送服务模块:第一种是私人FM推荐,该模块适用于新用户,使用方便,能迅速抓住目标用户、吸引用户,内容多样性较高,但由于全部是系统随机推送,并未考虑平台用户的个人偏好;第二种是每日歌曲推荐,该模块比较适用于普通用户,根据历史行为数据分析用户偏好,以此为依据每日为用户推荐30首符合用户口味的歌曲,其准确性较高,但是存在推荐列表音乐类型单一的问题,长此以往会出现“信息茧房”效应;第三种是特色情景推荐歌单,该模块则更适用于深度用户,系统为歌单与用户分别设置标签以提高准确率,而用户自建歌单具有多样性,因此歌单推荐兼顾了多样性和准确性。
网易云音乐深受好评的音乐个性化推荐系统,其背后的推荐模块流程如下图1所示。推荐流程中涉及的特征数据主要包括用户特征数据(用户数据)、用户行为特征数据(历史日志)以及歌曲特征数据(歌曲节奏、流派等),其中用户特征数据和用户行为特征数据主要运用于协同过滤推荐,歌曲特征数据主要运用于基于内容的推荐。
图 1 网易云音乐推荐模块流程图
虽然各个在线音乐平台的推荐服务存在一定的差异,但音乐个性化推荐系统背后的推荐算法基本相同。传统音乐个性化推荐系统中最主流的音乐推荐算法是协同过滤推荐算法,其基本思想是“物以类聚,人以群分”。
1.“物以类聚”以歌曲项目为中心,根据用户对各项目的历史交互数据计算项目之间的相似度,如果越多的用户对两个不同的项目有相同的偏好,那么这两个项目之间的相似度越高,相似度高于某一值的项目会根据相似性的高低依次出现在推荐列表中,即基于项目的协同过滤推荐算法;其推荐逻辑如下图2所示:假设用户A喜欢歌曲1、2、3,用户B喜欢歌曲1、3、4,可以看出喜欢歌曲1的用户都喜欢歌曲3,两者的相似度较高,当发现用户C喜欢歌曲1时,可以把歌曲1的相似歌曲3推荐给用户C。
2.“人以群分”以平台用户为中心,通过找到与用户A兴趣相似度较高的用户B,对比两人兴趣列表,筛选出用户B喜欢但未出现在用户A兴趣列表的项目构成推荐列表,即基于用户的协同过滤推荐算法;其推荐逻辑如下图3所示:假设用户A喜欢歌曲1、3、4,用户B喜欢歌曲1、2,而目标用户C喜欢歌曲1、3,则用户C与用户A的音乐偏好更接近,所以将歌曲4推荐给用户C。
图 2 基于项目的协同过滤音乐推荐算法
图 3 基于用户的协同过滤音乐推荐算法
基于内容的音乐推荐算法也是传统音乐个性化推荐系统中运用较多的推荐算法,主要是利用待推荐项的特征进行推荐。在音乐歌曲推荐领域,基于内容的推荐算法重点是提取歌曲内容本身的特点,包括歌曲旋律、乐曲风格、人声特色等;然后根据用户的播放行为,建立用户对这些歌曲音频特征的兴趣模型;最后将歌曲特征与用户的兴趣模型相匹配,把待推荐项推荐给可能喜欢该项的用户,如下图4所示。
图 4 基于内容的音乐推荐
二、传统音乐推荐模式的薄弱环节
虽然音乐个性化推荐系统大大提升了用户资源的获取效率,但仍不可避免地存在一些薄弱环节,对用户满意度造成不利影响。
从音乐推荐服务对象来看,目前在线音乐平台所运用的音乐个性化推荐系统只针对单个用户,将单个用户对歌曲的偏好作为音乐推荐的依据。对于提出音乐社区概念的在线音乐平台来说,针对单个用户的音乐推荐模式,没有将音乐社区背后蕴藏的群体因素影响纳入音乐推荐模式中,忽视了音乐可以让听歌的用户产生情感共鸣这一显著特性。
从音乐推荐算法来看,目前应用最为广泛的音乐推荐算法是基于协同过滤的推荐算法,该算法以相似性为基础,分别从用户或者项目两个方面入手进行推荐;但该算法需要音乐评分数据集作为数据支撑,因此存在数据稀疏和新用户“冷启动”的问题。基于内容的推荐算法更关注音乐作品本身,借助歌曲特征构建用户兴趣模型从而进行音乐推荐;但该算法的局限性在于其十分依赖于音乐特征的选取,易受特征提取能力的限制,且推荐结果缺乏新颖性。
与此同时,随着社会公众的隐私保护意识逐渐增强,以及《互联网信息服务算法推荐管理规定》对各类推荐服务算法也提出了具体的隐私保护要求,在线音乐平台在改进推荐服务时也要充分考虑用户隐私数据保护的问题。
从用户个人隐私数据保护来看,目前传统的个性化推荐算法实现过程中需要大量运用用户的个人数据,其中存在许多隐患。首先,在线音乐平台精准的音乐个性化推荐依赖于平台掌握的用户个人信息,据此完成用户画像任务,为用户打上标签,非常容易泄露用户的个人隐私信息;其次,不同平台之间会进行用户个人信息数据共享以完善自身的平台功能建设,不论在数据传输过程还是在数据使用过程中,都加大了用户隐私数据泄露的风险;最后,推荐算法陷阱容易让用户陷入“信息茧房”,一旦用户成为数据的“附属品”,平台对用户的引导能力将进一步提高,个性化推荐算法将会更了解用户也可能会获取用户更多的隐私数据。
三、注重用户隐私保护的群组推荐模式
为解决音乐推荐算法在用户隐私数据保护方面存在的问题,可以考虑将群组推荐算法引入音乐推荐领域。群组推荐是个性化推荐算法的进一步延伸,既能满足用户对推荐服务的需要,也能对用户的隐私数据起到一定程度的保护作用。
群组推荐
群组推荐的本质是为群体用户提供推荐服务,该算法的具体步骤分为四步:第一步需要完成用户偏好获取阶段的任务,一般将偏好定义为用户对两个及以上项目的排序关系;第二步是群组划分阶段,其基本思想是将偏好相似度高的用户构成一个群组;第三步是用户偏好融合阶段,该阶段的目的是获取群组偏好,并需要在每个群组成员不同偏好的基础上,通过偏好融合策略生成最终的群组偏好;第四步是群组推荐结果的展示阶段并对推荐结果进行评估。
群组推荐的优势
群组推荐算法在用户隐私数据保护方面主要具有两点优势,一是群组具有天然的匿名特性,二是可将用户个人偏好整合为群组共性偏好。
第一,群组的天然匿名特性可以有效地保护用户隐私数据。群组推荐的一个关键步骤就是根据用户个人信息划分高聚合度的群组,如基于相似度、基于内容以及基于规则的群组划分。将个人用户进行聚类后形成群组,群组成员众多,不同的群组成员之间借助群组的天然匿名特性,可以实现用户身份和个人数据的保护。此外,也可以在用户个人信息数据收集时利用群组特性更好地保护用户隐私数据,具体做法是在不同群组内选择管理节点并构建信息收集网络,群组内成员将群组推荐所需的隐私数据提交至各群组的管理节点,管理节点对收集的隐私数据脱敏汇总后提交至平台进行推荐。通过创建群组管理节点的方法,可以保证平台无法直接获取用户的敏感隐私数据,进一步保护用户的隐私数据安全。
第二,基于群组共性偏好难以反向获取用户个人偏好。群组内成员的偏好融合是群组推荐另一关键步骤,要求在群组划分结束后获取代表群组内成员偏好的共性偏好,并尽可能缩小不同成员间偏好的差异。用户的偏好融合策略包括普通融合策略和加权融合策略,无论使用哪一策略,都需要重点关注群组内成员的共性偏好。当推荐算法的中心从用户个人偏好获取转移到群组成员的共性偏好时,用户的个人隐私数据将得到有效的保护。同时,采取用户偏好融合策略将个人偏好信息融合得到共性偏好后,很难再对这种共性偏好结果进行反向处理,也就是说不可能再从共性偏好中反推出个人偏好信息,因此对用户的个人偏好信息起到了很好的保护作用。
音乐平台群组推荐的实现
在群组推荐实施过程中,根据用户偏好融合发生的阶段以及融合的具体内容,可以将偏好融合方法概括为模型融合方法和推荐融合方法,不同的偏好融合方法对应于不同的音乐群组推荐模式。在实际应用过程中,需要根据不同类型的音乐群组特征,选取适合的偏好融合策略和方法,以满足群体成员的总体满意度以及推荐的公平性。对于平台老用户来说,可以采用先融合后推荐的模型融合方法,因为老用户音乐偏好特征显著,群组划分后内部成员的相关性强,所以容易提取音乐共性偏好,模型融合方法的对象恰恰就是音乐群组内不同用户的共性音乐偏好;但该方法过于关注共性偏好,运用时要注意群组成员间的不公平性问题以及音乐推荐结果的新颖性。对于平台新用户来说,先推荐后融合的推荐融合方法则更为适合,因为平台新用户组成的音乐群组不具备明显的群组共性特征,可以先针对单用户进行音乐推荐再融合推荐结果,从而达到音乐群组推荐的目的;该方法虽然充分关注了群组内所有用户个性化音乐偏好,但忽视了音乐群组成员间可能产生的交互行为,所以在使用时要关注音乐群组内部群体因素对推荐结果的影响。
通过上述讨论,一种有助于改进在线音乐平台音乐推荐服务的新思路得以呈现。鉴于目前在线音乐平台仍存在的薄弱环节,特别是在用户个人隐私数据保护方面存在用户画像泄露隐私数据、平台数据共享风险较大以及用户容易陷入算法陷阱等隐患,将群组推荐算法引入音乐推荐领域,借助其在用户隐私数据保护方面的优势,可望生成更为注重用户隐私保护的新型音乐群组推荐模式。
作者:郭红丽 邓雯麒,来自厦门大学经济学院
本文刊载于《客户世界》2022年10月刊。
转载请注明来源:基于隐私保护的在线音乐平台群组推荐模式
噢!评论已关闭。