协同过滤的冷启动
下图以用户对电影的推荐为例。表1是用户对电影的评级数据的简单矩阵的示例,其中每行代表一个用户,每列代表一部电影。矩阵中的元素表示用户对所看电影的评分,评分值一般为1到5的整数。评分值越大,用户越喜欢这部电影。
对表1中的数据使用协同过滤推荐算法,系统发现用户爱丽丝、鲍勃和克里斯有相似的兴趣爱好,因为他们对最近三部电影的评分相同,所以系统会向克里斯推荐《白雪公主》,因为兴趣爱好相似的用户爱丽丝和鲍勃对这部电影的评分更高。在表2中,没有新用户Amy的评级信息。根据协同过滤推荐算法,根据评分信息找不到兴趣爱好相似的用户,因此系统无法为该用户推荐电影。同样的,新电影《怪物史莱克》也因为缺乏评分信息而无法被系统感知,所以无法推荐。这就是协同过滤推荐算法中新用户、新项目的问题,即冷启动问题。
“冷启动”包括两个层次:
1.用户的冷启动,由于新用户没有在产品上留下行为数据,自然无法知道他/她的喜好,从而做出可靠的推荐。这时候一般需要依靠用户的背景信息,或者引导用户选择,或者暂时用热门启动代替个性化推荐。在线推荐系统可以在用户产生行为数据之后立即更新推荐列表。
2.物品冷启动主要适用于基于物品的场景,即推送相似物品到一个物品。因为没有新品的用户行为数据,自然没有办法通过协同过滤来推荐。这时候一般用物品属性的相关性来解决。
在现实生活中,对于电子商务推荐系统来说,每天都有大量的新用户访问系统,每天都有相当数量的新商品加入系统。一方面,如果推荐系统能够为新用户推荐喜欢的商品,推荐系统将赢得更多用户的信任,为商家增加客户数量,提高用户对系统的忠诚度,随时为用户提供优质的个性化服务;另一方面,如果能够及时推荐新产品,可以增加产品的销量,为商家赢得更大的经济效益,促进电子商务的健康发展。
目前针对冷启动问题提出了一些解决方法,如随机推荐法、平均法、模式法、信息熵法、相似性度量改进法、内容信息组合法等。
本文摘自/s/blog _ 7f 9 BC 990102 w 81l . html。