基于用户本地信息的间接信任模型协同过滤推荐算法
作者: 马永波 彭玉
关键词:信任模型;局部信息;协同过滤;相似性;时间衰变
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2024)28-0056-03
0 引言
如今,信任在分布式、对等、网格和动态协作系统中扮演着重要角色。本文引用以下定义:“信任(或对称的不信任)是一个主观概率水平,用来评估一个代理人相信另一个代理人或一组代理人将执行某个特定动作,无论他能否监控该动作(或者独立于他有能力以后监控或强制执行该动作),并且该上下文信息会影响到他自己的行动” [1]。由于这些系统规模大、开放性强,常常需要与其他代理人进行交互,而这些代理人可能几乎没有或者完全没有过去的互动经验。因此,用户需要评估这些交互的风险,而解决这个问题的一个有效方法就是建立信任机制。
当用户与一个代理人有足够的直接交互经验时,可以可靠地预测该代理人的未来表现[2]。现有的信任模型通常需要大量的直接经验,比如信任网络模型[3]、特征信任模型[4]。然而,在大规模环境中,直接经验是不充分甚至不存在的。例如,信任网络模型建立了用户与目标代理人之间的信任关系链。基本思想是:如果A信任B,B信任C,那么A可以通过B对C的推荐和A对B的信任来推断出对C的信任。在分布式系统中,这些链条并不容易被发现。此外,它们还会受到不准确的报告和“最薄弱环节”的影响[3]。因此,在评估预测时基于用户的间接经验,这些经验是从其他代理人那里获得的,并且确定了目标代理人的声誉。在这种情况下,本文提出了一种信任计算方法,利用用户自己与具有类似特征的其他代理人互动的信息来计算信任度,其中特征是由与代理人或交易相关的上下文信息确定的。
1 已存在信任模型
在本节中,笔者介绍了两种信任模型,分别是信任网络和特征信任模型。这两种方法的具体内容如下。
1.1 信任网络模型
信任网络模型基于传递性信任链。如果用户不认识目标代理人,他会询问他的邻居,如果邻居也不认识目标代理人,那么他们的邻居会继续询问他们的邻居。信任图是通过信任关系构建的。该模型包含两种变体:最短路径和最可靠路径。在最短路径中,代理人只选择最短路径,并忽略沿途代理人的可信度。如果存在多条最短信任路径,委托人将选择最可靠的路径(路径上的代理人最可靠)。在最可靠路径中,代理人会选择信任评级最高的、最可靠的邻居来请求目标代理人的信任。如果该邻居不认识目标代理人,它会继续请求自己最可靠的邻居。这样就找到了最可靠的路径。为了避免无限请求,笔者将跳数限制为6。如果在6个跳数内没有代理人认识目标代理人,则该模型无法推导出目标代理人的信任。
1.2 特征信任模型
该模型利用信任的传递性,并通过让同行进行分布式计算来聚合信任,以推导出信任矩阵的特征向量[5]。首先,用户向他信任的朋友询问目标代理人的信任情况。每个朋友的意见都与其全局声誉加权。为了获取目标代理人信息的广泛视角,用户会继续询问他朋友的朋友,直到两个连续迭代中得出的两个信任值之差小于一个阈值为止。该模型中使用了预先信任的代理人。
4.3 实验结果
本实验的目的是将本文提出的算法与传统的协同过滤算法以及近期业界比较领先的研究方法(Effec⁃tive Missing Data Prediction, EMDP) 进行比较。笔者使用相同的实验数据,比较本文提出的改进算法与“基于信任的CF”,以及文献[5]中提出的EMDP算法在推荐精度方面的差异。在这个实验中,“最近邻数数目”取值范围为[10,50],每次增加5个邻居。实验结果如图1所示。实验结果表明,本文提出的方法可以得到较低的MAE值,因此推荐效果更好,随着产品最近邻居数目的增加,预测的质量也在不断提升。
5 结论
本论文提出了一种基于用户本地信息间接信任模型协同过滤推荐算法。新算法考虑了在大规模分布式环境中预测未知代理人的可信度的问题。传统基于信任的协同过滤方法基本上通过将第三方对代理人的信任与信任者对这些第三方的信任相结合,或者简单地整合第三方对未知代理人的反馈来推导未知代理人的信任。相比之下,本文提出的方法使用了不同类型的信息,即信任者个人认识的其他代理人与未知代理人的语义相似性。新方法利用的信息来自用户的本地信息,因此在理论上可以轻松获取。而且,这个信任模型只是使用用户的本地信息进行初步评估。在复杂的网络环境中,特别是在缺乏直接目标代理人信息的情况下,这个模型具有深远的意义。