随着大数据时代的到来,以及对推荐系统的深入研究,人们迫切需要能更好理解语义信息的智能化推荐模型;另一方面,随着线下服务业与线上互联网的结合,地理环境中的空间要素也逐渐成为推荐系统中不可忽略的重要信息之一。为此,韩家炜基于“异构网络中基于元路径相似性的个性化推荐模型”,提出了空间异构信息网和语义路径相似性,并结合空间分析,得到针对空间兴趣点(POI)的个性化推荐算法。
空间异构信息网:含有多类节点和多类连边的复杂网络称为异构信息网络(Heterogeneous Information Network),与只含一类节点和连边的同构网络相比,异构信息网络含有更丰富的节点信息和关联信息,更能体现现实中的复杂事务和关系。
在推荐系统中,数据往往表示为二部图的形式。该二部图结构实质也是一个以用户和被推荐项目为中心,包含了两者间关系及各自属性特征的异构信息网。该异构网络是推荐系统的数据基础,是推荐模型进行数据匹配的根基。异构信息网络通常由知识层和实例层两部分组成。知识层表达的是节点类型之间的关联,是一个抽象概念层;而实例层则是在知识层映射下用以描述实际情况的庞大复杂网络叫。在异构信息网中加入空间信息后,构成异构空间信息网,由知识层、实例层和地理层三部分组成,其中地理层是以项目实例的地理位置为关联,在地图上展示出一定分布形态的空间层。
基于异构信息网的推荐系统:推荐系统是一个通过分析用户的历史记录来推测用户未来偏好的系统,无论使用何种推荐算法,都是基于用户或者推荐项目的相似性。韩家炜团队以异构信息网这种网络结构来组织用户和推荐项目数据集,提出了元路径相似性(Meta-path Similarity),从而得到相应的新型推荐模型。元路径是异构信息网中知识层的路径,将元路径映射到实例层则得到相应的元路径实例。针对一条元路径,可以抽象出一个关系矩阵,计算路径上同类节点的相似性。根据相似性,建立用户和项目的关联矩阵,则可以得到基于异构信息网元路径的推荐模型。
虽然元路径的相似性是根据知识层的架构来计算的,但只是将属性当作一种标记来区别,并没有考虑属性语义上的含义。例如,餐厅推荐系统中,一个餐厅被标记为中餐,而另一个餐厅被标记为川菜,中餐和川菜被当作两个完全独立的标签,而忽略了这两者在语义层次上的包含关系。因此,基于元路径的相似性计算对语义的考虑只是停留在了网络结构的层面上,并没有考虑这些语义信息在概念层次上的关联。另外,在对有位置信息的兴趣点进行推荐时,异构信息网的推荐模型将位置的标签直接当作某一属性来计算,没有充分利用用户或项目由于地理位置而产生的空间分布和聚集信息。
针对元路径相似性模型在处理语义信息和空间特性两方面的不足之处,可以利用元路径的语义相似性,并结合空间分析,得到一种考虑语境和空间相似性的个性化推荐算法。该模型针对异构信息网中的本体信息,进一步考虑了知识层节点属性之间的父子和兄弟关系等概念层次的语义信息,计算元路径的语义路径相似性,使得节点的相似性计算结果更加准确和精细化;并采用空间分析和用户历史记录,给出了基于用户空间活跃度来预测兴趣点空间权重的计算方法,将空间特性从属性域转移到了空间域来计算,使得空间信息得到更加充分利用。将该模型应用于上海大众点评网的餐厅兴趣点推荐,应用结果表明,考虑了语义和空间活跃度的算法都能在一定程度上提高推荐的准确度,而且随着数据量的增加,语义信息和空间活跃度对推荐结果的提高效果也愈加明显。
领取专属 10元无门槛券
私享最新 技术干货