技术构成要素
协调过滤方法是基于情报流通传播,以提高收集效率为目标的情报收集的方法。情报流通是指
①为持不同问题的用户自动寻找解决问题的情报;
②向持相同问题的用户提供推荐服务;
①需要寻找关注某特定问题的用户群,进而得到为解决问题所必需的信息。②则是将这些用户的特征归纳起来,做到情报的交换。协调过滤方法则将上述的过程自然地融为一体。所以,我们可以为协调过滤做以下的定义。
协调过滤(Collaborative Filtering):
从人类的情报收集活动中,归纳抽象出其所对应的爱好,关心,意图等形态意识,并通过获取的收集情报及归纳抽象出的形态意识,对人类进行分类,实现类似人类间的情报交换的手段。
另外,还有各种各样不同的定义方法。比如,1996年出现的协调过滤法研究系统Group lens(协调过滤法最有名的研究系统之一),其开发者之一Paul Resnick有过如下的说明。
“Guiding people’s choices of what to read,what to look at,what to watch,what to listen to (the filtering part),and doing that guidance base on information gathered from some other people(the collaborative)。”
可翻译成下文:「以从其他用户收集到的情报(协调部)为基础,向每个利用者提供“应该读什么”,“应该关注什么”,“应该看些什么”,“应该听些什么”等建议(过滤部)」
从上述的表述中可以看出,对各种各样的情报来说,人们的评价及这些情报在社会中的影响可以被用来判断情报本身的价值,以及决定是否值得被推荐,这也就是协调过滤法的一个最大的特征。正是基于这点,有时也称其为社会过滤法(Social Filtering)。
作为协调过滤方法的一种,为实现能从洪水般的情报中抽取用户必要的信息,推荐系统(Recommence System)常备使用。另外,为能实现利用者爱好的自动追踪及判断,Agent系统(Agent system)技术及人工智能技术的研究利用,也有很大的潜力。
协调过滤法用到的算法有以下几种:
I. Active Collaborative Filtering(ACF)
最初的协调过滤系统是Xerox公司的PARC研究所的电子邮件系统,由David Malts等人开发研究的Information Tapestry电子邮件系统,该系统被Lotus Notes 中的Printer部分所采用。
该系统的特点是:彼此相识、指定范围内的用户通过相互指定,可以做到指定人与其认可的某一领域专家(被指定人)间的情报同步。
II. Automated Collaborative Filtering(ACF)
正如其名称所示,系统会根据用户已有的评价值,对尚未处理的情报进行自动评价(预测),将得分高的情报主动向用户推荐。自动评价的预测值则是根据其他用户和本用户的评价情报,采用皮尔森相关系数等相关算法而计算出来的。
这种方法有它的缺点。由于归根到底是靠用户的评价值而进行推荐的,如果某个情报谁也没进行评价则永远得不到推荐。另一方面,评价数据不足时推荐的精度也受影响。另外,情报量和用户数(评价数)差距较大时,难以找到附近的用户等。
MIT(麻省理工学院)的音乐情报推荐系统Ringo,明尼苏达大学的Netnews推荐系统Group lens等许多协调过滤系统都采用了这一种方法。
III. Feature Guided Automated Collaborative Filtering(FGACF)
根据用户的爱好,从事的领域各不相同这一现实,采用把作为过滤对象的项目群赋予属性情报,从而缩小问题的范围,提高推荐精度的方法即为FGACF法。Firefly Networks 公司(现已被MicroSoft公司收购)的Firefly采用了这个方法。
纯粹的ACF基本上不考虑情报的内容,在情报量不断增大的时候仍把各种情报一视同仁,很容易造成错误的推荐。另外,存在着随情报量增大计算时间也增加的问题。为解决这些问题,事先把各种情报通过赋予属性情报的方法进行分类(Feature Guided),根据属性情报分组,将爱好相近,领域类同的有用情报尽早地向用户推荐。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说申报材料高新技术企业项目可行性分析报告(5)在线全文阅读。