文档库 最新最全的文档下载
当前位置:文档库 › 个性化推荐系统的研究进展

个性化推荐系统的研究进展

个性化推荐系统的研究进展
个性化推荐系统的研究进展

裔燕磷誊遗展第19卷第1期2009年1月

*专题评述*

个性化推荐系统的研究进展*

刘建国1’2周涛1’2汪秉宏h3“

1。孛霹辩学技术大学,避{℃粝瑾系。建论物瑾舔究辑,舍怒230026;2。DepartmentofPhysics。UniversityofFribourg+Switzerland,CH-1700;

3.上海系统科学研究院复杂适廊系统研究所,上海理工大学,上海200093

接受互联躅技寒戆遨猛发震恕我稍带迸了信惠爆烽翡时代。海璧信患豹愆晴呈现,一方垂使溪户很难从中发现自己感兴趣的部分,另一方面也使得大量少人问津的信息成为网络中的“暗信息”,无法被一般用户获取.个性化推荐系统通过建立用户与信息产品之间的二元关系,利用已有酶邃择过程我糖似缝关系携掘每个簿户潜在感兴趣懿对象,递秀遂行个性亿推荐,箕本蓑就是僖息过滤.个性化推荐系统不仅在社会经济中具有重要的应用价值,而且也楚一个非常值得研究的科学问题。事实上,它怒目前解决信息过载问题最有效的工具.文中根据推荐算法的不同,分别介绍了协蘸过滤系统,基于蠹客酶推荐系统,混合推荐系统,软及簸近兴起秘基予震户一产蕞二部图网络结构的推荐系统.并结合这些推荐系统的特点以及存在的缺陷,提出了改进的方法和未米可能的若于研究方向.推荐系统的研究受到了信息科学、计算数学、统计物理学、认知科学等多学翳秘关注,它鸯管理稃学、清费行为等研究也密切福关。琵够荛不嚣学稃领域鹭辩磺王俸者磷究推蒋系统提供借鉴,有励于我国学者了解该领域的主要进展.

关键溺捺蓉系统令镶谨推荐{蠡鬻过滤蒸乎肉容豹攘襻基于弱绦懿推荐

随蒋Internet的迅猛发展,接入Internet的服务器数鬃鞠wofl纛一wide.Web上酶圈炙既数蟊都璺现出指数增长的态势.互联网技术的迅速发展使得大量的信息同时肇现在我们飚前,例如,Netflix上有数万部电影,Amazon上有数嚣万本豢,Del.icio.US上面有超过10亿的网页收藏,如此多的信息,别说找到自己感兴趣的部分,即使是全部满觉一遍也是不可麓的。传统的搜索算法只能呈现给所有的用户一样的排序结果,无法针对不同用户的兴趣爱好提供相应的服务.信息的爆炸使得信息的秘麓攀反悉降低,这稃现象被褥之隽蔫怠超载。个性化推荐,包括个性化搜索,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是代替用户评估它从朱看过的产品Ll-5].这些产品袋括书、电影、CD、阏茭、甚至可浚是饭鹾、音乐、绘l田j等等~是一个从已知到朱知的过程.个性化推荐研究直到20世纪90年代才设作为一个独立的摄念挺爨寒Ll,zj.最近的遂猛发爱,来源于Web2.0技术的成熟.有了这个技术,用户不再是被动的网页浏览者,ifii是成为主动参与者[3].在一个实际的掺荐系统中需要捧荐酶产瑟霹麓会有成千上万,甚毯超过百万,例如Amazon,eBay,Youtube等,用户的数因也会非常巨大.准确、高效的推荐系统霹泼挖掘掰户潜在鹩消费{囊离,为众多的用户提供个性化服务.在日趋激烈的竞争环境下,个性化攥荐系统已经不仅仅怒一种商业营销手

2008~06—23收稿,2008—07—09收修改稿

*周窳康点基础研究发展计划(批准号:2006CB705500)和国家r1然科学基会(批准号;10635040,60744003,10532060,10472116)资助项目**逶壤传者,E-mail:bhwang固ustc.edu。en

万方数据

蠹翌箨謦遥晨第19卷第l翔2009年l胃

段,更燕要的是可以增进用户的黏着性.个性化推荐系统已经绘电子商务领域带来巨大的商监奢j菔。据VentureBeat统计,Amazon的推荐系统为其提供了35%的蠢品销售额.尽管现有的推荐系统已经在电子游务等领域取缮了巨大的成功,但是还需要在不同领域研究人员的努力下进一步完善和发展[s].一个典型的例子就是Netflix开出100万美元的奖金。奖励给麓把他们阏站的产品推荐精确艘提高10%的人.Netflix的竞赛只是从推荐准确性的角度评价算法,事实上,还有很多的评价指标可以度量推荐算法的表现,因此也可以跌多个角瘦对算法进行改进.肖然,无论从哪个角度改进,都需要从整体人手对搀荐系统的体系结构有一个完整的认识.

一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和捺荐算法模块。行为避录模块受责记录髑户的喜好行为,铡如问答、评分、购买、下载、测览等.问铸和打分的信息相对好收集,然而有的用户不愿意离系统提供这些信息,那么就需要逶过其德方式对用户的行为进行分析,例如购必、下载、浏览等行为.通过这些用户的行为记录分析用户的潜在喜好产品霸喜欢程度。这就是模型分辏模块要完成的工作.模型分析模块的功能能够对朋户的行为记录进行分析,建立合适的模型来描述用户的喜好簧息。最后是推荐算法模块,剥耀蘑台的推荐葵法,实时地从产晶集合中筛选出用户感兴趣的产品进行推荐.其中,掭荐算法模块是推荐系统中最为核心戆郝分.

本文简要介绍一些文献和实际系统中采用的推荐算法和不同类型的推荐系统.根据推荐算法的不曩,雄荐系统可黻分秀如下咒类:貉阐过滤(col—laborativefiltering)系统;基于内容(content—based)的推荐系统;混合(hybrid)推荐系统以及最近兴超鹩墓予鼹声一产瑟二部图网绦结构(network-based)的推荐系统.最后,我们将指出这些系统存在的缺陷和未来可能的若干研究方向.

1协同过滤系统

协网过滤系统是第一代被提出并褥到广泛应用的接荐系统.其核心思想可以分为两部分:首先,是利用用户的历史信息计算用户之间的相似性;然后,利用与睡标用户相似性较赢的邻居对其他产品的评价来预溯目标用户对特定产龉的喜好獠度.系统根据这一喜好程度来对目标用户进行推棒.协同过滤维荐系统最大的优点是对掺荐对象没蠢特殊的要求,能处理音乐、电影等难以进行文本绪构化表示的对象.

协同过滤系统是嚣虢应用最为广泛的个性化推荐系统,其中Grundy被认为是第一个投入应用的协同过滤系统f6].Grundy系统可以建立用户必趣模型,利用模型给每拿簏户推荐榛荚的书籍。Tapes-try邮件Ho处理系统人工确定用户之间的相似度,随着用户数域的增加,其T作量将大大增加,而且准确囊也会大打辑蠢。GroupLens强‘建立鬻户信患群,群内的用户可以发布自己的俯息,依据社会信息过滤系统计算用户之间的相似性,进而向群内的其绲麓户进行协同搀荐.RingoE9】利焉裰磷的社会信息过滤方法向用户进行音乐推荐.其他利用协同过滤方法进行推荐的系统还有Amazon.corn的书籍推荐系统Llo』,Jester的笑话接荐系统曩引,Phoaks的wwW信息推荐系统【l引,等等.

协同过滤掺荐系统的算法可以分为蕊类:基于记忆(memoD--based)H卜强。的和基于模型的(model-based)的算法[1620|.基于记忆的算法根据系统中所有被打过分觞产品信息进行预测。设C=‰,龟,…,fN}为难户集合,S={s,,s:,…,sM}为所有的产15舂集合.设一.;为用户C对产品s的打分,这个打分是不知道的,霭要通过算法去预测。在协网过滤系统中,薅户f对产品s的打分r。通过其他用户对s的打分计算丽得到.设e为与用户c相似度比较高的用户集,预测t.,的函数形式有:

‰一志∑%,

}∈e

Yc,s=詹∑sim(c,e)?‰

。∈己

(1a)

(1b)

‘,;=尹,÷焘∑sim(e,。)?(如.,一尹,>(1e)

。∈0

其巾是隽一个标准诧因子,通常蠢一1/∑tsim(c,£)l,

}∈孝

sim(i,歹)表示用户i和J之间的相似性.用户C的平均

万方数据

自显科营建屋第19卷第1期2009年1月

打分广,怒义为尹。一(1/kI)>k∥其中S。={s∈

西

Sl_。,≠0}。魏公式(1a>新示,最篱单的计算方法就是直接计算邻居打分的平均僚.然而,最常用的计算方法却楚加权平均(掩),其中sim(c,e)为用户f和f的稠戳後.如栗焉户f裙f越像,疋.,将有更大的权蓬用于预测,_。.由于(1b)应用了标准化因子k,因此(1b)可以用于计算不同的推荐系统中的用户相似性度量.应耀<硌)时,尽管使用了棚权稀,但是并没荐考虑不同用户的评价尺度不~样的问题.(1c)通过只考虑不同用户平均喜好程度的偏差,克服了评判尺度不一致的缺点,一般悉育舆有院(1b)更高静精确度.偏好过滤【21-z4]是另一个克服用膨打分尺度不一的方浚.该方法注重于预测用户的相对偏好,耐不是评分绝对值.

协同过滤系统中已经采用了很多种方法计算用户之闻的相似度[1,9,13,25--28]。这些算法巾,大部分都是基于用户对共同喜好产品的打分。瑟个最常矮的方法是Pearson相关性和夹角余弦,它们都定义用户童稻y共同订避分的产品集合为:S。=SnS,.基于图论的方法【2朝可以不用计算所有掰户Y的S。而直接确定z的最近邻.用户z和Y之间的Pear—SOB摆关性定义为H剖

∑(‘.,一尹,)(r,,,一ry)《《删净茬导霞i

筒在夹角余弦方法中‘ls,zs],用户z和Y都用m缭商量表示,两个向镀之间的相似性可以通过计算它们之阀的余弦蓥得到

sim(圳)-cos“∥2丽簧硫一

∑k6,,

—兰兰兰==(3)

√影”;砂,

其中工?Y表示两个向量的点积.不同的系统可以采用不同的相似性计算方法以使得预测评分结果尽可畿准确.塞予爝户的兴趣耱爱好燕随时闻变化的,所以一个普遍采用的策略就是提前计算所有用户的耀似性sim(x,歹),隔一段时阊进行一次更薪.用户需要推荐时,可以用事先计算好的裰儆性结果进行有效推荐.

许多改进樊法已经被广泛研究并且应用到标准豹福关性计算和央角余弦公式中。例如缺席投票(defaultvoting),事例引申(caseamplification)【l副和加权优势预测n如强3等.麓中,缺鬻投票是基予记忆方法的一种扩展.如果用户明确评分的产品数豳很少,上面提到的算法得到的用户相似度都不准确.原因在于这种相似髅鳇计算是鏊予用户搿稳Y共圈评过分的产晶集合。实证数据袭明,如果给一些没有打分的产品赋予一嫂缺省的打分值,那么预测分数的准确性将大幅度提遗‘ls.zs]。Sarwar等。铂提枣应矮糊关牲纛夹角余弦方法计算产品之间的相似性.这个思想被Deshpande和Karypis推广到基于产品相似性的top-N推荐算法中[sol,郄在避行维荐的时候哭考虑穰觳疫最高的茂个产品,并j睁所有的产品.实验证明这种方法不仅比传统的基于用户邻居的推荐算法快1—2个数量级,焉麓其骞更好的推荐准确性.Chen纛Cheng£27j稠建用户产品列表中的先后次序计算用户之间的相似性,排名靠前的产品在计算用户相似性的时候具有较高的权燕.而Yang襁Gu强8j挺滋利用臻户的行秀信息梅建用户的兴趣点,利用兴趣点计算用户之间的相似性.实验证明,这种方法比经典的协同过滤算法的推荐结果要好.文献E25,303的结纂表嗳基予产品穗似性的算法能够比基于用户相似性的算法得到更好的计算结果.

基于模燮的算法收集打分数据迸行学霹势推敝用户行为模型,进而对某个产品进行预测打分.基于模型的协溺过滤算法和基于记忆的算法的不同在予,基于模型的方法不是基于一魃肩发规爱ll进行预测计算,而是基于对已有数据应用统计和机器学习褥到的模型进行预测。Breese等¨30提出一个基于概率的协同过滤算法,其计算打分的公式如下

以,;一E(‘。;)=∑i×Pr<‘。,一ilrc,Jf《sf)

£;0

(4)上式假设抒分篷为0到携之阚的整数篷。概率&表

万方数据

甓.婪碡学建囊第19卷第l期2009年l胃

示基予用户以前的打分,用户要给产品s打指定分数的概率.为了结计概率,Breese等”3】提蠢了黼个选择概率模型:聚类模型和Bayes网络.在第一个模型巾,假设用户的打分彼此独立,偏好楣似的用户聚集戒类,给定餍户类鹃标号。豢Bayes阑络中,类的数量和模型参数可以从已有数据中学习得到.Bayes网络中的点由一个领域曩的产品表示,点的状态对应着每个产品豹打分值.网络的结构和条件概率从已有数据中学习得到.这个方法的缺陷就是每个震户只簏属于一个类,丽一嫂撰荐系统申如果掰户可以属于多个类或许会更好一些.

其他基于模型的协同过滤推荐系统有概率相关模型[1引,极大熵模型L20j,线性回归日引,摹于聚类豹Gibbs抽样算法”“,Bayes模型∽引,等等.最近,大缀的研究试图从更复杂的概率模型中建立推荐过程模型。例如,Shani等|33l把推荐过程看做基于MarkOV决策过程的序剐决策过程,利用已有信息预测用户以后的喜好产品的概率,在找到相应的产品进行捧荐。其他的概率模型技术包括概率潜层语义分析Li乳34’35i,语义生成模氆(aspectmodel)Li9j.另外,Kumar瓣f361用一个简单的概率模型说明每个用户稷对小的数据在协同过滤审是菲常蓬要的。Yu等∞73从输入数据处理的角度提冉了改进协同过滤的其他方法,包括除噪音技术,选择用户打分集技术,冗余度分橱翻打分数据懿耀蕊性处理等。数德结果硅示这些方法可以提高麟于模型的协同过滤算法的准确性和效率.Yu等f37]还提出_『输入选择技本,可以解决基于模型的算法篱要对大黢模数据进行学习的问题.Manouselis和CostopoulouL3轧掇出了多准则协同过滤推荐系统,可以对具有多重衡最掺稼懿产瑟送行维荐。Chen等口副提溅了群律协囝过滤推荐系统,该系统对群体而非个人进行推荐.总结起来,协同过滤系统因为有以下的优点,在实际系统孛褥到了广泛的疲蔫。

(1)具有推荐新信息的能力,可以发现用户潜在的但自己尚未觉察的兴趣偏好.

(2)麓够嫠荐艺术晶、齑乐、电影等难缓进行内容分析的产品.

虽然协同过滤推荐系统得到了广泛的应用,但是氇匿瞄缀多闻题,爨熬如簿砖薪臻户进行雅荐或如何推荐新产品给用户(冷确动问胚),打分稀疏性问题,算法可扩展性阍题等。另外,基于用户的协同推荐算法隧着耀户数挺的增多,计算量成线性粕大,其性能会越来越差.因此有的捧荐系统采用基予产品相似性的协同过滤算法,在产品的数壤糨对稳定的系统中,这种方法是很有效的,侧如Ama—zon的书籍推荐系统[10|.但是对于产品数量不断增加憋系统,例如Del。lici。US系缝,这种方法是不适用的.在Web应用中,响应速度是影响用户体验最重疆因素之一,这极大地限制了基于用户的协同过滤技术在交际系统中的使矮。Amazon更多建使壤了基于产品的协同过滤技术,而且随着Amazon的成功,基于产品的方法也大为流行起来.

2基于内容的推荐系统

历史上,最初的基于内容的推荐(content—basedrecommendation)是协同过滤技零薛延续与发展,它不需要依据用户对项目的评价意见,而魑依据用户已经选择的产品内容信息计算用户之间的相似性,送两送行裰应的攒荐。随善撬器学零等技术的完善,当前的基于内容的推荐系统可以分别对用户和产品建立酉已置文件,通过分析匕经购买(绒浏览)避的内容,建立或更薪臻户的配嚣文件。系统霹缓比较用户与产品配置文件的相似度,并直接向用户推荐与其配鼹文件最棚似的产品.例如,柱电影推荐中,基于内容的系统蓠先分析用户已经褥过的打分比较高的电影的共性(演员、导演、风格等),再推荐与这些用户感兴趣的电影内容相似度赫的其他电影.基予内容的推荐算法静根本在予信息获取“0’4¨和信息过滤[42].因为在文本信息获取与过滤方露的研究较为成熟,薄|!有很多基于内容的推荐系统都是通过分析产品的文本信息进行推荐.

在信息获取中,表征文本最常用的方法就TF-IDF方法[4¨,该方法的定义如下:设舂N个文本文件,关键词壹;在理i个文件中出现,设,l,为关键词愚。在文件d,中出现的次数,那么惫;在d,巾的词频丁F。定义为

阡“一上maxzf,j(5)其中分母的最大值可以通过计算以中所有关键词

万方数据

自.美舛誊建展第19卷第1期2009年1月

k:的频率得到.在许多文件中同时出观的关键阋对子表示文件的特性,区分文体的关联性是没有贡献的.因此7■与这个关键词在文件巾出现数的逆(IDF,)一起使用,IDF,的定义为

IDF,:109塑(6)

7"/f

那么,一个文搏d,哥羧表示走向量《j=(w"讹,,…,‰),熟中

韬a=去;。g罢(7)

设Content(s)为产品S的配鬣文件。也就是一些描述产瑟s特性的游缝集合.遴鬻Content(5)可以袄产品的特征描述叶1提取计算得到.在大多数的燕子内容的推荐系统中,产品的内容常常被描述成关键溺——&b系统镰3j就是一个鬓型的例子.Fab燕一个网页推荐系统。系统中用~个网戚中最重要的100个关键词来表征这个网照.Syskill和Webert系统Hq溺128个信患鼍最多酶递表示一个文件。綦子内容的系统推荐与用户过去喜欢的产融最为相似的产品[4345],即不问候选产晶与用户已经选择的产品进行对比,稚荐隧配度最好的产品。或者直接秘滗户推荐与用户配谶文件最为相似的产晶.设User-Profile(c)为耀户c的配置义{牛,UserProfile(f)可以用向量(Wc,,Wc,,…,‰)表示,冀中每个分鼙‰表示关键词ki对用户c的重要性.用户和产品都可以利用TF—IDF公式表示为职和桫;,在基于内昝的系统中,rc.;常被定义为;

rf,,一score(UserProfile(c),Content(s)).(8)

以.,可以利用向量w,和'I,,表示成一个德,例如爽角余弦方法[40,41]:

心。,2c。s(毗,眠)2币i肓赢(9)

除了传统的基予僚怠获取酶推荐方法之终,一些实际系统中还采用了其他技术,例如Bayes分类Ⅲ一4引、聚类分析、决策树、人丁神经网络m3等。这些算法不同予基子信息获取方法酶施方在予,算法不是基于~个函数公式来进行推荐,而是利用统计学河翻规器学习技本从已有的数据中通过分析褥到模氆,基于模型进行推荐.例如,利塥Bayes分类器对网页进行分类¨44引.这种分类器可以用来估计一个网页p,属于某个类C:的概率。给瘩这个网页中的关键溺矗”k”…,k埘,得到这謦关键词属于C,类的概率.虽然关键词彼此相互独立的假设条{譬很不切实际,毽是这静分类方法在实踩系统中仍然有高的分类准确率一引.

基于内容的推荐系统中,用户的配置文件构建与更薪是其孛最为核心的郝分之一,也是爨蕊研究入员关注的焦点.例如Somlo和HoweH7]以及Zhang等[48j提出了利用自适应过滤技术更新用户配置文馋。首先,翻j疆羽户的喜好髂息褥建配篷交件,把用户的兴趣点归纳为几个主题文件.进而在连续的web文件流巾依次对比Web的文本内容与主题文佟的援叛魔,选弹性媲把孝翼皴凌较毫的Web曩示给用户并更新用户的配置文件.进一步地,Robert—son和WalkerL4引以及Zhang等【50]在自适应过滤的基礁上提毒了最佳篷酝度阚夔没定算法.蒜先还是在崩户的配黢文件巾建立一螳问题集,系统利用已有数据与用户配置文件相似度的概率分布确定一个最健阈菹,襞得系统可以最大程度缝逸分与雳户酶配缀文件相关和不相_炎的文件.贝有与用户配置文件的相似度火于最佳阈值的文件才能影响到用户配置文律戆更薪.这耪方法不莰霹以进一步掇惑算法的精确性,而且可以大大提高系统的运行效率.通常用户的配置文件都是由一些关键词表示,熟采稍爨匿论翡索弓l方法毒滚节约存储夺闻。然而,当用户的兴趣爱好发生改变的时候,配置文件更新的代价是很大的.Chang等L5¨通过区分长期感兴趣与短期感兴趣的关键词,赋‘≯短囊感兴趣的关键词更高的权重,在此基础上建立新的关键词更新树,从而大大减少了更新配置文件的代价.Degemmis等b朝代替传统鲍基予荚键词懿方法,稠用WordNet构建基于语义学(semasiology)的用户配置文件,配置文件通过机器学习和文本分类算法褥绷,垂嚣氛含了矮户罄好酶语义信患,两不仅仅是一个个关键词.在基于内容的协同过滤系统上的实验结果表盟,这种方法建立的配置文件可以大大提高推荐的准确性.AdROSA广裔推荐系统∞列藕焉

万方数据

氢釜辞营建晨第19卷第1期2009年{胃

用户注册信息构建配置文件,并且娜入用户的lp地址,浏览习惯等信息.该配置文件与Web的内容信息进行匹配分析,相似性最高的Web被推荐给用户.自动获取或疑毂用户配置文件的方法需要在配置文律的准确性襁易更新性方面我到平衡.磴确她捕捉用户喜好信息需要大鬣的计算资源,更新速度穗应也馒很多。反过来,如果更薪速度快,就要棰牲其穗确性.人机交互的方法是解决这个问题鲍方法之~.Ricei等【s4]设计了一个手机在线旅行推荐系统,通过篱单的交互式问题获取用户的喜好信怠,进而给用户推荐相应的旅游线路或旅行产品.粥户在开始的时候可能对自己的喜好也不是很清楚,因此利髑交互式提阗的方式罴获取用户喜好信息懿便捷方法之一.

不同语言构成的配置文件无法兼容也是基于内容的攥荐系统蘸l巍的又一个大阚题。Martinez等睁明提出一个柔性语商表示方法,可以用多种语言晌词语表示用户的配鼹文件.从而可以在多语种环境中进行接荐。

总结起来,基于内容推荐的优点有:

(1)可以处理新用户和新产品问题(冷启动).由于新瘸户没有选择信息,薪产品没有被选信怠,因此协同过滤推荐系统无法处理这类问题.但是基于内容的推荐系统可以根据用户和产品的配置文件送行棰波酶推荐。

(2)实际系统中用户对产品的打分信息非常少,协同过滤系统由于打分稀疏性的问题,受到很大的限涮.基予内容静攥荐系统霹黻不受钉分耩巯性闻题的约束.

(3)能推荐新出现的产品和非流行的产品,能够发琨隐藏的“暗痞息”。

(4)通过列出推荐项目的内容特征,可以解释为什么推荐这些产品。使用户在使用系统的时候具有穰好的蕉户镕验.

基于内容的推荐系统不可避免地受到信息获取技术的约束,例如自动提取多媒体数据(图形、视频流、声音流等)的内容特征吴有技零上的困难,这方面的相关应用受到了很大限制.下一节我们将介绍基于用户一产晶二部图网络结构的推荐算法,该算法不仅可以举受信息挖掘技术的制约,i嚣魏可以解决协同过滤摊荐系统中打分稀疏性和算法可扩鼹性等问题.但此类舞法仍然难以从根本上解决冷窟动问题。

3基于网络结构的推荐算法

基于网络结构的推荐算法不考虑用户稠产品的内容特征,而仅仅把它们看成抽象的节点,所有算法剃矮的信息都藏在瘸户;}鞋产晶的选择美系之中.周涛等[56,573和Huang等[58,591分别利用用户一产品用二部分图(bipartitenetwork)建立用户~产品关联关系,并搌就提出?基于网络绩梅的撵荐算法.其中,周涛等口6,573提如了一种全新的基予资源分配的算法,Huang等f58o通过在协同过滤算法巾引入二部分图上的参h敖囊力学,部分鳃决了数据耢琉性的阉题,进一步地,Huang等f5朝对两个实际推荐系统的厢户一产晶二部图进行了分析,发现这两个实证系统具舂院隧枫图更大鳇平均鞭离蠢集聚系数。张冀成等邸“61]考虑用户对产品的打分信息,在更复杂的环境下实现了基于热传导【6叫和物质扩散[61]的推荐箕法,这些算法效果也明曩婷予经典豹协同过滤。下面简要介绍麟于网络结构的推荐算法最近的研究进展.

3.1基于二都分圈资源分配的攘荐舞法

考虑一个由/-n个用户和n个产品(例如书、电影、网贞……)构成的攘荐系统,其中如果用户i选择遥产品_f,就在i和歹之闯连接一条边a。一l(i一1,2,…,m;J=1,2,…,,z),否则ai=0.由此,这个系统可以用一个具有撤+靠个节点的二部分匿表示.对予任意目标用户i,推荐算法的霸的是把所有i没有选择过的产品按照i喜欢的程度进行排序,并且把排名靠翦的那些产瑟推荐绘i.极设i选择过的所有产品,都恩有某种向i推荐其德产品的能力.这个抽象的能力可以看做位于相关产品上的菜耪可分的资源——拥有资源的产晶会把更多酶资源交给自己受青睐的产品.对予有m个用弦和订个产品的一般的推荐系统,如果用表示Wii产品歹愿意分瑟给产晶i酶资源配额,可泼褥到W。的一般表达式‘56]

镏s一丢砉警㈣

万方数据

蟊.婪井誊建屋第19卷第1期2009年1月

其中k,表示产品_『的度(被多少用户选择过),k,表示薅户z的度(该用户选择过多少产品).

对予给定的一个目标用户,将他选掸过的产晶上的初始资源设为1,其他设为0.这样得到一个牲维的0/]矢量,l弋表铮对该个爨的初始资源分配梅型.显然,这个初始构型表达了个性化信息,对于不同用户是不一样的.记这个矢量为,,通过上述过程褥到鳇最终的资源分配矢藿可以表示为

f7一wf(11)

把霞标耀户没骞纛避的新有产晶,按照矢量,7中对应元素的大小进行排序——值越大就说明该用户越喜欢(这螳产品在那些已经被选择过的产品心目中总的分蟹最重)。排序靠酶的产晶,霹戳推荐给舀标用户.

为了量化算法的精确性,把真实数据随机划分为两个部分,一部分看做训练集,另外一部分罴隐藏起来用于检测算法准确程度的测试集.构造二部分图孝疆计算w矩阵时,只有训练集可以使用.在没有其他殴经条件的前提下,强能假设用户已经选择过的产晶是他喜欢的,因此,一个好的算法应该要把训练集中已知的用户喜欢的产品排巍比较靠酶的位置.对于任意一个用户i,假设他有上,。个产晶是没有选撵过的,那么算法会给出这L。个产品一个按照喜好程度翦萎}黟<最终资源数量摆网的产品投赋予一个随机的序号).如果谯测试集中i选择了产晶歹(这同时意味着歹不会出现在训练集中,因此是算法中k个没有选择的产品之一),瑟j被算法摊在第R,,位,那么认为(i,歹)的相对位置怒

%:RF,j(12>

量√:

越精确的算法给出越靠前(^,小)的相对位置.MovieLens穆为标准数据库被蔫予测试算法的准确程度,该数据库包含了943个用户和1682部电影,由GroupLens研究小组收集(http://www.grou-plens.org).薅声辩自己看道的电影贸l一5分,其中1分袭示最不喜欢,5分表示最喜欢.假设分数大于等于3表示用户喜欢这部电影),并依此建立二部分豳,该图共包含85250条逾.这骜逮被随撬划分为两部分,其中90%归为训练集,10%归为测试纂。运行掺荐算法磊,测试集中每一缉用户一电影对(i,_f)都会对应一个相对位越值r¨将所有用户一电影对(i,J)的相对位置求平均,可以得到平均<r>,这个值可以媛纯评价算法的精确度——《r>越小越精确.通过计算得到,全局排序算法的(,.>一0.136,基于Pearson系数的协同过滤算法的<r>---0.120,基于恁户~产晶二郝阉网络结构的算法的<,.>一0.106.基予网络结构算法的<r>在三种算法中最小,说明准确程度最高.

3.2产晶的波信息砖维荐准确{耋的彰嘀

在上一小节介绍的算法中,如果一部电影被1000个用户瓣过,那么在对这1000个用户推荐时,初始条件中这个电影糖鸯的资源毯都是l。獭这个l看做推荐能力,那么遮部电影的总推荐能力就是1000。也就是说流行的电影撵荐的总能力也大!周涛等H7‘通过避当地降低流行电影的推荐麓力提高7算法的精确性.对于任意目标用户i,设定初始资源为os7]

(13)

其巾k,为第-『部电影<第歹令产瑟)的度,萝是可调参数,当它大于0的时候,大度电影的推荐能力得到提高;反过来,当它小于0的时候,大度电影的推荐毙力蔹疆潮.露一0的辩候算法退化到上一节讨论过的情况.

MovieLens数据上的数值实验显示,算法精确度在露一一0.8时褥裂很大提裹,此ll圣《r>一0。0972,较文献E563中的算法提高了8%.注意到当口=一l的时候,每部电影的总推荐能力是一样的,说明算法在维荐麓力毙较均匀的时蔟孝蠢确瘦较高。

需要特别强调的怒,在同样的用户喜好程度下,推荐冷门的产品嚣比推荐热门的产{l矗意义更丈.还是戳电影鬼镤,离耀户接荐好菜坞酶大背,如果用户喜欢,固然很好,但是即便没有这个推荐,用户自己通过广播、电视、网络等途径,也麓够知道这部大筹。遮就好篼罴莲联瓣中的“明信息”.但是还有很多信息,对应于那些冷门的产品,可能某个用户很襄欢,但是这些冷门产品数蟊泷大,又没有媒俸塞传,如采没有攘荐,蔫户

万方数据

翥苤辞荸建晨第19卷纂1期2009年l嗣

根本就无从得知——这些就是互联网中的“瞵信息”.觚这个煮发讲,挖掘暗信惠意义要大很多.回到算法本身,就是说推荐在同样精确度(用<r)衡量)的情况下,推荐的产品度越小越好。因为良臻户捺荐得太多,用户没有精力去番,所以一般而言推荐的产晶数目都不会超过i00.举例来说,雅虎营乐(http://new。music。yahoo。corn/>的个性纯维荐包括40酋歌,智能社会书签(smartsocialbookmarks)系统(http://www.sesamr.com/)的个性化攫荐包括20条书签。给定了推荐列表的长度己,系统会自动抱排名最靠前的L个产品推荐给用户,考察这L个产品的平均度.在三个典型的L值下(L一10,50,100),推荐产品的平均度郁隧着岔值单调上升,当岔一一0.8的时候,不仅仅算法精确度明显比文献[563好,而且算法能够推荐更加冷门的产瑟。

3.3通过去除蘑复属性获得高精确度的算法以电影为例,为了筛攀,我们假设一个用户是否喜欢一部电影廷由两个因素决定:主角和导演.特别地,假设一个目标用户喜欢主角A和导演B.假设该用户只看过薅部电影,这两郝电影一部爨由A主演的(M1),另一部是蠹B执导的(M2).鲫果恰有一部电影M3由B执导A主演,那么这两部电影将分别砖电影M3产生推荐,推荐的总强度楚2(M1和M3因为A关联,M2和M3因为B关联,关联的强度都是1).考虑另一种情况,该用户褥过的霭部瞧影都是凑B执导的,但是主焦都不是A,那么对习:另外一部也是由B执导的电影(记这3部电影为M4,M5和M6,并假设3部电影主角各不摆同,基都不是A),这薅部电影推荐的总强浚也是2.鼎然地,这里来自电影M4和M5的推荐包含了重复的属性(导演是B),因此虽然具有一样的强度,焉声应该更喜欢电影辩3(既是转撬导的,又是A主演的)而不是M6(仅仅是B执导).我们希望能够有一种简单的算法来降低这种重复属性的影响。考虑蘩M4翻M5鑫身氇具有较强麴关联(妇栗两个电影在对另一个电影的推荐中包含了重复的属性,自然这个属性会导致这两部电影自身的关联),从醚4经l羹M5到M6纛姨醚S经圭M4臻M6的二阶关联也应该比较强,从原来的关联矩阵中适当减去二阶关联,有望提高算法的精确程度。

在文献[56]酶算法中,最终的资源分配情况可以写成矩阵形式,7一wf,周涛等m3进一步考虑二除的耦合,具体定义为

W7一W+aW2(14)

对应酶最终资源矢量为,=W7,,其中a是可调参数.MovieI戈ns数据上的实验结果显示在a一一0.75附近,算法波现最佳,对应的<r>值为0.082。这墼小予0的藏饶的a煎支持7上面的分耩.特别要强调的是,从全局排序到协同过滤,到二部分图扩散。再到本算法,<r>值分别为0。139,0。120,0.106秘0.082,提高程度分舅|l为14%,12%帮23%.注意到前面两个提高都是算法思想上本质的变化,i『li本葵法与文献[56]的算法在思想上一脉相承,仅仅怒从技术上考虑了可能的重复满性,但是提高程度却非常惊人.高精度的推荐体现了本算法的重要应耀价值。~个自然的问题是,考虑更蹇阶的耦合是否是有价值的?将本算法迸一步推广到三阶的情况

W7=W4-矗W2+bW3(1S)

其中b也是可调参数.实验结果表明,综合考虑参数缝(口,6),也廷麓把<r>再提高l%一2%.蠢于每提高W的一个阶次,算法的时间复杂性都会胂j增,因此在实际应用中考虑到2阶运算就已经足够了.

3.4通过引入耦合阔值提高算法精确性并降低算法复杂性

在实际应麓酶霹簇,降低算法的空闻复杂性和时间复杂性是非常关键的问题.事实上,在一个推荐系统中,一个用户姆绝大多数的用户耦合很弱(穗翻共霹选择过的产晶菲章少,甚至没有),藿是在计算推荐资源的两步扩散时,每一个用p都在考虑的范围中。通过某种办法去除掉弱耦合的影响可以藏少算法熬体的计算基.

这里,介绍一种简单的方法[63|.首先,计算任意蕊个用户之闯的相似性,其中,对i两富,i与歹的相似性被定义为

万方数据

自燕科予违展第19卷第1期2009年1月

d。一丢砉 (Ⅲ)

l遍历所有的珂个产品,整个求和符号表示i和J有多少个共同选择过的产品.需要注意的是,d。≠dn当针对目标用户i进行推荐的时候,只考虑与i的相似性大于或等于给定阈值d,的用户(即所有满足d。,>d。的用户歹)以及和这些用户(包括i自己)连接的产品.这样得到一个子二部分图G:((f,),然后,将扩散算法局限在子图G,(以)中进行.显然,d,越大,G,(d。)的规模越小,算法的计算量也越小.数值实验显示。设定阈值d,,不仅可以降低算法的时间复杂性,同时还可以提高算法准确程度(考虑弱耦合的影响反而干扰和弱化了最重要的关联信息),具有一举两得的效果.

3.5基于传播的用户相似性度量

传统的协同过滤推荐算法中,用户的相似度用Pearson系数表征.受到文献[s6]的启发,刘建国和汪秉宏【64]利用资源分配原理计算用户之间的相似性,进而利用协同过滤算法向用户进行个性化推荐,其中,用户的相似性用如下公式度量

sv—k南U蕃k焉Ⅲ,

叼(,)台(仇)…7

其中是(Oj)为用户Oj的度.在Moviel。ens上的数值实验显示,推荐结果的平均准确度可以从基于Pearson系数的0.130提高到0.122.在此算法中假设所有产品的贡献是一样的,即被1000个人选择的产品与被一个人选择的产品的影响力是一样的.为了讨论产品的度信息对推荐结果的影响,文献E643进一步给出包含参数卢的新的相似性计算公式如下点的影响力有利于提高推荐的准确度.

为了节约存储空间,提高计算效率,刘建国和汪秉宏【64]还提出了基于top—N用户相似性信息的协同过滤算法.算法利用物质扩散原理计算好用户的相似度后,只利用相似度最高的N个邻居用户的信息进行相应的推荐.数值结果硅示,这种方法不仅仅可以节约存储窄间,而且还存在一个最优的N值,在最优值附近的推荐准确度比考虑所有用户影响的情况还要好.

基于网络结构的算法开辟了推荐算法研究的新方向.然而,该算法也面临着新用户,新产品等问题.如下节所要介绍的,许多实际的推荐系统把上述几种推荐算法有机结合起来,并取得了不错的应用效果.

4混合推荐算法

协同过滤,基于内容,以及基于网络结构的推荐算法在投入实际运营的时候都有各自的缺陷一1’43“6-7…,冈此实际的推荐系统大多把不同的推荐算法进行结合,提出了混合推荐算法.针对实际数据的研究显示这些混合推荐系统具有比上述独立的推荐系统更好的准确率[43_0’。751.目前,最常见的混合推荐系统是基于协同过滤和基于内容的,同时也发展出了其他类型的组合,下面简单进行介绍.

4.1独就系统相互结合的推荐系统

建立混合推荐系统的方法之一即是独立地应用协同过滤,基于内容和基于网络结构的算法进行推荐.然后将两种或多种系统的推荐结果结合起来,利用预测打分的线性组合进行推荐¨7’68|.又或者,只推荐某一时刻在某一个评价指标下表现更好的算法的结果.例如,DailyLearner系统【】61就选择在某一时刻更可信的结果进行推荐.而文献[-71]选择一个与用户过去的打分相一致的结果进行推荐.

岛5反与萋毒焉专(18)4.2在协同过滤系统中加入基于内容的算法

数值结果显示当卢=1.9的时候算法的准确度还可以再提高11.2%.刘润然等m1利用用户和产品的度信息提出了另外的用户相似度计算方法,也得到了比经典的协同过滤算法更好的结果.这再次验证了产品的度信息确实影响着推荐的准确度,降低大度节

包括FabL441在内的一些混合推荐系统都是基于内容的协同过滤算法。即利用用户的配置文件进行传统的协同过滤计算.用户的相似度通过基于内容的配置文件计算而得,而非共同打过分的产品的信息[6引.这样可以克服协同过滤系统中的稀疏性问题.这个方法的另一个好处就是不仅仅当产品被配

万方数据

10

自.笼科誊连展第19卷第1期2009年1月

置文件相似的用户打了分才能被推荐,如果产品与用户的配置文件很相似也会被直接推荐L431.Good等【72j用不同过滤器(filterbots)的变化给出了一个相似性计算方法,应用一种特殊的内容分析代理作为协同过滤的一个补充.Melville等"31利用基于文本分析的方法在协同过滤系统中用户的打分向量上增加一个附加打分.附加分高的用户的信息优先推荐给其他用户.Yoshii等∽刈利用协同过滤算法和音频分析技术进行音乐推荐.Girardi和Marinho¨副把领域本体(domainontology)技术加入协同过滤系统中进行web推荐.另外,把内容分析结合到基于网络的推荐算法中,也是大有可为的.例如大量的网站都通过标签(tags)和关键词(keywords),因此研究如何把标签176]或关键词[77]之间的关联关系与基于网络的推荐算法结合起来是很有意义的.

4.3其他混合推荐系统研究进展

Basu等¨6]以基于内容和协同过滤算法为工具建立(用户,电影>二维关联关系,其中用户数组利用协同过滤算法收集了共同喜欢某些电影的用户信息,而电影数组包括了这些电影共有的类型或流派特征.把用户与电影的关系分类为喜欢和不喜欢.通过这种分类,预测新用户对不同类型电影的喜好与否.Popescul等[78]和Sehein等【6列基于概率浅层语义分析提出了一个结合基于内容和协同过滤算法的统一概率方法.该方法把用户感兴趣的信息通过浅层语义分析表示成一些主题,利用全概率公式对用户的感兴趣主题进行预测.实验证明,这种基于概率的方法对稀疏数据非常地有效.Condliff等"妇提出Bayes混合效用回归模型对未知产品进行估计和预测.模型综合考虑用户的打分信息,用户和产品的配置文件.建立用户模型之后,利用回归分析,研究用户对某个产品特性的喜好程度,进而把具有这些特性的产品推荐给用户.Christakou等[s03构建了基于神经网络的混合推荐系统.还有一些混合推荐系统利用基于知识(knowledge.based)的方法进行推荐[77,81,82J,例如基于事例推理的推荐系统.为了增加推荐准确性,Entr6e系统[8¨利用事例的领域知识,给饭店的客户推荐菜肴和食品,包括推荐其他饭店.Quiekstep和Foxtrot系统¨纠利用主体本体信息给用户推荐在线科技论文.Velasquez等∞33提出基于知识的Web推荐系统.系统首先抽取Web的内容信息,利用用户浏览行为建立用户浏览规则,对用户下一步感兴趣的内容进行推荐.在根据用户的反馈信息,进行规则的修正.Aciar等(8叫利用文本挖掘技术分析用户对产品的评论信息,提出基于知识和协同过滤的混合推荐系统.Felfernig等【8川提出基于知识的自动问答系统CWAdvisor.系统通过与用户的对话中自动抽取用户感兴趣的内容,把具有相关特性的产品推荐给用户.Mirzadeh等[86】利用交互式咨询管理进行个性化推荐.Wang等[873构建了基于虚拟研究群体的知识推荐系统,利用基于内容和协同过滤推荐算法向用户推荐显性知识(有用的期刊文件)和隐性知识(可以讨论问题的领域专家).基于知识的系统的主要缺点就是需要知识获取——这正是许多人工智能应用中最让人头痛的瓶颈.然而,基于知识的系统已经在一些领域得到了很好的发展.这螳领域的领域知识可以从结构化的机器读取格式中获取,例如XML格式和本体.

5其他推荐算法

除了上文介绍的几类推荐算法,实际系统中还存在其他推荐算法.首先是关联规则分析.关联规则关注用户行为的关联模式,例如,购买香烟的人大都会购买打火机,因此可以在香烟和打火机之间建立关联关系.通过这种关联关系向用户推荐其他产品.Agrawal等№8’8叫提出Apriori算法进行关联规则分析,Han等[903提出FP—Growth算法大大改进了Apriori算法的运行效率.另外值得关注的是基于社会网络分析的推荐算法.Wand等【9¨利用社会网络分析方法推荐在线拍卖系统中可信赖的拍卖者.Moon等凹z]利用用户的购买行为建立用户对产品的偏好相似性,并依此向用户推荐产品并预测产品的出售情况,从而增加用户的黏着性.最近,任捷等[9纠发现,只要预测用户评分的算法可以写成一个矩阵算符,就能够将原始算法改进为一种自适应迭代收敛的形式,从而明显提高算法的精确性.表1列出了不同领域投入应用的主要的推荐系统.

6结束语与展望

最近几年,随着互联网的高速发展,我们身处的信息世界的组织和结构有了很大的变化.首先,

万方数据

自燕科荸连展第19卷第1期2009年1月

信息量的爆炸性增长使得一个普通用户搜寻自己感兴趣内容的难度和成本都提高了很多;其次,大量的信息被安静地放在网络的旮角,因为访问量小,因此不为人知.这些“暗信息”中或许有一些是用户感兴趣的,但是没有外界的帮助,普通用户根本无法找到它们.随着web2.0技术的发展,很多服务型网站可以保留用户的历史记录,这些记录包括选择、评价、购买等等,通过这峰记录,采用合适的推荐算法,可以在一定的准确程度上猜测用户喜好,并据此向用户推荐.这些推荐不仅节省了用户浏览搜索的时间,更为关键的是,没有这些推荐,有螳信息用户根本就不可能找到.

我们说对推荐系统的研究,既有重大的社会价值,又有重大的经济意义,就是指它既能作为信息过滤的工具帮助用户更好地利用互联网信息,又能作为网站营销的武器,提高网站的用户黏着度和推广相关产品或服务∽引.同时,对推荐系统的研究,也有助于解决现代信息科学的中心问题之一:如何从具有极强噪音的稀疏关联矩阵中挖掘有用的信息.事实上,早在20世纪70年代,就已经出现了相关的研究和应用——协同过滤算法的雏形便已开始形成.到了90年代,推荐系统的理论框架就已经比较成熟了[1’3].遗憾的是,那个时候真正利用推荐算法进行商业化运营的网站并不是太多,可以用于研究的真实数据也比较缺乏,总体上发展比较缓慢,也没有得到信息科学以外的其他学科的关注.如今,随着推荐系统科学价值和使用价值的l丌】现,对于推荐算法的研究受到了包括数学、物理、管理科学等多学科的关注.

表1主要推荐系统表

领域网站

电子商务A.maz.on.co[n,。B.ay.,L。”i8,ski一。“。。p。?。。“,

dangdang.com?(10uban.corn

网页标签BFaubild,edre,l。Qiuciiock.sutsep,sesamr.c。m'Fox‘加‘’Q“Ic?P。。f一新闻GroupI,ens,PHOAKS

电影MovieLens,Moviefinder.corn

音乐Pandora,Ringo.CDNOW

本文简单介绍了4类基于不同推荐算法的推荐系统.虽然这些推荐系统都已经投入应用,并且取得了可观的经济效益,然而,这些系统都面临着许多问题,需要从理论和应用角度进行深入的研究.(1)协同过滤推荐系统面临新用户,新产品,打分稀疏性和算法可扩展性等问题.协同过滤推荐系统必须从用户已经打分的产品中获得用户的偏好信息,进而计算用户之间的相似度.当一个新用户加入系统的时候,没有选择过任何产品,这样系统就无法给新用户提供准确的推荐服务;新的产品地加入到推荐系统中,由于协同过滤系统完全靠用户已有的选择信息进行推荐,因此,直到新的产品被一部分用户打分,系统才可能推荐它.已经有很多方法研究冷启动问题,例如Lee等【26j利用伪打分信息,Ahn等H列利用启发式算法度量用户之间的相似性,解决冷启动问题;在任何推荐系统中,已经打分的产品通常比起需要推荐的产品的数量要少很多.从这些少数的例子中进行准确推荐就尤为重要.Huang等¨80利用辅助信息获取和信息扩散方法解决打分稀疏性问题,实验结果表明3种扩散方法在准确性,召【璺1率,F—measure等方面都比经典的协同过滤推荐算法要好.解决打分稀疏性问题的另外一个方法就是在计算用户相似度的时候用到用户的配置文件,而不仅仅考虑对产品的打分信息;协同过滤推荐算法能及时利用最新的信息为用户产生相对准确的推荐,但是面对日益增多的用户,数据量的急剧增加,算法的扩展性问题(即适应系统规模不断扩大的问题)成为制约系统实现的重要冈素.虽然与基于模型的算法相比,协同过滤算法节约了为建立模型而花费的训练时间,但是用于识别“最近邻居”算法的计算量随着用户和项的增加而大大增加,对于拥有上百万用户的系统,通常的算法会遇到严重的扩展性瓶颈问题.该问题直接影响着基于协同过滤的推荐系统的实时性和准确性.目前,也有这方面的研究工作.例如,Russell和Yoon[961利用DWT转换方法,提高了基于记忆的协同过滤算法的可扩展性.基于模型的算法虽然可以在一定程度上解决算法的可扩展性问题,但是该类算法往往比较适于用户的兴趣爱好比较稳定的情况,因为它要考虑用户模型的学习过程以及模型的更新过程,对于最新信息的利用比协同过滤算法要差些.(2)基于内容的推荐系统受到信息获取技术,专业化程度过高等因素的制约.在基于内容的推荐系统中,用户或产品特征集的内容都必须能被计算

万方数据

12

自显科乎建展第19卷第1期2009年1月

机自动抽取出来,因此该类算法受到信息获取技术的严重制约.例如多媒体数据(图形、视频流、声音流等)在特征自动提取上就存在很大困难.内容分析的另外一个问题是,如果两个不同的产品恰巧用相同的特征词表示,这两个产品就无法区分.这就需要加入本体(Ontology)和潜层语义分析(LatentSemanticAnalysis)等丁具来解决这类问题.另外,如果一个系统只推荐与用户的配置文件高度相关的产品,那么推荐给用户的产品只能是与他之前购买过的产品非常相似的产品,推荐的多样性很难保证.(3)基于网络结构的推荐算法受到新用户、新产品等问题的制约.利用网络结构的推荐算法的根本是要建立用户一产品二部图关联网络.新用户或新产品刚进入系统时没有任何选择或被选信息,系统无法与其他用户或产品建立关联网络,因此也无法启动基于网络结构的推荐算法.如果考虑新用户或产品的配置文件,可以在一定程度上解决新用户或新产品问题.同时关联网络的建立还受到用户选择关系建立时间的影响.如果把用户与产品的所有关联关系都考虑在内,就无法区分用户的长期兴趣点和短期兴趣点.过多地考虑长期兴趣点会使得系统无法给出满足用户短期兴趣的产品,从而使得推荐的准确度大大降低.如何在基于网络的推荐中加入历史时间的影响,是一个值得关注的问题.除了上述讨论之外,目前所有的推荐系统都面临着一些具有共性的问题.这螳问题的解决可以从根本上极大地促进推荐系统的研究与应用.例如,用户和产品的信息是动态改变的(新用户的加入,新产品的加入,用户选择或评价已经存在的产品……),如果每次改变都需要完全重新计算,这个计算量是巨大的,比较可行的方案是设计某种近似的动态算法,每次都只是局部改变原来的算法结果,而不需要完全的重新的计算.关于这方面算法的研究,现在基本上还是空白.另外,现在已经有很多评价指标被提出来对现有的推荐系统结果进行评判.例如准确率,召回率,F-measure,entropy,平均打分值,产品平均度,差异性等.不同应用背景的系统在不同的评价指标下表现出来的效果是不同的,不同数据集的结果也不尽一样.针对不同的推荐系统,如何选择合适的评价指标对推荐效果进行评判是推荐系统研究的重要问题.

参考文献

1ResnickP,lakovouN,SushakM,eta1.GroupLens:Anopenarchitectureforcollaborativefilteringofnetnews.Procl994ComputerSupportedCooperativeWorkConf。ChapelHill,1994:175—186

2HillW.SteadI,.RosensteinM,eta1.Recommendingandeval—uatingchoicesinavirtualcommunityofuse.ProcConfHuman

Factorsin

ComputingSystems.Denver,1995:194—201

3梅田望犬.网络巨变元年一你必须参加的大未来.先觉:先觉出版社,2006

4AdomaviciusG,TuzhilinA.Expert—drivenvalidationofRule-BasedUserModelsinpersonalizationapplications.DataMiningandKnowledgeDiscovery,2001,5(1—2):33—58

5AdomaviciusG,TuzhilinA.Towardthenextgenerationofrecommendersystems:Asurveyofthestate-of?the-artandpossi—hieextensions.IEEETransonKnowledgeandDataEngineer—ing,2005,17(6):734—749

6RichE.Usermodelingviastereotypes.CognitiveScience,1979,3(4):329—354

7GoldbergD,NicholsD。OkiBM,eta1.Usingcollaborativefihe—ringtOweaveaninformationtapestry.CommACM,1992,35(12):61—70

8KonstanJA,MillerBN,MahzD,eta1.GroupLens:Applyingcollaborativefilteringtousenetnews.CommACM。1997.40(3):77—87

9ShardanandU,MaesP.Socialinformationfiltering:Algorithmsforautomating‘WordofMouth’.ProeConfHumanFactorsinComputingSystemsDenver,1995:2lO一217

10LindenG,SmithB,YorkJ.Amazon.cornrecommendations:Item—to-itemcollaborativefiltering.IEEEInternetComputing。

2003,7(1):76—80

11GoldbergK,RoederT,GuptaD,eta1.Eigentaste:Aconstanttimecollaborativefilteringalgorithm.InformationRetrievalJ,2001,4(2):133—151

12TerveenL,HillW,AmentoB,eta1.PHOAKS:Asystemforsharingrecommendations.CommACM,1997,40(3):59—62

13BreeseJS,HeekermanD,KadieC.Empiricalanalysisofpredie-tivealgorithmsforcollaborativefiltering.Proc14th

ConfUncertaintyinArtificialIntelligenceMadison,1998:43—52

14DelgadoJ,lshiiN.Memory-basedweighted—majoritypredictionforrecommendersystems.ProcACMSIGIR’99WorkshopRec-ommenderSystems:AlgorithmsandEvaluation,1999

l5NakamuraA,AbeN.Collaborativefilteringusingweightedma—joritypredictionalgorithms.Proc15thInt’IConfMachineLearningMadison,l998:395—403

16BillsusD,PazzaniM.Usermodelingforadaptivenewsaccess.UserModelingandUser—AdaptedInteraction,2000,l0(2--3):

万方数据

自监科荸盈展第19卷第1期2009年1月

147—180

17GetoorI。,SahamiM.Usingprobahilisticrelationalmodelsforcollaborativefiltering.ProcWorkshopWebUsageAnalysisandUserProfiling。SanDiego,1999

18HofmannT.Collaborativefilteringviagaussianprobabilistielatentsemanticanalysis.Proe26thAnnInt’IACMSI(;IRConf.Toronto,2003:259--266

l9MarlinB.Modelinguserratingprofilesforcollaborativefilte—ring.Proc17thAnnConfNeuralInformationProcessingSys-terns。2003

20PavlovD,PennockD.Amaximumentropyapproachtocollabo-rativefilteringindynamic,sparse,high—dimensionaldomains.Proc16thAnoConfNeuralInformationProcessingSystems,2002.(http://books.nips.cc/papers/f11es/nipsl5/AP06.pdf)

21CohenWW。SchapireRE,SingerY.Learningtoorderthings.JArtificialIntelligenceResearch,1999,10:243—270

22FreundY,lyerR,SchapireRE,eta1.Anefficientboostingalgorithmforcombiningpreferences.JournalofMachineLearn—ingResearch。2003,4:933969

23JinR.SiL.ZhaiC.Preference-basedgraphicmodelsforcollab—orativefiltering.Proc19thConf.UncertaintyinArtificialIntel—ligcnce(UAI2003),Acapulco。2003:329—336

24JinR,SiL.ZhaiC,eta1.Collaborativefilteringwithdecoupledmodelsforpreferencesandratings.Proe12thInt’1Conf.Infor—mationandKnowledgeManagement(C1KM2003)。NewOrle—ans,2003:309—316

25SarwarB,KarypisG,KonstanJ,eta1.Item—basedcollaborativefilteringrecommendationalgorithms.Proc10thInt’lWWWConf,HongKong,2001;1--5

26LeeTQ.ParkY.ParkYT.Atime-basedapproachtoeffectiverecommendersystemsusingimplicitfeedback.ExpertSystemswithApplications,2008,34(4):3055—3062

27ChenYL.ChengLC.Anovelcollaborativefiheringapproachforrecommendingrankeditems.ExpertSystemswithApplications,2008,34(4):2396--2405

28YangMH.GuZM.Personalizedrecommendationbasedonpar—tialsimilarityofinterests.AdvancedDataMiningandApplica—tionsProceedings,2006?4093:509—516

29AggarwalCC,WolfJL,WuKI。,eta1.Hortinghatchesanegg:Anewgraph—theoreticapproachtocollaborativefiltering.ProcFifthACMSIGKDDInt’lConf.KnowledgeDiscoveryandDataMining,SanDiego,1999:201—212

30DeshpandeM,KarypisG.Item—basedtop-Nrecommendational—gorithms.ACMTransInformationSystems,2004,22(1):143--177

31UngarLH。FosterDP.Clusteringmethodsforcollaborativefil—tering.ProeRecommenderSystems,Papersfrom1998

Work—shop,TechnicalReportWS-98一08,MenloPark?1998:84—8832ChienYH。GeorgeE1.ABayesianmodelforcollaborativefilte—ring.Proc.'SeventhIm’lWorkshopArtificialIntelligenceandStatistics。1999

33ShahiG,BrafmanR。HeekermanD,AnMDP—basedrecommen-dersystem.TheJournalofMachineLearningResearch.2005.6:1265—1295

34HofmannT.Latentsemanticmodelsforcollaborativefiltering.ACMTransInformationSystems,2004。22(1):89-115

35SiI。.JinR.Flexiblemixturemodelforcollaborativefiltering.ProceedingsoftheTwentiethInternationalConferenceonMa—chine1.earning(ICML.2003),WashingtonDC,2003

36KumarR。RaghavanP,RajagopalanS,eta1.Recommendationsystems:Aprobabilisticanalysis.JComputerandSystemSci—ences。2001。63(1):42—61

37YuK,XuX,TaoJ,eta1.Instanceselectiontechniquesformemory—basedcollaborativefiltering.ProcSecondSIAMInt’lConf.DataMining(SDM’02),2002

38ManouselisN,CostopoulouC.Experimentalanalysisofdesignchoicesinmultiattributeutilitycollaborativefiltering.Interna—tionalJournalofPatternRecognitionandArtificialIntelligence,2007,21(2):31l一331

39ChenYL,ChengLC,ChuangCN.Agrouprecommendationsystemwithconsiderationofinteractionsamonggroupmembers.ExpertSystemswithApplications,2008?34(3):2082—2090

40Baeza-YatesR,Ribeiro-NetoB.ModernInformationRetrieval.Addison—Wesley,WesleyPress.1999

41SahonG。AutomaticTextProcessing.Addison—Wesley?1989

42BelkinN。Croft13.Informationfilteringandinformationretrieval.CommACM,1992,35(12):29—37

43BalabanovicM,ShohamY.Fab:Content—based,collaborativerecommendation.CommACM,1997,40(3):66—72

44PazzaniM。BillsusD.Learningandrevisinguserprofiles:Thet-dentificationofinterestingWebsites.MachineLearning,1997?27:313—331

45MooneyRJ,BennettPN,RoyI。.Bookrecommendingusingtextcategorizationwithextractedinformation.ProcRecommenderSystemsPapersfroml998Workshop.TechnicalReportWS-98—08。1998

46ParkHS。YooJO,ChoSB,Acontext—awaremusicrecommen—dationsystemusingfuzzyBayesiannetworkswithutilitytheory.FuzzySystemsandKnowledgeDiscovery,Proceedings,2006,4223:970一979

47SomloG,HoweA.Adaptivelightweighttextfiltering.ProcLectureNotesinComputerSeience,2001,2189:319—329

48ZhangY,CallanJ,MinkaT.Noveltyandredundancydetectioninadaptivefiltering.Proe25thAnnInt’lACMSIGIRConfTampere,2002:81—88

49RobertsonS,WalkerS.Thresholdsettinginadaptivefiltering.

万方数据

14

自.鞋科予连展第19卷第1期2009年1月

JDocumentation,2000,56:312—331

50ZhangY,CallanJ.Maximumlikelihoodestimationforfilteringthresholds.Proc24thAnnInt’lACMSIGIRConf。NewOrleans,200l:294—-302

51ChangYI,ShenJH,ChenTI.Adatamining—basedmethodfortheincrementalupdateofsupportingpersonalizedinformationfil—tering.JournalofInformationScienceandEngineering?2008,24(1):129—142

52DegemmisM,LopsP,SemeraroG.Acontent—collaborativeFee-ommenderthatexploitsWordNet—baseduserprofilesforneigh_‘borhoodformation.UserModelingandUser—AdaptedInterac—tion,2007,17(3):217—255

53KazienkoP,AdamskiM.AdROSA—Adaptivepersonalizationofwebadvertising.InformationSciences,2007,177(“):2269—2295

54Ricci

F,NguyenQN.Acquiringandrevisingpreferencesinacri—tique-basedmobilerecommendersystem.IEEEIntelligentSys—tems,2007,22(3):2229

55MartinezL,P6rezLG,BarrancoM.Amuhigranularlinguisticcontent—basedrecommendationmodeI:Researcharticles.Inter-nationalJournalofIntelligentSystems,2007,22(5):41943456ZhouT,RenJ。MedoM,eta1.Bipartitenetworkprojectionandpersonalrecommendation.PhysRevE,2007,76:0461l5

57ZhouT,JiangLL,SuRQ,eta1.Effectofinitialconfigurationonnetwork—basedrecommendation.EurophysLett?2008,81:58004

58HuangZ.ChenH,ZengD.Applyingassociativeretrievaltech—niquestoalleviatethesparsityproblemincollaborativefiltering,IEEETransInformationSystems,2004,22(1):116—142

59HuangZ。ZengD。ChenH.Analyzingconsumer-productgraphs:Empiricalfindingsandapplicationsinrecommendersystems.ManagementScience。2007,53(7):1146—1164

60ZhangYC。BlattnerM.YuYK.Heatconductionprocessoncommunitynetworksasarecommendationmodel.PhysRevLett,2007,99:154301

61ZhangYC,MedoM,RenJ,eta1.Recommendationmodelbasedonopiniondiffusion.EurophysLett,2007,80:68003

62ZhouT,SuRQ,LiuRR,eta1.Ultraaccuratepersonalrecom—mendationviaeliminatingredundantcorrelations.arXiv:0805.4127

63KuscsikZ,ZhangYC,ZhouT.Improvedrecommendationalgo—rithmwithsimilaritythreshold.submittedtoPhysRevE

64LiuJG.WangBH.Aspreadingactivationapproachforcollabo—rativefiltering.arXiv:0712.3807

65LiuRR,JiaCX。ZhouT,eta1.PersonaIrecommendationviamodifiedcollaborativefiltering.arXiv:0801.1333

66BasuC,HirshH,CohenW.Recommendationasclassification:usingsocialandcontent—basedinformationinrecommendation.

Papersfrom1998Workshop.TechnicalReportW孓98—08,AAAIPress1998:714—720

67ClaypoolM,GokhaleA,MirandaT,eta1.Combiningcontent—basedandcollaborativefiltersinanonlinenewspaper.ProcACMSIGlR’99WorkshopRecommenderSystems:AlgorithmsandE—valuation,Berkeley1999

68PazzaniM.Aframeworkforcollaborative,content—based,anddemographicfiltering.ArtificialIntelligenceRev,l999,13(5—6):393408

69Schein

AI,PopesculA。UngarLH,et

a1.Methodsandmetricsforcold—startrecommendations.Proc25thAnnInt’lACMSIGIRConf,Tampere.2002:253—260

70SoboroffI.NicholasC.Combiningcontentandcollaborationintextfiltering.ProcInt’lJointConfArtificialIntelligence

Work—shop:MachineLearningforInformationFiltering,Aug.1999

71TranT,CohenR.Hybridrecommendersystemsforelectroniccommerce.Proc.Knowledge-BasedElectronicMarkets,PapersfromtheAAAIWorkshop.TechnicalReportWS-00—04。AAAIPress,MenIoPark,2000:78—83

72GoodN,SchaferJB,KonstanJA,eta1.Combiningcollabora—tivefilteringwithpersonalagentsforbetterrecommendations.ProcConfAmAssocArtificialIntelligence(AAAI一99),1999,439—446

73MelvilleP,MooneyRJ,NagarajanR.Content—boostedeollabo—rativefilteringforimprovedrecommendations.Proc18thNat’1

ConfArtificial

Intelligence,Edmonton,2002,187192

74YoshiiK.GOtOM,KomataniK,eta1.Anefficienthybridmusicrecommendersystemusinganincrementallytrainableprobabilis—ticgenerativemodel.IEEETransactionsonAudioSpeechandI,anguageProcessing,2008,16(2):435—447

75GirardiR。MarinhoI。B.AdomainmodelofWebrecommendersystemsbasedonusageminingandcollaborativefiltering.RequirementsEngineering,2007,12(1):2340

76CattutoC。LoretoV,PietroneroL.Semioticdynamicsandcol—laborativetagging.PNAS,2007,104(5):146l一1464

77

ZhangZ,LnL,I.iuJG,eta1.Empiricalanalysisonakcyword-basedsemanticsystem.arXiv:0801.4163

78PopesculA,UngarLH,PennockDH,eta1.Probabilisticmod—elsforunifiedcollaborativeandcontent—basedrecommendationinsparse-dataenvironments.Proc17thConfUncertaintyinArtifi—cialIntelligence,2001,437—444

79CondliffM,LewisD,MadiganD,eta1.Bayesianmixed—effectsmodelsforrecommendersystems.ProeACMSIGIR’99Work—shopRecommenderSystems:AlgorithmsandEvaluation,Aug.1999

80ChristakouC,VrettosS,StafylopatisA.Ahybridmovierecom—mendersystembasedonneuralnetworks.InternationalJourna}onArtificialIntelligenceTools,2007,16(5):771—792

万方数据

自监科乎遗屋第19卷第1期2009年1月

8182

8587

BurkeR?Knowledge_basedrecommendersystems.Encyclopedia

ofLibraryandInformationSystems,KentA。ed.,v01.69,Sup—

plement32,MarcelDekker,2000

MiddletonSE?ShadbohNR,deRoureDC.Ontological

user

profilinginrecommendersystems.ACMTransInformationSys—

terns,2004,22(1):5488

VelasquezJD,PaladeV.Buildingaknowledgebaseforimple—

mentingaweb-basedcomputerizedrecommendationsystem.

InternationalJournalonArtificialIntelligenceTools。2007。

16(5):793—828

AciarS,ZhangD,SimoffS,eta1.Informedrecommender:

Basingrecommendationsonconsumerproductreviews.IEEE

IntelligentSystems,2007,22(3):39—47

FelfernigA,FriedrichG,JannachD,eta1.Anintegratedenvi—

ronmentforthedevelopmentofknowledge-basedrecommender

applications.InternationalJournalofElectronicCommerce,

2006,II(2):11—34

MirzadehN,RicciF.Cooperativequeryrewritingfordecision

makingsupportandrecommendersystems.AppliedArtificial

Intelligence,2007,21(10):895--932

WangHC.ChangYL.PKR:Apersonalizedknowledgerecom-

mendationsystemforvirtualresearchcommunities.Journalof

ComputerInformationSystems,2007,48(1):3141

AgrawalR,ImielinskiT。SwamiA.Miningassociationrules

betweensetsofitemsinlargedatabases.Proceedingsofthe

ACMSIGMODConference

onManagementofData,1993:

207—216

89AgrawalR,SrikantRFastalgorithmsforminingassociationrnle¥o

In:Proc1994IntConfVeryLargeDatabases(VI.DB’94).

Santiago。1994。487—499

90HanJPeiJ,YinY,eta1.Miningfrequentpatternswithout

candidategeneration.DataMiningandKnowledge

Discovery,

2004,8153—87

91WandJC。ChiuCC.Recommendingtrustedonlineauctionsellers

usingsocialnetworkanalysis.ExpertSystemswithAppliea—

tions,2008,34(3):1666—1679

92MoonS。RussellGJ.Predictingproductpurchasefrominferred

customersimilarity:Anautologisticmodelapproach.Manage-

mentScience,2008,54(1):71—82

93RenJ,ZhouT,ZhangYC.Informationfilteringviaself-con—

sistentrefinement.EurophysLett,2008,80:68003

94SchaferJB,KonstanJA,RieldJ.E-commercerecommendation

applications.DataMiningandKnowledgeDiscovery,2001,

5(1—2):115—153

95AhnHJ.AnewsimilaritymeasureforcollaborativefilteringtO

alleviatethenew

usercold—startingproblem.Information

Sciences,2008,178(1):3751

96RussellS,YoonV.Applicationsofwaveletdatareductionina

recommendersystem.ExpertSystemswithApplication,2008,

34(4):2316

万方数据

个性化推荐系统的研究进展

作者:刘建国, 周涛, 汪秉宏

作者单位:刘建国,周涛(中国科学技术大学,近代物理系,理论物理研究所,合肥

,230026;Department,of,Physics,University,of,Fribourg,Switzerland,CH-1700), 汪秉

宏(中国科学技术大学,近代物理系,理论物理研究所,合肥,230026;上海系统科学研究院复杂

适应系统研究所,上海理工大学,上海,200093)

刊名:

自然科学进展

英文刊名:PROGRESS IN NATURAL SCIENCE

年,卷(期):2009,19(1)

引用次数:0次

参考文献(96条)

1.Resnick https://www.wendangku.net/doc/b76048827.html,kovou N.Sushak M GroupLens:An open architecture for collaborative filtering of nemews 1994

2.Hill W.Stead L.Rosenstein M Recommending and evaluating choices in a virtual community of use 1995

3.梅田望犬网络巨变元年--你必须参加的大未来 2006

4.Adomavicius G.Tuzhilin A Expert-driven validation of RuleBased User Models in persona]ization applications 2001(1-2)

5.Adomavicius G.Tnzbilin A Toward the next generation of recommender systems:A survey of the state-of-the-art and possible extensions 2005(6)

6.Rich E User modeling via stereotypes 1979(4)

7.Goldberg D.Nichols D.Oki BM Using collaborative filtering to weave an information tapestry

1992(12)

8.Konstan https://www.wendangku.net/doc/b76048827.html,ler BN.Maltz D GroupLens:Applying collaborative filtering to usenet news 1997(3)

9.Shardanand U.Maes P Social information filtering:Algorithms for automating 'Word of Mouth' 1995

10.Linden G.Smith B.York J https://www.wendangku.net/doc/b76048827.html, recommendations:Item-to-item collaborative filtering 2003(1)

11.Goldberg K.Roeder T.Gupta D Eigentaste:A constant time collaborative filtering algorithm 2001(2)

12.Terveen L.Hill W.Amento B PHOAKS:A system for sharing recommendations 1997(3)

13.Breese JS.Heekerman D.Kadie C Empirical analysis of predictive algorithms for collaborative filtering 1998

14.Delgado J.lshii N Memory-based weighted-majority prediction for recommender systems 1999

15.Nakamura A.Abe N Collaborative filtering using weighted majority prediction algorithms 1998

16.Billsus D.Pazzani M User modeling for adaptive news access 2000(2-3)

17.Getoor L.Sahami M Using probabilistic relational models for collaborative filtering 1999

18.Hofmann T Collaborative filtering via gaussian probabilistic latent semantic analysis 2003

19.Marlin B Modeling user rating profiles for collaborative filtering 2003

20.Pavlov D.Pennock D A maximum entropy approach to collaborative filtering in dynamic,sparse,high-dimensional domains 2002

21.Cohen WW.Schapire RE.Singer Y Learning to order things 1999

22.Freund Y.lyer R.Sebapire RE An efficient boosting algorithm for combining preferences 2003

23.Jin R.Si L.Zhai C Preference-based graphic models for collaborative filtering 2003

24.Jin R.Si L.Zhai C Collaborative filtering with decoupled models for preferences and ratings 2003

25.Sarwar B.Karypis G.Konstan J Item-based collaborative filtering recommendation algorithms 2001

26.Lee TQ.Park Y.Park YT A time-based approach to effective recommender systems using implicit feedback 2008(4)

27.Chen YL.Cheng LC A novel collaborative filtering approach for recommending ranked items 2008(4)

28.Yang MH.Gu ZM Personalized recommendation based on partial similarity of interests 2006

29.Aggarwal CC.Wolf JL.Wu KL Horting hatches an egg:A new graph-theoretic approach to collaborative filtering 1999

30.Deshpande M.Karypis G Item-based top-N recommendation algorithms 2004(1)

31.Ungar LH.Foster DP Clustering methods for collaborative filtering 1998

32.Chien YH.George El A Bayesian model for collaborative filtering 1999

33.Shani G.Brafman R.Heckerman D An MDP-based recommender system 2005

34.Hofmann T Latent semantic models for collaborative filtering 2004(1)

35.Si L.Jin R Flexible mixture model for collaborative filtering 2003

36.Kumar R.Raghavan P.Rajagopalan S Recommendation systems:A probabilistic analysis 2001(1)

37.Yu K.Xu X.Tao J Instance selection techniques for memory-based collaborative filtering 2002

38.Manouselis N.Costopoulou C Experimental analysis of design choices in multiattribute utility collaborative filtering 2007(2)

39.Chcn YL.Cheng LC.Chuang CN A group recommendation system with considcration of interactions among group members 2008(3)

40.Baeza-Yates R.Ribeiro-Neto B Modern Information Retrieval 1999

41.Salton G Automatic Text Processing 1989

42.Belkin N.Croft B Information filtering and information retrieval 1992(12)

43.Balabanovic M.Shoham Y Fab:Content-based,collaborative recommendation 1997(3)

44.Pazzani M.Billsus D Learning and revising user profiles:The identification of interesting Web sites 1997

45.Mooney RJ.Bennett PN.Roy L Book recommending using text categorization with extracted information 1998

46.Park HS.Yoo JO.Cho SB A context-aware music recommendation system using fuzzy Bayesian networks with utility theory 2006

47.Somlo G.Howe A Adaptive lightweight text filtering 2001

48.Zhang Y.Callan J.Minks T Novelty and redundancy detection in adaptive filtering 2002

49.Robertson S.Walker S Threshold setting in adaptive filtering 2000

50.Zhang Y.Callan J Maximum likelihood estimation for filtering thresholds 2001

51.Chang YI.Shen JH.Chen TI A data mining-based method for the incremental update of supporting personalized information filtering 2008(1)

52.Degemmis M.Lops P.Semeraro G A content-collaborative recommender that exploits WordNet-based user profiles for neighborhood formation 2007(3)

53.Kazienko P.Adamski M AdROSA-Adaptive personalization of web advertising 2007(11)

54.Ricci F.Nguyen QN Acquiring and revising preferences in a critique-based mobile recommender system 2007(3)

55.Martinez L.Pérez LG.Barranco M A multigranular linguistic content-based recommendation models Research articles 2007(5)

56.Zhou T.Ren J.Medo M Bipartite network projection and personal recommendation 2007

57.Zhou T.Jiang LL.Su RQ Effect of initial configuration on network-based recommendation 2008

58.Huang Z.Chen H.Zeng D Applying associative retrieval techniques to alleviate the sparsity problem in collaborative filtering 2004(1)

59.Huang Z.Zeng D.Chen H Analyzing consumer-product graphs:Empirical findings and applications in recommender systems 2007(7)

60.Zhang YC.Blattner M.Yu YK Heat conduction process on community networks as a recommendation model 2007

61.Zhang YC.Medo M.Ren J Recommendation model based on opinion diffusion 2007

62.Zhou T.Su RQ.Liu RR Ultra accurate personal recommendation via eliminating redundant correlations

63.Kuscsik Z.Zhang YC.Zhou T Improved recommendation algorithm with similarity threshold

64.Liu JG.Wang BH A spreading activation approach for collaborative filtering

65.Liu RR.Jia CX.Zhou T Personal recommendation via modified collaborative filtering

66.Basu C.Hirsh H.Cohen W Recommendation as classification:using social and content-based information in recommendation 1998

67.Claypool M.Gokhale A.Miranda T Combining contentbased and collaborative filters in an online newspaper 1999

68.Pazzani M A framework for collaborative,content-based,and demographic filtering 1999(5-6)

69.Schein AI.Popescul A.Ungar LH Methods and metrics for cold-start recommendations 2002

70.Soboroff I.Nicholas C Combining content and collaboration in text filtering 1999

71.Tran T.Cohen R Hybrid recommender systems for electronic commerce 2000

72.Good N.Schafer JB.Konstan JA Combining collaborative filtering with personal agents for better recommendations 1999

73.Melville P.Mooney RJ.Nagarajan R Content-boosted collaborative filtering for improved recommendations 2002

74.Yoshii K.Goto M.Komatani K An efficient hybrid music recommender system using an incrementally trainable probabilistic generative model 2008(2)

75.Girardi R.Marinho LB A domain model of Web recommender systems based on usage mining and collaborative filtering 2007(1)

76.Cattuto C.Loreto V.Pietronero L Semiotic dynamics and collaborative tagging 2007(5)

77.Zhang Z.Lü L.Liu JG Empirical analysis on a keywordbased semantic system

78.Popescul A.Ungar LH.Pennock DH Probabilistic models for unified collaborative and content-based recommendation in sparse-data environments 2001

79.Condliff M.Lewis D.Madigan D Bayesian mixed-effects models for recommender systems 1999

80.Christakou C.Vrettos S.Stafylopatis A A hybrid movie recommender system based on neural networks 2007(5)

81.Burke R Knowledge-based recommender systems 2000

82.Middleton SE.Shadbolt NR.de Roure DC Ontological user profiling in recommender systems 2004(1)

83.Velasquez JD.Palade V Building a knowledge base for implementing a web-based computerized recommendation system 2007(5)

84.Aciar S.Zhang D.Simoff S Informed recommender:Basing recommendations on consumer product reviews 2007(3)

85.Felfernig A.Friedrich G.Jannach D An integrated environment for the development of knowledge-based recommender applications 2006(2)

86.Mirzadeh N.Ricci F Cooperative query rewriting for decision making support and recommender systems 2007(10)

87.Wang HC.Chang YL PKR~A personalized knowledge recommendation system for virtual research communities 2007(1)

88.Agrawal R.Imielinski T.Swami A Mining association rules between sets of items in large databases 1993

89.Agrawal R.Silkant R Fast algorithms for mining association rules 1994

90.HanJ.PeiJ.Yin Y Mining frequent patterns without candidate generation 2004

91.Wand JC.Chiu CC Recommending trusted online auction sellers using social network analysis 2008(3)

92.Moon S.Russell GJ Predicting product purchase from inferred customer similarityz An autologistic model approach 2008(1)

93.Ren J.Zhou T.Zhang YC Information filtering via self-consistent refinement 2008

94.Schaier JB.Konstan JA.Rield J E-commerce recommendation applications 2001(1-2)

95.Ahn HJ A new similarity measure for collaborative filtering to alleviate the new user cold-starting problem 2008(1)

96.Russell S.Yoon V Applications of wavelet data reduction in a recommender system 2008(4)

相似文献(10条)

1.学位论文杨杰个性化推荐系统应用及研究2009

Internet为人们提供了极其丰富的信息资源,在这些海量、异构的Web信息资源中蕴含着具有巨大潜在价值的知识。但是,面对信息的汪洋大海,人们往往感到无所适从,-出现了所谓的“信息过载”和“信息迷向”的现象。根据用户访问项目的历史记录以及项目之间的相关信息可以构建用户的兴趣模型,从而凭借该用户兴趣模型对繁杂的信息进行过滤,并向用户推荐其可能感兴趣的项目,这就是个性化推荐系统所做的事情。事实上,推荐系统已经成为目前解决信息过载最有效的工具之一。针对个性化推荐系统存在的用户兴趣漂移问题,本文提出了基于网络稠密度的用户兴趣漂移检测方法,并利用该方法设计了包裹(wrapper)一般推荐系统的方法,该方法能在快速检测用户兴趣漂移的同时去除噪声用户对推荐系统的影响,提高推荐系统的精确度和稳定性。并以科技论文在线推荐系统为研究背景,设计了基于网络结构的快速论文推荐算法,并把该算法应用到中国科技论文在线的实际数据上

,实现了一个论文在推荐系统网站。主要工作如下: 1)提出了一种能够适用于推荐系统的基于项目相似网络结构的兴趣漂移快速检测算法。该算法根据用户已访问的项目构建相似网络,并以该网络的稠密度和连续度为依据去除噪声用户,同时依据稠密度的变化来检测兴趣漂移的发生与否和发生时刻。由于用户访问项目网络一般较小,计算量大大缩减,实现了在快速检测兴趣漂移的同时,避免了噪声用户数据对推荐系统稳定性的影响。

2)把基于用户访问项目网络稠密度的兴趣漂移检测算法应用到推荐系统,用以解决用户兴趣漂移对推荐系统性能影响的问题。为此,本文实现了基于内容和基于协同过滤两种基本的推荐算法。为验证本文兴趣漂移检测算法应用到推荐系统中的有效性,我们在MovieLens提供的用户对电影评分数据集上,引入模拟的用户兴趣漂移数据。实验结果表明,我们的兴趣漂移检测算法可以有效减少用户兴趣漂移对推荐系统带来的干扰,提高了推荐性能。

3)将推荐系统应用到教育部科技发展中心支持的科技论文共享网站的用户个性化服务项目中,完成推荐系统在中国科技论文在线网站数据上的实际应用。在该项目中,完成了用户行为记录、用户兴趣建模、和论文推荐三个模块,实现了基于论文关键词、基于论文分类和关键词、以及基于用户-论文网络结构的三种推荐方法。结果表明,三种方法能有效推荐用户感兴趣的论文。

2.会议论文林泽楠.朱岩个性化推荐及其研究方向概述2007

随着电子商务的不断发展,如何更好地了解用户需求以提供更令人满意的个性化服务变成了一个十分关键的问题,在此基础上电子商务个性化推荐系统就逐步发展起来。文章首先介绍了电子商务个性化推荐系统的概念和作用,然后讨论了个性化推荐系统的分类,并对当前最主要推荐策略的原理、应用进行了细致的描述,随后对这些推荐策略的优劣势进行了深入的分析,并进行相应的评价。在最后部分,文章对将来个性化推荐的研究方向进行了探讨,希望通过这样的探索能进一步推动个性化推荐的相关研究。

3.学位论文周强协同过滤算法在商品个性化推荐中的研究2006

随着互联网普及和电子商务发展,推荐系统逐渐成为电子商务的一个重要研究内容,越来越多地受到研究者的关注。目前几乎所有大型电子商务系统都不同程度地使用了各种形式的推荐系统。推荐系统是电子商务个性化服务的重要组成部分。它根据顾客以往购买情况推测将要进行的消费行为,模拟销售人员帮助其完成购买过程。而这种具备独特的、个性化服务网站将对客户产生浓厚吸引力。 电子商务个性化推荐系统中比较成熟的有协同过滤推荐系统,但其存在一些诸如冷开始、稀疏、实时性差等一些明显的缺陷,而且其他推荐系统也各有各的缺陷,到目前为止,还没有一种非常完美的推荐技术。怎样完善个性化推荐系统是电子商务一个重要研究课题,这方面的研究工作现在还处在较初级的阶段。 在基于用户的推荐算法和基于项目的推荐算法基础上考虑冷开始、稀疏、实时、奇异等问题提出一种组合推荐算法,将两种算法有机结合的这种算法可大大改善上述问题。先利用基于项目的推荐算法按照项目向量之间相似性程度把项目归类,然后借助相似的项目的评分预测新项目的评分值,最后在相似项目的范围内,使用基于用户的协同过滤推荐技术做出最终预测。 通过实验设计和结果分析说明了协同过滤组合推荐算法的效果。从实验数据的准备开始,在实验设计中设计评估标准和实验过程,并通过对实验结果的分析和比较得出确实的结论。

4.学位论文温会平基于项目类别相似性与用户多兴趣的个性化推荐算法的研究2008

随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。电子商务推荐系统直接与用户交互,模拟商店销售人员向用户提供商品推荐,帮助用户找到所需商品,从而顺利完成购买过程。在日趋激烈的竞争环境下,电子商务推荐系统能有效保留用户、防止用户流失,提高电子商务系统的销售。 电子商务推荐系统在理论和实践上都得到了很大发展,特别是推荐方法的研究是其核心部分,采用哪种推荐方法对于推荐系统的效果和效率至关重要。推荐方法包括:知识工程、基于内容的推荐方法、协同过滤推荐方法、混合推荐方法、数据挖掘方法。目前协同过滤方法是最成功的推荐方法。电子商务系统规模的日益扩大,协同过滤推荐方法也面临诸多挑战:推荐质量、扩展性、数据稀疏性、冷启动问题等等。本文对电子商务推荐系统中推荐算法设计进行了有益的探索和研究。本文的研究内容主要包括电子商务推荐算法推荐质量和“冷启动”研究。 本文的主要研究成果如下: 1.提出了一种基于项目类别属性的项目相似性计算方法,因为在大型电子商务系统中,用户评分数据极端稀疏,传统的相似性度量方法是在整个用户空间上度量项目之间的相似性,没有考虑项目所属类别对项目相似性的影响,因而计算结果不够准确,本文提出的类别相似性度量算法首先运用模糊聚类技术对用户进行聚类,将单个用户对项目的评分转化为用户相似群体对项目的评分,构造密集的用户模糊簇一项目的评分矩阵,并结合项目自身的类别属性特征对项目相似性计算的影响最终完成项目相似性的计算,将结果保存在数据库中,这一步可采用离线周期的进行,不会影响推荐系统的实时性,实验结果表明,项目类别属性对相似性准确度的计算有很大的影响。 2.对用户最近邻居的搜索方法进行了改进,首先采用新型的项目相似性计算方法,利用Item-Based协同过滤推荐算法,对目标用户未评分的项目进行初步预测评分,以降低数据的稀疏性,提高用户评分矩阵的数据密度;另外考虑到用户本身存在多兴趣的问题,因此在计算目标用户对目标项目的最终预测评分时,目标用户邻居用户的选择与待预测的项目的类别属性有关,即:改变传统的在整个项目空间上计算用户相似性,而是把项目空间缩小到待预测项目邻居集合的空间上来计算用户相似性,这样不仅提高了用户相似性计算的准确度,而且对整个项目空间进行了有效的降维,提高了算法的推荐精度,以提高用户最终预测评分的准确性。通过实验验证本文提出方法的正确性和有效性。

5.学位论文李姣燕基于协同过滤的个性化推荐系统研究2008

电子商务网站的迅速发展,为人们的生活提供了许多方便,尤其是当前风靡的购物网站,更是以其方便快捷赢得了众多的青睐。网站提供了丰富多样的商品,用户只需登陆网站,就可以在各式商品中自由地挑选自己喜爱的商品。然而面对琳琅满目、种类繁多的商品,用户往往眼花缭乱,无从选择。为了挑选自己喜爱的商品,用户不得不花费大量的时间去寻找。为了帮助顾客更快的找到感兴趣的商品,对顾客提供个性化服务,以达到提高顾客购买率和忠诚度的目的,各种基于不同推荐技术的电子商务个性化推荐系统应运而生,在电子商务的营销中取得了广泛和成功的运用。 本文对电子商务的个性化推荐系统进行了广泛的研究,详细描述了当前推荐系统的研究内容、结构、信息来源、推荐模式和推荐技术,以及当前电子商务个性化推荐系统面临的挑战。本文尤其深入研究了协同过滤推荐技术,通过对各种传统协同过滤算法进行了分析和比较,最后设计并实现了一个基于协同过滤技术的多模型、开放式的个性化推荐系统,能根据不同的用户提供不同的推荐方式。系统设计了两种改进的的协同过滤算法,一种基于用户个性化偏好的项目协同过滤算法,一种联合用户与项目的协同过滤算法,通过实验验证,这两种方法都比原同类方法效果有所改进。

6.期刊论文余力.刘鲁电子商务个性化推荐研究-计算机集成制造系统2004,10(10)

简要介绍了电子商务推荐系统的概念、作用及组成构件,给出了推荐技术分类标准,系统综述了协同过滤推荐、基于内容推荐、基于人口统计信息推荐、基于效用推荐、基于知识推荐和基于规则推荐等6种主要的推荐技术.对这些推荐技术的优缺点进行了比较,介绍了推荐评价技术.重点评述了电子商务个性化推荐领域中的研究热点问题,并分析了目前国内电子商务个性化推荐理论研究和应用现状,最后提出了电子商务个性化推荐领域所面临的挑战.

7.学位论文陈晓红面向电子商务的个性化推荐技术研究2007

随着Internet的迅速发展,电子商务蓬勃兴起。电子商务站点在为用户提供越来越多选择的同时,其结构也变得更加复杂,电子商务的发展面临了新的挑战:一方面,用户对站点提供的众多产品信息并非完全感兴趣,通常需要经过多次浏览才能找到满足自己需求的产品:另一方面,站点没有了解用户的个人需求,提供给用户的是千篇一律的界面,无法有效地提高其产品的吸引力,维护稳定的客户关系。向用户进行个性化的产品推荐是解决这个挑战的最有效的方法。协同过滤是目前在电子商务推荐系统中应用较为成功的个性化推荐技术。但是随着站点结构、内容的复杂度和用户人数的不断增加,协同过滤算法也遇到了数据稀疏性、冷启动等种种问题。 本课题针对传统协同过滤的不足,提出了一种结合用户日志聚类和协同过滤的个性化推荐技术。该技术充分挖掘用户的信息,结合用户隐性兴趣和显性兴趣,推荐结果更符合用户需求。首先基于用户浏览电子商务站点的日志信息,使用聚类算法将用户归类。然后,在协同过滤过程中,利用用户的潜在偏好代替用户显性评分,从而消除用户评分习惯的影响。最后,在用户日志聚类结果的基础上,使用基于用户的潜在偏好协同过滤,从而使得用户的数据稀疏性问题、冷启动问题得到缓解,提高了推荐的质量。在具体的研究过程中

,本论文所作的主要工作如下: (1)用户日志聚类。先将原始的用户Web日志进行数据预处理,根据需要将其转换成适合进行分析处理的有意义的数据,然后使用聚类算法把有相似浏览行为的用户聚成一类,为下文的最近邻寻找工作奠定基础。 (2)基于用户潜在偏好的协同过滤。为了避免用户评分习惯不一致,相似兴趣的用户可能会有不同的表面评分的问题,本论文将用户的表面评分转换成用户潜在偏好,计算用户的潜在偏好相似性,使得最近邻的形成更为准确。 (3)结合用户日志聚类和协同过滤的推荐技术。这种混合的推荐技术可以先离线的对用户进行了一次聚类,在进行协同过滤时能有效的降低用户稀疏性,提高推荐系统的推荐速度和质量。并且这种推荐技术还可以针对评分较少甚至没有评分的用户进行推荐,在一定程度上弥补了传统协同过滤算法无法解决冷启动问题的遗憾。 最后,本文进行了相关实验及分析,结果表明,本文提出的结合用户日志聚类和协同过滤的个性化推荐技术比较传统的推荐方法,能有效提高推荐的质量,更好的满足用户的需求。

8.期刊论文余力.刘鲁.李雪峰用户多兴趣下的个性化推荐算法研究-计算机集成制造系统2004,10(12)

电子商务个性化推荐成为客户关系管理的重要内容,协同过滤算法是应用最为广泛的个性化推荐技术,但传统的协同过滤推荐算法并不适合用户多兴趣情况下的个性化推荐.在分析原因的基础上,通过组合基于用户的协同过滤和基于项目的协同过滤算法,先求解目标项目的相似项目集,在目标项目的相似项目集上再采用基于用户的协同过滤算法.这种基于相似项目的邻居用户协同推荐方法,能很好地处理用户多兴趣下的个性化推荐问题,尤其当候选推荐项目的内容属性相差较大时,该方法性能更优.最后,用EachMovie数据库对算法进行了仿真实验,实验表明该算法准确率更高.

9.学位论文余力电子商务个性化推荐若干问题研究2004

随着INTERNET的迅速普及,电子商务必将蓬勃发展,电子商务的虚拟购物环境既为企业提供了新的发展机遇,但同时也提出许多新的要求和挑战,其中为用户提供个性化推荐服务越来越成为客户关系管理的重要内容.本文对电子商务环境下个性化推荐的若干问题进行了较为系统和详细的研究,全文共分三部分:第一篇为研究综述部分,系统综述了目前国内外在个性化推荐领域的理论研究和发展状况.第二篇为理论研究部分,主要研究了协同过滤和关联规则两种推荐方法,重点研究了协同过滤.在系统研究协同过滤基本算法的基础上,重点研究了基于排序偏好的协同过滤推荐,用户多兴趣下的协同过滤推荐,基于个性化推荐的客户智能;关联规则的研究工作着眼于如何生成最小关联规则集.第三篇为应用研究部分,在比较目前国内外电子商务网站推荐技术应

个性化推荐系统分析与设计

课程设计报告 课程名称系统分析设计与开发方法 课题名称个性化推荐系统的分析与设计 专业信息管理与信息系统 班级1002 学号201003110215 姓名黄天玲 指导教师唐志航 2014年元月4 日

一、设计内容与设计要求 1.设计内容: 见附录 2.设计要求: 1).设计正确,方案合理。 2).界面友好,使用方便。 3).建模语言精炼,结构清晰。 4).设计报告4000字以上,含建模语言说明,用户使用说明,UML建模图。 5).上机演示。 二、进度安排 第十七周星期四下午:课题讲解,查阅资料、系统分析 星期五上午:总体设计、详细设计 第十八周星期一:建模,上机调试、撰写课程设计报告 星期二下午:答辩 附: 课程设计报告装订顺序:封面、任务书、目录、正文、评分、附件(A4大小的图纸及程序清单)。 正文的格式:一级标题用3号黑体,二级标题用四号宋体加粗,正文用小四号宋体;行距为22。

设计课题:个性化推荐系统的分析与设计 一、问题描述: 对网络购物个性化推荐系统进行分析与设计,对购物流程进行分析,对购物中关键环节进行设计,实现对商品的录入、显示、修改、排序、保存、销售、售后服务以及客户管理等操作实现推荐结果准确性、推荐结果多样性、用户交互度、系统界面设计、系统交互设计、推荐透明度(推荐解释)。 二、功能要求: 1、用UML完成一个小型团购系统的分析、设计。 2、写出系统需求报告,说明系统的功能。 3、通过面向对象的分析和设计建立系统模型。 4、画出完整的用例图、类图、对象图、包图;及时序图、协作图、状态图、活动图;及组件图和配置图) 三、建模提示: 1、使用Enterprise Architect 8.0建模。 2、使用 Ration Rose 或StarUML建模。 四、其它 对该系统有兴趣的同学可以在实现上述基本功能后,完善系统的其它功能,特别是售后以及客户关系管理。

个性化音乐推荐系统设计与实现

个性化音乐推荐系统设计与实现 摘要 21世纪是信息化时代,随着信息技术和网络技术的发展,信息化已经渗透到人们日常生活的各个方面,与人们的日常生活早已建立了离不开的联系。对网络音乐服务来说,不管是音乐下载服务,或者是网络音乐电台服务,都需要用到优秀的内容推荐系统去辅助整个系统。个性化音乐推荐系统是目前最流行的应用方法之一。同时音乐成为重要的媒介与朋友交流文化,所以很多SNS应用当中将音乐服务添加到里面。 本系统采用SSH框架组合进行设计,基于Java Web技术,系统使用UML建模。本系统的功能模块主要包括:音乐上传、单曲管理、个人信息维护、收集歌曲信息、音乐检索以及系统推荐等。音乐上传利用JavaScript脚本定义了一个函数,单曲管理在action中定义一个方法,系统推荐是利用协同过滤算法来进行的。 整个系统主要实现了从用户注册和登录、检索音乐到收听音乐、评分音乐,个性化推荐的整个音乐系统,管理员可使用系统后台对音乐歌曲信息进行修改、会员信息修改、系统推荐等进行有效的管理。很大程度上提高了对音乐管理的效率,符合了广大用户们的基本需求。 关键词:SSH框架,音乐系统,协同过滤,MVC模式

DESIGN AND INPLEMENTATION OF PERSONALIZED MUSIC RECOMMENDATION SYSTEM Abstract The 21st century is the era of information, with the development of information technology and network technology, it has penetrated into every aspect of daily life, with people in daily life has been inextricably linked to the the Internet music service, whether it is music download service, or network music radio service, all need to use the excellent content recommendation system to support the whole system. Personalized music recommendation system is one of the most popular applications. At the same time music has become an important medium of communication with friends culture, so many SNS applications when the music services added to the inside. The system uses a combination of SSH framework design, based on Java Web technology,system used UML modeling. Site function modules include: Music upload, music management,personal information maintenance, collecting music information, music search and system recommend. The entire site is simple, user-friendly, flexible and practical. The main achievement of the user registration and login, retrieve music to listen to music, the whole comment is called online music listening processes, and system administrators can use the background information on the goods, membership information, message information, and effective management. Greatly improving the efficiency of music management, in line with the needs of customers. Keywords: SSH Framework,Music System,Collaborative Filtering,MVC Pattern

推荐系统调研报告及综述

推荐系统调研报告及综述 张永锋 清华大学计算机系人工智能研究所 zhangyf07@https://www.wendangku.net/doc/b76048827.html, 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

个性化推荐系统研究综述

个性化推荐系统研究综述 【摘要】个性化推荐系统不仅在社会经济中具有重要的应用价值,而且也是一个非常值得研究的科学问题。给出个性化推荐系统的定义,国内外研究现状,同时阐述了推荐系统的推荐算法。最后对个性化推系统做出总结与展望。 【关键词】推荐系统;推荐算法;个性化 1.个性化推荐系统 1.1个性化推荐系统的概论 推荐系统是一种特殊形式的信息过滤系统(Information Filtering),推荐系统通过分析用户的历史兴趣和偏好信息,可以在项目空间中确定用户现在和将来可能会喜欢的项目,进而主动向用户提供相应的项目推荐服务[1]。传统推荐系统认为推荐系统通过获得用户个人兴趣,根据推荐算法,并对用户进行产品推荐。事实上,推荐系统不仅局限于单向的信息传递,还可以同时实现面向终端客户和面向企业的双向信息传递。 一个完整的推荐系统由3个部分组成:收集用户信息的行为记录模块,分析用户喜好的模型分析模块和推荐算法模块,其中推荐算法模块是推荐系统中最为核心的部分。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。 1.2国内外研究现状 推荐系统的研宄开始于上世纪90年代初期,推荐系统大量借鉴了相关领域的研宄成果,在推荐系统的研宄中广泛应用了认知科学、近似理论、信息检索、预测理论、管理科学以及市场建模等多个领域的知识。随着互联网的普及和电子商务的发展,推荐系统逐渐成为电子商务IT技术的一个重要研究内容,得到了越来越多研究者的关注。ACM从1999年开始每年召开一次电子商务的研讨会,其中关于电子商务推荐系统的研究文章占据了很大比重。个性化推荐研究直到20世纪90年代才被作为一个独立的概念提出来。最近的迅猛发展,来源于Web210技术的成熟。有了这个技术,用户不再是被动的网页浏览者,而是成为主动参与者[2]。 个性化推荐系统的研究内容和研究方向主要包括:(1)推荐系统的推荐精度和实时性是一对矛盾的研究;(2)推荐质量研究,例如在客户评价数据的极端稀疏性使得推荐系统无法产生有效的推荐,推荐系统的推荐质量难以保证;(3)多种数据多种技术集成性研究;(4)数据挖掘技术在个性化推荐系统中的应用问题,基于Web挖掘的推荐系统得到了越来越多研究者的关注;(5)由于推荐系统需要分析用户购买习惯和兴趣爱好,涉及到用户隐私问题,如何在提供推荐服务的

个性化推荐系统的文献综述

个性化推荐系统在电子商务网站中的应用研究 一、引言 随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。 个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的消费倾向,为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。本文对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及个性化推荐系统能够为电子商务网站带来的价值。 二、个性化推荐系统概述 个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。 1995年3月,卡内基 梅隆大学的Robert Armstrong等人在美国人工智能协会首次提出了个性化导航系统Web-Watcher,斯坦福大学的Marko Balabanovic 等人在同一次会议上推出了个性化推荐系统LIRA。同年8月,麻省理工学院的

新闻个性化推荐系统

新闻个性化推荐系统(python) 关zhu并回复微信公众号:数据挖掘DW (ID:datadw )可获取源代码和数据集。 最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。 1.数据集 一共五个字段,以tab隔开。分别是user编号,news编号,时间编号,新闻标题,对应当前月份的日(3就是3号) 2.代码部分

先来看下演示图 (1)算法说明 举个例子简单说明下算法,其实也比较简单,不妥的地方希望大家指正。我们有如下一条数据 [plain]view plaincopy 1.5738936 100649879 1394550848 MH370航班假护照乘客身份查明(更新) 11 5738936这名用户在11号看了“MH370航班假护照乘客...”这条新闻。我们通过jieba找出11号的热点词如下。

[plain]view plaincopy 1.失联 311 三周年马方偷渡客隐形护照吉隆坡航班护照者 我们发现“航班”、“护照”这两个keywords出现在新闻里。于是我们就推荐5738936这名用户,11号出现“航班”、“护照”的其它新闻。同时我们对推荐集做了处理,比如说5738936浏览过的新闻不会出现,热度非常低的新闻不会出现等。 (2)使用方法 整个系统采用一键式启动,使用起来非常方便。首先建立一个test 文件夹,然后在test里新建三个文件夹,注意命名要和图中的统一,因为新闻是有时效的,每一天要去分开来计算,要存储每一天的内容做成文档。test文档如下图,就可以自动生成。 使用的时候,要先在Global_param.py中设置好test文件夹的路径参数。一切设置完毕,只要找到wordSplite_test包下面的main()函数,运行程序即可。

个性化推荐技术综述

个性化推荐技术综述 在互联网时代,各类信息层出不穷,用户往往面临着“信息过载”的困扰,难以在大量信息中找到有价值的信息。而个性化推荐则通过用户的兴趣特点和历史行为快速高效的为用户推荐用户感兴趣的信息或商品。通常情况下,根据推荐方式的不同,推荐技术大概可以分为以下几个类型: 1.协同过滤的推荐算法 协同过滤推荐算法由Goldberg、Nicols、Oki和Terry 在1992年提出,该算法应用在Tapestry系统。Breese 等人将协同过滤推荐技术分为两种类型,一种是基于内存的协同过滤方法,另一种是基于模型的协同过滤方法,各自常用的算法如图1所示。基于内存的协同推荐( memory-based collaborative filtering) 也称为启发式的协同推荐,主要直接利用用户的历史数据来提供预测结果。根据相似性度量的对象的不同,基于内存的协同过滤又分为User-based 协同过滤和Item-based协同过滤。User-based 协同过滤的基本原理是如果一些用户对一些物品评价的分数比较接近,那么通常情况下他们评价其它物品的分数也会很接近。那么我们要得到某个用户对物品的评分时,就可用和该用户评分相似的其他用户对目标物品的评分去估计。Item-based协同过滤的基本原理是如果一些物品的典型特征具有相似性,那么同一个用户对他们的评分是接近的。基于上述原则,如果我们得到用户对和目标物品相似的其它物品的评分时,那么我们就可以通过这些分数来逼近用户对目标物品的评分。基于模型(Model-based)的推荐算法是首先通过用户-项目评分矩阵训练得到一个决策模型,在为目标用户进行推荐时,利用该离线模型为用户进行预测产生推荐结果。大致理念就是通过机器学习算法,在数据中找出模式,并将用户与物品间的互动方式模式化。

个性化推荐算法概述与展望

Hans Journal of Data Mining 数据挖掘, 2019, 9(3), 81-87 Published Online July 2019 in Hans. https://www.wendangku.net/doc/b76048827.html,/journal/hjdm https://https://www.wendangku.net/doc/b76048827.html,/10.12677/hjdm.2019.93010 Overview and Prospect of Personalized Recommendation Algorithm Xinxin Li Dalian University of Foreign Languages, Dalian Liaoning Received: Jun. 19th, 2019; accepted: Jul. 2nd, 2019; published: Jul. 9th, 2019 Abstract In recent years, the word “information overload” frequently appears in people’s vision, it has be-come a hot word in the field of computer, and it is also an important problem that researchers ur-gently need to solve. In order to solve the problem of information overload, researchers in the field of computer constantly optimize the personalized recommendation algorithm, strive to re-duce the difficulty of information retrieval for users, to provide users with the best personalized recommendation results. This paper gives a brief overview of the personalized recommendation methods which are widely used and common. Combined with the experience of using personalized recommendation algorithm to generate results in daily life, the author puts forward expectations for the development of personalized recommendation algorithm in the future. Keywords Personalized Recommendation, Collaborative Filtering, Hybrid Recommendation 个性化推荐算法概述与展望 李鑫欣 大连外国语大学,辽宁大连 收稿日期:2019年6月19日;录用日期:2019年7月2日;发布日期:2019年7月9日 摘要 近年来,“信息过载”一词频繁出现在人们的视野中,它成为了计算机相关领域中的热门词汇,同时它也是研究人员急待解决的重要问题。为解决信息超载的问题,计算机领域研究人员不断优化个性化推荐

个性化推荐知识汇总

一 基于协同过滤(collaborative filtering,CF)的推荐系统通过收集来自其他相似用户或项目的评价信息,自动预测当前用户的兴趣偏好。协同过滤的基本假设是用户会更喜欢那些相似用户偏爱的商品,已被广泛应用在一些大型的商业系统,如亚马逊和阿里巴巴等。 目前,协同过滤算法主要包括基于内存的、基于模型的以及二者相混合的推荐技术”。使用最多的模型是k最近邻(k-nearest neighbor,kNN)协同过滤技术,包括基于用户推荐和基于项目推荐两种技术。 一般说来,本体描述了某个应用领域的概念和概念之间的关系,使得它们具有唯一确定的含义,获得该领域的相关知识,提供对该领域知识的共同理解,便于用户和计算机之间进行交流。 OntoECRec推荐模型 二 1995年,卡内基·梅隆大学的A.RDben等人在美国人工智能协会上提出了个性化导航系统we-watcher,真正标志着个性化服务的开始;1997年3月,(communications of the AcM)。组织了个性化推荐系统的专题报道,标志着个性化服务已经被技术界高度重视;1999年,德国Dresden技术大学的J.Tania 实现了个性化电子商务原型系统TELLIM,标志着个性化服务开始向全球发展;2000年,NEc研究院的D.B.Kurt等人为搜索引擎atesecr增加了个性化推荐功能,实现citeseer的个性化。2001年,纽约大学的GediminaS Adomavicius 和Alexander Tuzhilin实现了个性化电子商务网站的用户建模系统1:1Pro。 个性化推荐服务体系结构中,信息收集模块是个性化服务系统的基础模块。用户的信息包括了用户的个人基本资料、购买的历史记录及浏览记录等。个人基本资料可以从用户注册表单中获得;购买的历史记录主要存放于电子商务网站的后台交易数据库中,包含了每位用户以前历次购物的详细情况记录,如购物时间、商品清单、价格、折扣等,同时也可以收集用户放入购物篮而未购买的商品记录,以及用户过去浏览过的商品信息等。当然要搜集用户的行为信息,日志文件是必不可少的,如要收集服务器日志,则要在服务器端获取,抽取出特定用户的访问记录;如要收集用户浏览的页面和浏览行为,则既可以在用户端获得,也可以在服务器端从用户记录中获得。

个性化推荐系统

个性化推荐系统软件说明书 一.软件背景 随着近年来互联网的飞速发展,个性化推荐已成为各大主流网站的一项必不可少服务。提供各类新闻的门户网站是互联网上的传统服务,但是与当今蓬勃发展的电子商务网站相比,新闻的个性化推荐服务水平仍存在较大差距。一个互联网用户可能不会在线购物,但是绝大部分的互联网用户都会在线阅读新闻。因此资讯类网站的用户覆盖面更广,如果能够更好的挖掘用户的潜在兴趣并进行相应的新闻推荐,就能够产生更大的社会和经济价值。 初步研究发现,同一个用户浏览的不同新闻的内容之间会存在一定的相似性和关联,物理世界完全不相关的用户也有可能拥有类似的新闻浏览兴趣。此外,用户浏览新闻的兴趣也会随着时间变化,这给推荐系统带来了新的机会和挑战。因此,希望通过对带有时间标记的用户浏览行为和新闻文本内容进行分析,挖掘用户的新闻浏览模式和变化规律,设计及时准确的推荐系统预测用户未来可能感兴趣的新闻。 本软件就是用来实现根据用户数据,分析用户行为,为用户进行个性化推荐等功能. 二.软件环境 运行环境Windows XP/7/8 编译环境VS2010 三.运行参数 News_list:新闻列表 News_times:x新闻阅读次数 Step_correlation:一步转移数据 User_list:用户列表 Train_data:原始数据 附加数据:用户适应度 四.算法说明

人们常把事物的随机变化过程称作马尔可夫过程。它具有无后效性,即事物的将来呈什么状态、取什么值,仅与它现在的状态和取值有关,与它以前的状态和取值无关。马尔可夫链则是事物在连续一段时期内若干马尔可夫过程的总称,表明事物状态由过去到现在、由现在到将来,一环接一环,像一根链条。在预测领域,人们用其对预测对象各个状态的初始分布和各状态间的转移概率进行研究,描述状态的变化趋势,并由此来预测未来。由于新闻网页推荐方式的不同,可能导致链长不同的马尔科夫链的产生。其他不定因素诸如用户的浏览习惯也可能导致不同链长的马尔科夫链。 本软件使用了该思想,利用用户最后的阅读记录来进行推测。由于许多用户的新闻阅读数目有限,直接限制了链长的长度,所以我们从三阶马尔科夫链开始,作为尝试,但尝试后发现效果并没有提升,反而会出现因为条件过于苛刻而无法推荐的情况。 最终我们采取了一步马链的形式来作为推荐算法,流程图如下: 算法流程图

个性化推荐算法概述与展望

个性化推荐算法概述与展望 近年来,随着网络信息技术的不断发展与进步,网民数量激增,网络覆盖率日益增高。互联网行业发展迅速,购物、出行、医疗、教育等生产生活中的方方面面都有着“互联网+”的影子。在这个网络化、信息化的时代,网络技术已经在潜移默化地影响着、改变着人们的生活方式与思想观念。“信息过载”一词频繁出现在人们的视野中,它成为了计算机相关领域中的热门词汇,同时它也是研究人员急待解决的重要问题。 为解决信息超载的问题,计算机领域研究人员不断优化个性化推荐算法,力求降低用户的信息检索难度,为用户提供最优的个性化推荐结果。在汉斯出版社《数据挖掘》期刊中,有论文对于应用范围较广、较为常见的个性化推荐方法做出简要的概述,并结合日常生活中使用个性化推荐算法生成结果的经历,对未来个性化推荐算法的发展提出期望。 基于信息超载的情况,个性化推荐算法应运而生。个性化推荐系统通过挖掘用户在网络上留下的“信息足迹”,采集并分析用户的网络行为与消费偏好,根据不同的推荐算法将精准的、契合度高的内容推荐给用户。个性化推荐算法的产生与发展极大地便利了人们的生产与生活,对于用户而言,不用再为在海量的信息中检索需要的内容而苦恼,对于商家而言能够更好地分析用户行为,提高竞争力与实现经济效益的最大化增长。 个性化推荐方法分为协同过滤推荐、基于内容的推荐以及混合推荐。协同过滤推荐主要思想是通过现有的用户群以往的意见和行为,对当前用户最有可能感兴趣的物品进行预测。基于内容推荐是指通过掌握的物品特征的描述和描述了用户历史兴趣的记录,确定最能匹配用户喜爱的物品并推荐给用户。混合推荐算法来提高推荐结果的准确程度,是为克服协同过滤算法、基于内容算法等其他算法的局限性、提高个性化推荐结果的精准度,研究者将两种

基于内容的新闻推荐系统方案

基于内容的新闻推荐系统 一般在一个个性化推荐系统中,用户对已经看过的对象依据感兴趣程度进行评分,推荐系统根据用户对已查看对象的评分情况,预测用户对未查看对象的评分,并将用户未查看对象按照预测评分的高低排序,呈现给用户。 抽象地看,推荐系统是预测用户对未查看对象评分的系统。而推荐系统对未查看对象的评分方法即为推荐算法。而主要的推荐算法有三类:①、协同过滤的推荐方法、②、基于内容的推荐方法、③、混

合的推荐方法。 ①、协同过滤是利用集体智慧的一个典型方法。 协同过滤一般是在海量的用户中发掘出一小部分和你品位比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。 比如说,如果你现在想看个电影,但你不知道具体看哪部,你会怎么做?大部分的人会问问周围的朋友,看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得到推荐。这就是协同过滤的核心思想。 协同过滤相对于集体智慧而言,它从一定程度上保留了个体的特征,就是你的品位偏好,所以它更多可以作为个性化推荐的算法思想。 二、协同过滤的实现步骤: 1)、收集用户偏好 而要从用户的行为和偏好中发现规律,并基于此给予推荐,如何收集用户的偏好信息成为系统推荐效果最基础的决定因素。用户有很多方式向系统提供自己的偏好信息,而且 2)、找到相似的用户或物品 当已经对用户行为进行分析得到用户喜好后,我们可以根据用户喜好计算相似用户和物品,然后基于相似物品进行推荐,这就是最典型的CF 的分支之一——基于物品的CF。 3)、计算推荐——基于物品的CF 比如说,对于物品A,根据所有用户的历史偏好,喜欢物品A 的用户都喜欢物品C,

个性化推荐系统中的多样性综述

Software Engineering and Applications 软件工程与应用, 2019, 8(3), 172-178 Published Online June 2019 in Hans. https://www.wendangku.net/doc/b76048827.html,/journal/sea https://https://www.wendangku.net/doc/b76048827.html,/10.12677/sea.2019.83021 A Survey of Diversity in Personalized Recommendation Systems Shuhao Jiang1,2, Liyi Zhang1,2, Na Zhou1 1School of Electrical and Information Engineering, Tianjin University, Tianjin 2School of Information Engineering, Tianjin University of Commerce, Tianjin Received: June 6th, 2019; accepted: June 21st, 2019; published: June 28th, 2019 Abstract Diversity has become one of the main directions of recommendation system research. Improving the diversity of recommendation content is not only an important way to solve the problem of over-fitting, but also a way to improve user’s experience satisfaction. In order to elaborate the work in the field of recommendation diversity, this paper introduces diversity recommendation from three aspects: the definition and evaluation of diversity, the impact of diversity on recom-mendation quality and the development of diversity algorithm. Keywords Personalized Recommendation, Diversity, Recommendation Quality, Evaluation 个性化推荐系统中的多样性综述 姜书浩1,2,张立毅1,2,周娜1 1天津大学电气自动化与信息工程学院,天津 2天津商业大学信息工程学院,天津 收稿日期:2019年6月6日;录用日期:2019年6月21日;发布日期:2019年6月28日 摘要 多样性已成为推荐系统研究的主要方向之一,提高推荐内容的多样性不仅是解决过度拟合问题的重要方法,也是提高用户体验满意度的方法。为了更好地阐述推荐多样性领域的工作,本文分别从多样性的定义和评价、多样性对推荐质量的影响以及多样化算法本身的发展三个方面对多样性推荐进行了介绍。

基于内容的新闻推荐系统

基于内容的新闻推荐系统 项目课题基于内容的新闻推荐系统 功能描述网络媒体中,新闻资讯的数量以近乎爆炸的速度增长,使广大网络新闻的读者受到“信息过载”和“信息迷航”问题的困扰。个性化新闻推荐系统 可以通过分析用户使用习惯,识别用户兴趣点,将用户感兴趣的新闻资讯推 荐给用户,过滤他们不感兴趣的内容,而我所作的这个推荐推荐系统就是为 了有效地缓解上述问题。 基于内容的新闻推荐系统:它将计算得到并推荐给用户一些与该用户已选择过的项目相似的内容。例如,当你在网上看新闻时,你总是阅读与IT相关的 文章,那么基于内容的新闻推荐系统就会给你推荐一些热门的IT方面的文章。 方法描述基于内容的推荐(Content-based Recommendation)是建立在项目的内容信息上作出推荐的,而不需要依据用户对项目的评价意见,更多地需要用机器学 习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。 内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。 通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推 荐与其以前喜欢的产品相似的产品。 在基于内容的推荐系统中,项目或对象是通过相关的特征的属性来定义,系统基于用户评价对象的特征,学习用户的兴趣,考察用户资料与待预测项目 的相匹配程度。用户的资料模型取决于所用学习方法,常用的有决策树、神经 网络和基于向量的表示方法等。基于内容的用户资料是需要有用户的历史数据, 用户资料模型可能随着用户的偏好改变而发生变化。 要实现内容推荐系统总体来说要经过4个大的步骤: 1、搜集数据, 2、过滤数据, 3、分析数据,4 输出结果。 技术难点难点1:如何实现新闻正文的过滤下载。 难点2:如何对新闻进行量化,并提取出关键词,最后完成数学建模。 难点3:如何利用基于内容的推荐技术为每个用户建立用户模型。 难点4:如何用编程语言实现这些软件功能,这便是该软件设计过程中最最困 难的一个难题。 一般在一个个性化推荐系统中,用户对已经看过的对象依据感兴趣程度进行评分,推荐系统根据用户对已查看对象的评分情况,预测用户对未查看对象的评分,并将用户未查看对象按照预测评分的高低排序,呈现给用户。 抽象地看,推荐系统是预测用户对未查看对象评分的系统。而推荐系统对未查看对象的评分方法即为推荐算法。而主要的推荐算法有三类:①、协同过滤的推荐方法、②、基于内容的推荐方法、③、混合的推荐方法。

推荐系统调研报告及综述

推荐系统调研报告及综述 一、推荐系统概述 1.1 什么是推荐系统 推荐系统(Recommender System)的发展已经经历了近20年的时间,但是迄今为止仍没有人试图对推荐系统给出一个精确的定义。 广义上的推荐系统可以理解为是主动向用户推荐物品(Item)的系统,所推荐的物品可以是音乐、书籍、餐厅、活动、股票、数码产品、新闻条目等等,这依赖于具体的应用领域,推荐系统所推荐的物品或者对用户有帮助,或者用户可能感兴趣[1]。 随着电子商务规模的不断扩大,商品数量和种类不断增长,用户对于检索和推荐提出了更高的要求。由于不同用户在兴趣爱好、关注领域、个人经历等方面的不同,以满足不同用户的不同推荐需求为目的、不同人可以获得不同推荐为重要特征的个性化推荐系统(Personalized Recommender System)应运而生[1]。目前所说的推荐系统一般指个性化推荐系统。 1.2 推荐系统的发展历史 如果追根溯源,推荐系统的初端可以追溯到函数逼近理论、信息检索、预测理论等诸多学科中的一些延伸研究。 推荐系统成为一个相对独立的研究方向一般被认为始自1994年明尼苏达大学GroupLens研究组推出的GroupLens系统[2]。该系统有两大重要贡献:一是首次提出了基于协同过滤(Collaborative Filtering)来完成推荐任务的思想,二是为推荐问题建立了一个形式化的模型(见1.4)。基于该模型的协同过滤推荐引领了之后推荐系统在今后十几年的发展方向。 GroupLens所提出的推荐算法实际上就是目前人们时常提及的基于用户的协同过滤推荐算法(User-based Collaborative Filtering Algorithms),虽然论文本身并没有使用这样一个名字。在之后的十几年中,其它一些著名的协同过滤算法逐渐被提出,主要的有基于物品的协同过滤算法(Item-based Collaborative Filtering Algorithms)[3],基于矩阵分解的协同过滤算法(SVD-based/NMF-based, etc.)等等。当然,基于其它方法而非协同过滤的推荐算法也在不断地发展,这些方法之间的互补、融合也成为一个重要的研究方向,这些会在本文第二部分(推荐方法的分类)和第三部分(典型推荐算法概述及优缺点)中详细阐述。 目前,推荐算法已经已经被广泛集成到了很多商业应用系统中,比较著名的有Netflix在线视频推荐系统、Amazon网络购物商城等。实际上,大多数的电子商务平台尤其是网络购物平台,都不同程度地集成了推荐算法,如淘宝、京东商城等。Amazon发布的数据显示,亚马逊网络书城的推荐算法为亚马逊每年贡献近三十个百分点的创收。

个性化推荐系统的文献综述

个性化推荐系统的文献综述 个性化推荐系统在电子商务网站中的应用研究一、引言随着Internet的普及,信息爆炸时代接踵而至,海量的信息同时呈现,使用户难以从中发现自己感兴趣的部分,甚至也使得大量几乎无人问津的信息称为网络总的“暗信息”无法被一般用户获取。同样,随着电子商务迅猛发展,网站在为用户提供越来越多选择的同时,其结构也变得更加复杂,用户经常会迷失在大量的商品信息空间中,无法顺利找到自己需要的商品。个性化推荐,被认为是当前解决信息超载问题最有效的工具之一.推荐问题从根本上说就是从用户的角度出发,代替用户去评估其从未看过的产品,使用户不只是被动的网页浏览者,而成为主动参与者。准确、高效的推荐系统可以挖掘用户的偏好和需求,从而成为发现用户潜在的消费倾向,

为其提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手断,更重要的是可以增进用户的黏着性。对文献的综述包括个性化推荐系统的概述、常用的个性化推荐系统算法分析以及个性化推荐系统能够为电子商务网站带来的价值。 二、个性化推荐系统概述个性化推荐系统是指根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。它是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。1995年3月,卡内基?梅隆大学的Robert Armstrong等人在美国人工智能协会首次提出了个性化导航系统

用户浏览新闻的模式分析及个性化新闻推荐

天津财经大学 本科毕业论文 题目:用户浏览新闻的模式分析及个性化新闻推荐系统 院系名称:理工学院 专业班级:计科1101... 学号:2011110709 姓名:康磊... 指导教师:陈钒 年月日

内容摘要 正文要与“内容摘要”四字之间空一行。“关键词”三字为四号黑体,加粗左对齐。关键词最多不能超过5个,字号为四号,字体为楷体。关键词之间要用分号隔开,这部分与摘要内容部分之间空一行。中文的内容摘要与关键词在一页,不标页码。 关键词:写作规范;排版格式;学位论文

目录 摘要................................................................ 错误!未定义书签。目录................................................................ 错误!未定义书签。 一、绪论......................................................... 错误!未定义书签。 (一)研究背景和意义 ............................ 错误!未定义书签。 (二)国内外研究现状 ............................ 错误!未定义书签。 (三)主要研究内容................................ 错误!未定义书签。 (四)本文的组织结构 ............................ 错误!未定义书签。 二、相关技术概述......................................... 错误!未定义书签。 (一)用户模型....................................... 错误!未定义书签。 1.1 用户模型的形式......... 错误!未定义书签。(主题表示法) 1.2 用户模型的建模技术...................... 错误!未定义书签。 (二)个性化推荐技术 ............................ 错误!未定义书签。 2.1 协同过滤推荐技术 ......................... 错误!未定义书签。 2.2 基于内容的推荐技术...................... 错误!未定义书签。 2.3 混合推荐技术 ................................ 错误!未定义书签。 (三)数据挖掘技术................................ 错误!未定义书签。 (四)小结.............................................. 错误!未定义书签。 三、用户浏览行为分析与建模....................... 错误!未定义书签。 (一)基于时间浏览的行为分析................ 错误!未定义书签。 (二)基于标题浏览的行为分析................ 错误!未定义书签。

相关文档
相关文档 最新文档