SlideShare une entreprise Scribd logo
1  sur  62
Télécharger pour lire hors ligne
电子商务推荐系统入门
    出家如初,成佛有余
  http://www.yeeach.com




       2009年12月
目   录

电子商务推荐系统简介
电子商务推荐系统算法基础
电子商务推荐系统算法介绍
基于搜索引擎技术的推荐算法




           2
推荐系统简介-背景分析
随着电子商务的快速发展,电子商务系统中的信
息“超载”现象越来越严重,面对商品信息的
“海洋”,消费者很难快速有效地挑选出他所需
要的商品。在准确识别客户消费偏好的基础上,
电子商务推荐系统可以向客户提供商品信息和建
议,模拟销售人员帮助客户完成购买过程,从而
使客户避免信息“超载”所带来的麻烦 。




          3
                        2009-12-20
电子商务推荐系统定义
电子商务中的推荐系统(Recommendation Systems)
是利用统计学、人工智能数据挖掘等技术,分析
访问者在电子商务网站的访问行为,产生能帮助
访问顾客访问感兴趣的产品信息的推荐结果,引
导顾客的购买行为,从而产生可观的利润。
推荐结果的准确性是决定推荐系统成败的关键因
素,如果系统向客户推荐的商品是客户不需要的,
那么客户就会对推荐系统失去信心,把推荐信息
当作垃圾信息



               4
电子商务推荐系统作用
增加网站的访问量,提升销售额
增加单个商品被访问的机会
增加顾客在网店上的停留时间,浏览更多的商
品
帮助顾客发现他真正感兴趣的商品,提升购物
体验
将电子商务网站的浏览者转变为购买者
提高电子商务网站的交叉销售能力
提高客户对电子商务网站的忠诚度


          5
                       2009-12-20
成功的推荐系统应用标杆
 领域                                   推荐系统

电子商务    ama on com eba com 卓越(ama on cn) 当当(dangdang com)
        amazon.com,ebay.com,卓越(amazon.cn),当当(dangdang.com),
        淘宝(taobao.com),京东(360buy.com),新蛋(newegg.com.cn)
音乐 社区   潘多拉(pandora.com),last.fm,友播(yobo.com),cdnow.com,音乐
        八宝盒(8box.cn),slacker com iLike com Genius
        八宝盒(8box cn) slacker .com,iLike .com,Genius (iTunes)
图书/图片   豆瓣(douban.com),librarything.com,flickr.com,
社区
社会化媒体   del.icio.us,玩聚(ju690.com),techmeme.com,stumbleupon.com,
        reddit .com, dailyme.com
电影社区    tivo.com,netflix.com,flixster.com, moviefinder.com,movieLens,
        reel.com
其他      strands .com,likecube .com,inSuggest .com,collarity .com,baynote
        com,stylefeeder .com
                y




                                  6
电子商务推荐系统数据源
Historical Data、    Visitor Behavior       Product Details     Session States
历史数据                访问者行为                  产品细节                停留状态
Visitor’s Past      Clickstream            Products Viewed     Type of Web Page
Shopping Behavior   点击流                    浏览的产品               页面类型
访问者过去的购买                                   Location of Product Refer URL
行为                                         in Catalog          URL指向
                                           产品在目录中的位置
Aggregated Past     Searches               Brand               Broadband Speed
User’s Behavior     搜索                     品牌                  宽带速度
访问者过去购买行
为汇总                                        Manufacturer        IP Address
                                           厂商                  IP地址
Visitor’s Past      Duration of Page
Searches            View                   Descriptions
访问者过去的搜索            页面浏览停留的时               产品描述
                    间                      Ratings
Geography           Order of Page          产品排行
区域                  Views
                    页面浏览的顺序
                                       7
电子商务推荐系统数据源




        8
电子商务推荐系统输入数据1
客户输入(Targeted Customer Inputs)
– 隐式浏览输入(Implicit navigation):客户的浏览行为作为推
  隐式浏览输入( p           g     ):客户的浏览行为作为推
  荐系统的输入,但客户并不知道这一点
– 显式浏览输入(Explicit navigation) :客户的浏览行为是有目
  的向推荐系统提供自己的喜好
– 关键词和项目属性输入(Keywords and Item attributes):客户
  输入关键词或项目的有关属性以得到推荐系统有价值的推
  荐
– 用户购买历史(P h
  用户购买历史(Purchase hi
                   history):用户过去的购买纪录
                          ):用户过去的购买纪录




                     9
                                          2009-12-20
电子商务推荐系统输入2
社区输入(Community Inputs)
– 项目属性(Item Attribute):社团对商品风格和类别的集
  体评判
– 社团购买历史(Community Purchase History):社团过去
  的购买纪录
– 文本评价(Text Comments):其他客户对商品的文本评
         (            )
  价,计算机并不知道评价是好是坏
– 评分(Rating):其他客户对商品的评分,计算机可以对
  评分进行处理




                   10
                                        2009-12-20
电子商务推荐系统输出
建议(Suggestion)
– 单个建议(Single Item)
– 未排序建议列表(Unordered List)
– 排序建议列表(Ordered List)
预言(Prediction):系统对给定项目的总体评分
个体评分(Individual R i ):
个体评分(I di id l Rating):输出其他客户对商品的个体
评分
评论(Review):
评论(R i ):输出其他客户对商品的文本评价




                   11
                                  2009-12-20
电子商务推荐系统业务表现形式
Average Rating:推荐系统向客户提供其他客户对
相应产品的等级评价
Top-N:推荐系统根据客户的喜好向客户推荐最
可能吸引客户的N件产品
Ordered Search Results:推荐系统列出所有的搜索
结果,并将搜索结果按照客户的兴趣降序排列




                12
                                 2009-12-20
电子商务推荐系统业务表现形式
Browsing:客户提出对特定商品的查询要求,推
荐系统根据查询要求返回高质量的推荐
Similar Item:推荐系统根据客户购物篮中的商品
和客户可能感兴趣的商品推荐类似的商品
Email:推荐系统通过电子邮件的方式通知客户可
能感兴趣的商品信息
Text Comments:推荐系统向客户提供其他客户对
相应产品的评论信息




             13
                           2009-12-20
目   录

电子商务推荐系统简介
电子商务推荐系统算法基础
电子商务推荐系统算 介绍
电子商务推荐系统算法介绍
基于搜索引擎技术的推荐算法




           14
关联规则的基本概念
关联规则的目的在于在一个数据集中找出项之间
的关系,也称之为购物蓝分析 (market basket
analysis)。例如,经典的“尿布和啤酒”故事。
关联规则的应用场合。
– 在商业销售上,关联规则可用于交叉销售,以得到更
  大的收入;
– 在保险业务方面,如果出现了不常见的索赔要求组合,
  则可能为欺诈,需要作进一步的调查。
– 在医疗方面,可找出可能的治疗组合;
– 在银行方面,对顾客进行分析,可以推荐感兴趣的服
  务等等。



             15
关联规则的基本概念-支持度和置信度
支持度和置信度总是伴随着关联规则存在的,它
们是对关联规则的必要的补充。
– 例:在销售手机的商店中,70%的包含手机的交易中包
  含充电器;在所有交易中,有56%同时包含这两种物品。
  于是规则表示为手机=>充电器(support=56%,
  confidence= 70%)
– 其中的support=56%是说,在所有的销售中同时包含手
  机销售和充电器销售的概率。
– confidence=70%是说,所有销售中,在出现手机销售
  的情况下出现充电器销售的概率,即条件概率。




              16
关联规则的基本概念-支持度

支持度公式: pp ( ⇒ B)=P(A ∪ B)
       support(A ) (    )
支持度揭示了A和B同时出现的频率,如果A和B一
起出现的频率非常小,那么就说明了A和B之间的
联系并不大;但若一起出现的频率非常频繁,那
么A和B总是相关联。




            17
关联规则的基本概念-置信度

置信度公式: confidence(A ⇒ B)=P(B|A)
置信度揭示了A出现时,B是否一定会出现,如果
出现则其大概有多大的可能出现。如果置信度为
100%,则说明了A出现时,B一定出现。那么,对这
种情况而言,假设A和B是市场上的两种商品,就
没有理由不进行捆绑销售了。
如果置信度太低,那么说明A和B关系并不大.




              18
相关分析的基本概念
相关分析(correlation analysis)是研究现象
之间是否存在某种依存关系,并对具体有依存关
系的现象探讨其相关方向以及相关程度,是研究
随机变量之间的相关关系的一种统计方法。
线性相关分析:研究两个变量间线性关系的程度
。用相关系数r来描述。
– 正相关:如果x,y变化的方向一致,r>0。
  |r|>0.95 存在显著性相关; |r|≥0.8 高度相关;
  0.5≤|r|<0.8 中度相关; 0.3≤|r|<0.5 低度相关
  |r|<0.3 关系极弱,认为不相关
– 负相关:如果x,y变化的方向相反,如吸烟与肺功能的
  关系,r<0;
– 无线性相关:r=0。
                 19
向量相似性算法
余弦相似性(cosine-based similarity)                                            n

                                  r r
                                            r r
                                            uv                       ∑R             ui   Rvi
                 sim(u, v) = cos(u , v) = uu ur =
                                (          r                            i =1

                                          u×v                       n                    n


相关相似性(Pearson相关系数 )                                                ∑R ∑R
                                                                   i =1
                                                                               ui
                                                                                    2

                                                                                        i =1
                                                                                               vi
                                                                                                    2




                sim(u , v) =
                                     ∑      i∈I uv
                                                     ( Rui − Ru )( Rui − Rv )

                               ∑   i∈Iuv
                                           ( Rui − Ru ) 2      ∑   i∈Iuv
                                                                           ( Rvi − Rv ) 2


修正的余弦相似性(adjusted-cosine
similarity)
               sim(u, v) =
                                      ∑      i∈I uv
                                                      ( Rui − Ri )( Rui − Ri )

                               ∑   i∈Iuv
                                           ( Rui − Ri ) 2       ∑   i∈Iuv
                                                                               ( Rvi − Ri ) 2




                 20
电子商务推荐系统推荐技术分类
基于内容过滤(Content-Based filtering)
基于协同过滤(Collaborative filtering)
基于协同过滤(                      g)
关联规则(Association Rules)
分类分析(Classification)
聚类分析(Clustering)
Bayesian网络(Bayesian Network)
Horting图(Horting Graph)
其他数据挖掘方法




                  21
                                  2009-12-20
基于内容( Content-Based )过滤
 基于内容( Content-Based )过滤的推荐系统
 – 基于内容过滤的推荐系统通过比较项(商品)之间的相
   似性而不是用户之间的相似性实现推荐功能。其忽略
   用户的购买行为,它只考虑商品和商品之间的相似关系
 – 优点:简单,有效;建模和商品间的相似性度量可以脱
   机进行,因而推荐响应时间快
 – 缺点:难以区分商品信息的品质和风格,而且不能为用
   户发现新的感兴趣的商品,只能发现和用户已有兴趣相
   似的商品




              22
基于协同过滤( Collaborative filtering )

 协同过滤技术一般采用最近邻技术,利用客户的
 历史喜好信息计算客户之间的距离,目标客户对
 特定商品的喜好程度由其最近邻居对商品评价的
 加权平均值来计算
 可以处理客户数据变化比较快的情况
 在大型数据库中搜索最近邻居非常耗时,实时性
 不好
 分类:
 – Item-Based(Item-to-Item Correlation)
 – User-Based(People-to-People Correlation)


                         23
关联规则(Association Rules)
 关联规则技术根据关联规则发现算法和客户当前
 的购买行为向用户产生推荐
 关联规则的发现也可以离线进行
 推荐精度比最近邻技术略差




              24
分类分析( Classification )
 分类分析( Classification )其目的是建立一
 个分类函数或分类模型(也称作分类器),该模型
 能把数据 库的数据项映射到给定类别中的某一个。
 分类是有指导的学习。根据设定的分组,将不同
 的数据分配到不同的分组,然后研究每个组的特
 点。如客户跳槽分析。




              25
聚类分析(Clustering)
 聚类分析(Clustering)技术将具有相似爱好的客
 户分配到相同的族中,聚类产生之后,根据族中
 其他客户对某商品的评价就可以得到系统对该商
 品的评价
 Clustering 是将数据分为几组,其目的是要将组
 与组之间的差异找出来,同时也要将一个组之中
 的成员的相似性找出来。




             26
                           2009-12-20
Clustering VS. Classification
 聚类分析(Clustering)与分类分析
 (Classification) 不同的是,你不晓得它会以何
 种方式或根据什么来分类。所以你必须要有一个
 分析师来解读这些分类的意义。聚类分析帮助我
 们决定将哪些组合更有意义。聚类是把一组个体
 按照相似性归成若干类别, 即“物以类聚”。它
 的目的是使属于同一类别的个体之间的距离尽可
 能地小,而不同类别的个体间的距离尽可能地大。




                 27
贝叶斯网络- Bayesian Network
 Bayesian网络技术利用训练集创建相应的模型,模
 型用决策树表示,节点和边表示客户信息
 模型的建立可以离线进行,一般需要数小时或数
 天,得到的模型非常小,对模型的使用非常快
 这种方法适合客户的兴趣爱好变化比较慢的场合
 推荐精度和最近邻技术差不多




              28
                          2009-12-20
Horting图技术
 Horting图技术是一种基于图的方法,节点代表客
 户,边代表两个客户之间的相似度。在图中寻找
 近邻节点,然后综合近邻节点的观点形成最后的
 推荐
 Horting图技术可以跳过中间节点寻找最近邻居,
 考虑了节点之间的传递相似关系
 推荐精度优于最近邻技术




             29
其他可用于推荐系统的数据挖掘技术
决策树:
– 分析不同的影响因素对分析目标的影响,找到关键的
  影响因素。决策树法的优点是直观,但随着数据复杂
  性的提高,其分支树也会增多,管理困难。
遗传算法
– 遗传算法是一种基于生物进化过程的组合优化方法。
  其基本思想是:随着时间的更替,只有适合的物种才
  得以进化。将这种思想用于数据挖掘就是根据遗传算
  法获得最适合的模型,并据此对数据模型进行优化。
神经网络
– 神经网络从经验中学习,常用于发现一组输入数据和
  一个结果之间的未知联系。
           30
目   录

电子商务推荐系统简介
电子商务推荐系统算法基础
电子商务推荐系统算 介绍
电子商务推荐系统算法介绍
基于搜索引擎技术的推荐算法




31           31
推荐系统一般框架


推荐系统一般框架



           推荐方法
 候选对象             推荐对象




            32
基于关联规则的推荐算法
常用关联规则算法
– Apriori,AprioriTid,DHP,FP-tree等
基本算法:
– 使用关联规则发现算法找出所有满足最小支持度和最
  小置信度的关联规则R
– 找出R中所有被客户支持的关联规则R1,即关联规则左
  边的所有商品都被客户购买
– 找出被关联规则R1所预测并且没有被客户所购买的所
  有商品P
– 根据P中商品在关联规则R1中的置信度排序,如果某商
  根据 中商品在关联规则 中的置信度排序,如果某商
  品被多个规则预测,则取置信度最大者作为排序依据,
  挑选前N个商品作为算法输出
                      33
                                    2009-12-20
基于关联规则的推荐算法
算法分析:
– 第一步关联规则的发现最耗时,是算法的瓶颈,但可
  以离线进行
– 实时性比较好,因为后三步不会太耗时




           34
协同过滤技术分类
User-Based(People-to-People Correlation):
推荐系统根据客户与其他已经购买了商品的客户
之间的相关性进行推荐
Item-Based(Item-to-Item Correlation):推
荐系统根据客户感兴趣的产品推荐相关的产品




                  35
协同过滤主要步骤




 输入用户评价矩阵   计算最近邻居   产生推荐




               36
基于User-Based的协同过滤
基本思想:
 – 使用统计技术寻找与目标客户有相同喜好的邻居;然
   后根据目标客户多个邻居的观点产生向目标客户的推
   荐
基本步骤:
 – 表示(Representation):对客户已经购买的商品进行
   建模
 – 邻居形成(Neighborhood Formation):寻找目标客户
   所对应的邻居
 – 推荐产生(Recommendation Generation):从目标客户
   的邻居中产生N项产品推荐


                   37
基于User-Based的用户相似度算法
余弦相似性
                                                                  n

                         r r
                                    r r
                                    uv                       ∑R             ui   Rvi
        sim(u , v) = cos(u , v) = uu ur =
                                   r                            i =1

                                  u×v                       n                    n

                                                           ∑R ∑R
                                                           i =1
                                                                       ui
                                                                            2

                                                                                i =1
                                                                                       vi
                                                                                            2


相关相似性(Pearson相关系数 )
        sim(u , v) =
                              ∑       i∈Iuv
                                              ( Rui − Ru )( Rui − Rv )

                       ∑   i∈I uv
                                    ( Rui − Ru ) 2      ∑   i∈I uv
                                                                       ( Rvi − Rv ) 2


修正的余弦相似性

        sim(u , v) =
                                ∑       i∈I uv
                                                 ( Rui − Ri )( Rui − Ri )

                       ∑     i∈I uv
                                      ( Rui − Ri ) 2       ∑      i∈Iuv
                                                                            ( Rvi − Ri ) 2




                       38
User-Based的相似性算法-余弦相似性
 Similarity between items i & j is computed
 by isolating the users who have rated them
 and then applying a similarity computation
                  i       i i i            i
 technique.
 Cosine-based Si il it – it
 C i      b    d Similarity items are vectors
                                         t
 in the m dimensional user space
 (difference in rating scale between users is
 not taken into account).




                     39
User-Based的相似性算法-相关相似性
 Correlation-based Similarity - using the
 Pearson-r correlation (used only in cases
 where the uses rated both item I & item j).




 R(u,i) = rating of user u on item i.
 R(i) = average rating of the i-th item.



                        40
User-Based的相似性算法-修正的余弦相似性
Adjusted Cosine Similarity – each pair in the
co-rated set corresponds to a different user.
                    p
(takes care of difference in rating scale).




 R(u,i) = rating of user u on item i.
 R(u) = average of the u-th user.



                       41
基于User-Based的协同过滤-推荐算法
由目标客户的邻居产生N件商品推荐,可以采用
如下两种不同方法产生推荐
 – 最频繁项目推荐(Most-frequent Item Recommendation)
   扫描目标客户每一个邻居的购买数据,对其购买的商
   品进行计数,选择出现频率最高且目标客户没有购买
   的前N件商品最为推荐结果
 – 基于关联的推荐(Association Rule-based Recommendation):
   类似于基于关联规则的推荐算法,只是将目标客户的
   邻居作为算法的输入




                        42
基于Item-based协同过滤算法
基本思路
 – 基本假设:能够引起用户兴趣的项,必定与其之前评
   分高的相似
 – 根据目标客户已经评价过的项目与目标项目的相似性,
   选择k个最相似的项目{i
   选择 个最相似的项目 1, i2, ……, ik},同时得到k个最
                            ,同时得到 个最
   相似的项目与目标项目的相似度,记为{si1, si2, ……,
   sik},然后将目标客户对这k个最相似的项目的评分及这
   k个最相似的项目与目标项目的相似度的加权平均值作
   为对目标项目的评分
基本步骤
 – 1)得到User-item的评分数据;
 – 2)针对项的最近邻搜索,即对项进行相似度计算;
 – 3)产生推荐。
                 43
基于Item-based协同过滤-相似性算法
 计算项目i和j之间的相似性:
 – 从所有的用户中分离出同时对项目i和项目j进行评
   价的用户
 – 根据上面得到的数据计算项目i和项目j的相似性




             44
                             2009-12-20
协同过滤技术性能分析
性能分析:
– User-based 算法在邻居生成阶段,由于需要对每个目
  标客户所对应的邻居计算相似性,随着用户数量的不
  断增多(例如上千万、上百万级)时候,在大数量级
  的用户范围内进行“最近邻搜索”会成为整个算法的
  瓶颈
– Item-based算法将邻居生成阶段和推荐产生阶段分离,
  使得邻居生成阶段可以离线进行,从而使得电子商务
  网站的实时推荐得以实现




              45
Slope One-简单高效的推荐算法
基本思路
 – 平均值可以代替某两个未知个体之间的打分差异
 – 例如:事物A对事物B的平均差是:((3 - 4) + (2 -
   4)) / 2 = -1.5,也就是说人们对事物B的打分一般比
   事物A的打分要高1.5,于是Slope one算法就猜测Z对
   事物B的打分是4 + 1.5 = 5.5




                46
Slope One-简单高效的推荐算法
加权算法
 – 有n个人对事物A和事物B打分了,R(A->B)表示这n个人对A和对B打分的平
   均差(A-B),有m个人对事物B和事物C打分了,R(C->B)表示这m个人对
   C和对B打分的平均差(C-B),注意都是平均差而不是平方差,现在某个
   用户对A的打分是ra,对C的打分是rc,那么A对B的打分可能是:
   rb = (n * (ra - R(A->B)) + m * (rc - R(C->B)))/(m+n)

参考资料
 – http://en.wikipedia.org/wiki/Slope_One




                          47
协同过滤推荐系统常见问题
Cold Start: There needs to be enough other users
already in the system to find a match.
Sparsity: If there are many items to be
recommended, even if there are many users, the
user/ratings matrix is sparse, and it is hard to
find users that have rated the same items.
First Rater: Cannot recommend an item that has not
been previously rated.
 – New items
 – Esoteric items
Popularity Bias: Cannot recommend items to someone
with unique tastes.
 – Tends to recommend popular items.

                       48                        48
目   录

电子商务推荐系统简介
电子商务推荐系统算法基础
电子商务推荐系统算 介绍
电子商务推荐系统算法介绍
基于搜索引擎技术的推荐算法



           49
Vector space model
 在向量空间模型中,文本泛指各种机器可读的记录。用D
 (Document)表示,特征项(Term,用t表示)是指出现
 在文档D中且能够代表该文档内容的基本语言单位,主要
 是由词或者短语构成,文本可以用特征项集表示为D(T1,
 T2,…,Tn),其中Tk是特征项,1<=k<=N。
 例如一篇文档中有a、b、c、d四个特征项,那么这篇文档
 就可以表示为D(a,b,c,d)。对含有n个特征项的文本而
 言,通常会给每个特征项赋予一定的 权重表示其重要程
 度。即D=D(T1,W1;T2,W2;…,Tn,Wn),简记为D=
 D(W1,W2,…,Wn),我们把它叫做文本D的向量表示。其
 中 Wk是Tk的权重,1<=k<=N。



                 50
Inverted Files




                 51
Inverted Files




                 52
Word-Level Inverted File




                     53
TF/IDF(逆文本频率指数)
TF/IDF:Term Frequency/Inverse Document
Frequency
TF(t,d):表示单词t在文档d中的出现次数,以它
作为一个度量相关度的标准。
简单起见,定义IDF(t) = log(N / DF(t)),这里
的DF(t)是指单词t在多少篇文档中出现过
(Document Frequency),N是指总的文档数。容易
发现,如果单词越普遍,它的IDF越小,极端 情
况是DF(t)=N时,IDF(t)=0,从下面的式子能看出,
这实际上就起到了stop list的效果。


                 54
TF/IDF(逆文本频率指数)
把这两项结合起来,对单词t和文档d,定义TF-
IDF(t,d) = TF(t,d) * IDF(t)。
结论:某一特定文件内的高词语频率,以及该词
语在整个文件集合中的低文件频率,可以产生出
高权重的TF-IDF。因此,TF-IDF倾向於过滤掉常
见的词语,保留重要的词语。
对于搜索引擎我们就有了一个简单的打分方法:
一篇文档和一条Query的相关度为Query中所有单
词在这篇文档中的TF-IDF值之和。



             55
Lucene的TF/IDF相似度算法




 参考
 http://lucene.apache.org/java/2_2_0/api/org/apache/lucene/search/Similarity.html



                                         56
Content-Based推荐算法TF/IDF实现
 在Content-Based中,对于一个商品要达到向用户
 推荐的目的,首先要能够提取出能够表征商品特
 征的数据,这样才能够根据用户的喜好(实际上
 用户喜好也需要转化为特征值来进行度量)进行
 相对应的推荐。
 Content-Based的Content 特征值标识法
 – 分类法(Category)
 – 社会化标签(Tag)/关键字(Keywords)
 – 关键内容搜索引擎分词法
 Content-Based 推荐算法
 – 关键内容分词相关度
 – 基于Tag的相关度
                 57
基于标签Tag的社会化媒体TF/IDF算法




          58
基于TF/IDF算法的商品相关度实现
商品关键内容分词相关度
利用搜索引擎分词法对商品关键内容建立索引,
然后利用类似Lucene这样的TF/IDF相似度算法来
完成相似商品的推荐

商品Tag的相关度
 利用Tag能够用于对商品特征值进行标识的特点,通过
  TF/IDF相似度算法来完成相似商品的推荐




             59
参考资料
Wiki:
 – http://en.wikipedia.org/wiki/Collaborative_filt
   ering
 – http://en.wikipedia.org/wiki/Web_analytics
 – http://en.wikipedia.org/wiki/Recommendation_sys
   tem
图书
– Programming Collective Intelligence: Building Smart Web 2.0
  Applications
– Web Analytics: An Hour a Day
– Data Mining:Concepts and Techniques
– Mining the Web:Transforming Customer Data into Cutomer Value
– Data Mining Techniques: For Marketing, Sales, and Customer
  Relationship Management
                              60
参考资料
开源项目
– Open Source Collaborative Filtering Written in
  Java
– Carrot2 Clustering Engine
– Weka 3: Data Mining Software in Java
– Taste




                      61
参考资料
Blog
–   http://glinden.blogspot.com/
–   http://www.kaushik.net/avinash
–   http://guwendong.cn/
–   http://www.weigend.com/
–   http://www.chinawebanalytics.cn/
–   数学之美系列
–   Mining Social Data for Fun and Insight




                         62

Contenu connexe

En vedette

Administracion Empresarial 122116
Administracion Empresarial 122116Administracion Empresarial 122116
Administracion Empresarial 122116
guest168dfd6
 
Actualiteiten ICT Contracten en Partnerships (2012)
Actualiteiten ICT Contracten en Partnerships (2012)Actualiteiten ICT Contracten en Partnerships (2012)
Actualiteiten ICT Contracten en Partnerships (2012)
Advocatenkantoor LEGALZ
 
Error messages
Error messagesError messages
Error messages
rtinkelman
 
Gfpi f-019 guia de aprendizaje 01 tda orientar fpi
Gfpi f-019 guia de aprendizaje 01 tda orientar fpiGfpi f-019 guia de aprendizaje 01 tda orientar fpi
Gfpi f-019 guia de aprendizaje 01 tda orientar fpi
lisbet bravo
 

En vedette (20)

HIDRAULICA.pdf
HIDRAULICA.pdfHIDRAULICA.pdf
HIDRAULICA.pdf
 
Cuadro de cuentas
Cuadro de cuentasCuadro de cuentas
Cuadro de cuentas
 
Mantenimiento predictivo
Mantenimiento predictivoMantenimiento predictivo
Mantenimiento predictivo
 
Administracion Empresarial 122116
Administracion Empresarial 122116Administracion Empresarial 122116
Administracion Empresarial 122116
 
Libro+2+tomo+i
Libro+2+tomo+iLibro+2+tomo+i
Libro+2+tomo+i
 
Liderazgo1
Liderazgo1Liderazgo1
Liderazgo1
 
Pensamiento Critico
Pensamiento CriticoPensamiento Critico
Pensamiento Critico
 
Pasivo A Corto Y Largo Plazo
Pasivo A Corto Y Largo PlazoPasivo A Corto Y Largo Plazo
Pasivo A Corto Y Largo Plazo
 
Proyectos_de_innovacion
Proyectos_de_innovacionProyectos_de_innovacion
Proyectos_de_innovacion
 
Actualiteiten ICT Contracten en Partnerships (2012)
Actualiteiten ICT Contracten en Partnerships (2012)Actualiteiten ICT Contracten en Partnerships (2012)
Actualiteiten ICT Contracten en Partnerships (2012)
 
Revista convives n 6 marzo 2014 0
Revista convives n 6 marzo 2014 0Revista convives n 6 marzo 2014 0
Revista convives n 6 marzo 2014 0
 
Contabilidad General: Práctica y Dinámica Contable - Contabilidad de Activos,...
Contabilidad General: Práctica y Dinámica Contable - Contabilidad de Activos,...Contabilidad General: Práctica y Dinámica Contable - Contabilidad de Activos,...
Contabilidad General: Práctica y Dinámica Contable - Contabilidad de Activos,...
 
"Protección de la salud mental luego del terremoto y tsunami del 27 de febrer...
"Protección de la salud mental luego del terremoto y tsunami del 27 de febrer..."Protección de la salud mental luego del terremoto y tsunami del 27 de febrer...
"Protección de la salud mental luego del terremoto y tsunami del 27 de febrer...
 
Relatietips
RelatietipsRelatietips
Relatietips
 
De Reis van de Heldin december 2015
De Reis van de Heldin december 2015De Reis van de Heldin december 2015
De Reis van de Heldin december 2015
 
Error messages
Error messagesError messages
Error messages
 
Gfpi f-019 guia de aprendizaje 01 tda orientar fpi
Gfpi f-019 guia de aprendizaje 01 tda orientar fpiGfpi f-019 guia de aprendizaje 01 tda orientar fpi
Gfpi f-019 guia de aprendizaje 01 tda orientar fpi
 
Análisis situacional integral de salud final
 Análisis situacional integral de salud final Análisis situacional integral de salud final
Análisis situacional integral de salud final
 
Geheugen verbeteren
Geheugen verbeterenGeheugen verbeteren
Geheugen verbeteren
 
Salud
SaludSalud
Salud
 

Plus de chuan liang (10)

调心
调心调心
调心
 
调心
调心调心
调心
 
移动互联网开发基础
移动互联网开发基础移动互联网开发基础
移动互联网开发基础
 
文本挖掘(Text mining)基础
文本挖掘(Text mining)基础文本挖掘(Text mining)基础
文本挖掘(Text mining)基础
 
Scrum入门基础(Scrum in a nutshell)
Scrum入门基础(Scrum in a nutshell)Scrum入门基础(Scrum in a nutshell)
Scrum入门基础(Scrum in a nutshell)
 
Role Based Access Control Fundamental
Role Based Access Control FundamentalRole Based Access Control Fundamental
Role Based Access Control Fundamental
 
Recommender Systems in E-Commerce
Recommender Systems in E-CommerceRecommender Systems in E-Commerce
Recommender Systems in E-Commerce
 
面向对象的分析设计之UML基础
面向对象的分析设计之UML基础面向对象的分析设计之UML基础
面向对象的分析设计之UML基础
 
企业级搜索引擎Solr交流
企业级搜索引擎Solr交流企业级搜索引擎Solr交流
企业级搜索引擎Solr交流
 
面向对象的分析设计之RUP基础及用例建模
面向对象的分析设计之RUP基础及用例建模面向对象的分析设计之RUP基础及用例建模
面向对象的分析设计之RUP基础及用例建模
 

电子商务推荐系统入门基础V2.0