Microsoft关联规则算法解决电子商务中交叉销售的商业问题_第1页
Microsoft关联规则算法解决电子商务中交叉销售的商业问题_第2页
Microsoft关联规则算法解决电子商务中交叉销售的商业问题_第3页
Microsoft关联规则算法解决电子商务中交叉销售的商业问题_第4页
Microsoft关联规则算法解决电子商务中交叉销售的商业问题_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、microsoft关联规则算法解决电子商务中交叉销售的商业问题2010年第9期福建电脑microsoft关联规则算法解决电子商务中 交叉销售的商业问题 翁春荣(福建交通职业技术学院信息技术与工程系福建福州350007)【摘要】:发客户可能购买什么产品?对零售商来说,交叉销售是很重要的许多零 售商,特别是通过internet销售的零售商他们通过交叉销售来增加他们的销售量例如,在网上书店 购买一本书,web站点会推荐一些相关书籍.这些推荐的书就来自于数据挖掘分析.【关键词】:数据挖掘;模式;数据挖掘算法;关联规则算法1, 商业问题交叉销售是非常常见的商业问题它包括基于客 户当前或者z前的购物篮屮的

2、产品来推荐新的产品列 表.例如.如果访问淘宝网.然后将一套服装放入购物 篮中则会获得一组其他服装的推荐信息该推荐信息 是基于购物篮分析来获得的而该购物篮分析是针对 数千个有相似购物情况的客户进行的好的推荐信息 会改善客户的购物体验,从而増加总的销售额差的推 荐信息会使客户感到烦恼,从而最终把他们赶走交叉 销售的主要难点在于如何向每个客户提供一组正确的 推荐信息当销售的产品目录比较小时基于销售经验 来提供建议相当容易可是一旦不同产品的数量比较 多时,问题就会变得更加复杂.vovotrad.com贸公司网站1是专门从事服装对外贸易的公司.在vovotrad.com上有数t款的服装鞋帽 公司老板希望

3、通过向在线的购物者提供个性化的建议 来增加服装的销售额在本解决方案中,我们使用数据 挖掘技术来帮助公司解决这个商业问题2, 源数据描述图1一1给出了 vovotrad.con数据集市的部分模式. 在图屮显示了两个表:customers和purchase.cus. tomers表包含客户的人口统计信息,例如,年龄,教肓, 性别和收入等等;它是维表.purchase表存储了客户以 前购物的历史事务.这个表是包含customerld和 clothingld两列的事实表每个客户都购买了数套服 装.这两个表z问是1对n的关系.图 1 -1 vovotrad.com 的模式3, 构建模型在数据挖掘项目中的

4、第一步是理解商业需求并且 确定适合于该商业问题的数据挖掘任务数据挖掘任 务包括分类,回归,关联,细分和预测等.sqlserer 2005中的大多数数据挖掘算法都可以应用于多种任 务上在确定数据挖掘任务后,可以应用一组适合于该 任务的算法.以构建挖掘模型.3.1确定数据挖掘任务在构建任何数据挖掘模型z前必须确定适用于 商业问题的数据挖掘任务类型在这个解决方案中目 标是分析客户将会一起购买的服装在获得这些模式 后,可以使用它们来提供推荐信息基于对需求的分 析,该问题展丁数据挖掘关联任务有一些microsoft 数据挖掘算法可以应用到关联任务上:最合适的两个 算法是microsoft决策树算法和mi

5、crosoft关联规则算 法在木方案中,我们使用microsoft关联规则算法来构建模型3.2使用关联规则算法关联规则是分析发现数据库中不同变量或个体f例 如商品问的关系及年龄与购买行为)之间关系程度. 并用这些规则找出顾客购买行为模式.如购买了台式 计算机对购买其他计算机外设产甜(打印机,音箱,硬 盘等)的相关影响.发现这样的规则可以应用于商品货 架摆设,库存安排以及根据购买行为模式对客户进行 分类.关联规则最早是由agrawal于1993年提岀.a.grawal对关联规则的定义如下:假设1=(111-1卜一 i可视为m个商品项目的集厶口 od=(irt:-,t卜一 d为n位客户交易的总集合

6、,其中 t=(iil,ii2o,.il代表第i位客户的交易数据.关联规则的代表式"ifconditionthenresult"也就 是”x:二>y”,其中x,y称作项集(itemsets).关联规则中 有两个重要的参数.分别为支持度(suppo1和可信度 112福建电脑2010年第9期(confidence)o支持度是指x项集与y项集.同时出现在d交易 总集合的次数,除以d交易总集合的个数.以概率的 观点来看,支持度就是同时发牛x,y事件的概率.可信度是指x项集与y项集.同时出现在d交易 总集合的次数除以x项集在d交易总集合出现的次 数,以概率的观点來看可信度

7、就是在x事件发生的 情况下,y事件发生的概率.关联规则算法是高效的计数算法它对每个频繁项集的支持度进行计数.该支持度表示同时购买com. moditya和commodityb的不同客户的数量这是为购 物篮分析而设计的算法基于在图1 一 1中显示的同一挖掘结构.可以使用 microsoft关联算法来创建相关的挖掘模型.如前所述, 在处理模型之前必须指定两个阀值参数第一个参数 minimumsuppo-用来过滤出现不频繁的项集.另一个 参数是minimumprobabilitv.该参数用来对规则进行 限制这些规则将用于预测这些规则是基于频繁项集 来生成的.关联算法对minimum非常敏感.如.su

8、ppo果该参数设置得太高,则不会有足够的项集和规则如 果该参数设置得太低则模型的处理时间将会成指数 级别增长在这个解决方案中我们将minimums叩po设置 为0.01.即表示我们只对某些项集感兴趣:这些项集在 所有购物车屮出现的概率至少为1%.我们将mini mumprobability设置为0.30表示如果购买conunod. itva的客户有30%也购买commodityb,则我们将a:> b认为是一个符合要求的规则4, 执行预测在处理了模型z后,可以使用模型屮的模式來预 测新客户可能感兴趣的商品列表.4批处理预测查询vovotrad.com 包含两个新表:newcusto

9、mer 和 new customerpurchasenewcustomer包含新的客户清单以 及这些客户的人口统计信息.newcustomerpurchase包 含一些每个新客户最近购买的商品清单此吋外贸公 司的经理就可以向他们的客户发送一组个性化的商品 推荐信息.以此达到促销的目的.可以通过以下预测查询来获得提供给客户的最佳 推荐信息:selectt.customerld(predict(purchase,adjustedprobability,5)asrecom一 mendationfromcustomerspredictionjoinshape(openrowsetcsqloledb.

10、1.integratedsecurity=sspi;initia 1 catalog=vovotrade;datasource=localhost,selectcustomerldfromnewcustomerorderbycustomerld)append(openrowset(sqloledb. 1.integratedseeurity=sspi;initialcatalog=vovotrade;datasource= localhost."selectcustomerldfromnewcustomerorderbycustomer,id)relatecustomeiidtocu

11、stomerld)asnewcustomerpurchaseastonmovieassociation.purchase.surveytakenld=t.new一customerpurchase.surveytakenld4.2使用单例预测查询在许多情况下关于新客户的信息还没有存储到数据库中例如,如果web客户访问vovotrad.cob来购 买商品我们希望基于他在购物车中己选择的商品来 向客户实时地提供推荐信息为了完成该操作,可以使 用以下dmx单例查询:select(predict(purchase,6)asfrecommendationlfrommovieassocnaturalpredictionjoin(select(selectadidasascomm.od

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论