《集体智慧编程》第二章总结:
首先是需要数据
第二是构建好数据集之后,使用数据来度量用户间的相似度,
相似度有以下度量:
参考:http://hi.baidu.com/black/item/79295353bb1bb8dfd58bac62
第三步,相似度求出后,可以将其视作从某用户出发对其它用户的打分,然后可以从该用户出发的对物品的打分,具体是以各用户的打分为加权系数,对所有相关用户(对物品打过分的用户),求和:用户对物品的打分*该用户的打分(加权系数),再除以加权系数之和,示得该物品对该用户的具体得分,越高越好。
以上过程的数据集,如果调整下顺序,不是用户:{物品:分数},而变成物品:{用户:分数}则可以变成物品与物品的相关
然后有一个del.icio.us的例子,此例中的打分仅有1和0两个选项。
最后是基于物品的协作型过滤,没有细讲,推测就是先前调整顺序的算法。
最后的最后,注意两种不同算法的作用场合的分析
相关推荐
DNV-OS-D101(2013-10)-中文版.pdf
2013-软件工程-第11-13章-软件项目管理-2013-10(ppt-课件).ppt
很好的MHVTL安装软件, 憋人安装了,很好用,备份软件挂载上了虚拟磁带,完成了备份实验任务
libubox-2013-10-19适用于linux操作系统
-软件工程吉林大学lecture-se-2013-chap10-01.ppt
marvell-phys-transceivers-alaska-88e1111-technical-product-brief-2013-10.pdf
行业数据-2013-2018年中国TOP10影片票房占比.rar
利用爬虫获得的2013-2018年10月全国各城市的空气质量指数,来源是真气网(https://www.aqistudy.cn)。由于各城市不是同时开始公开空气质量指数,所以各城市之间的数据量是不一样的,请注意。另外,所有文件都是csv...
2013年-2022年最新全国328个城市的AQI数据,包含PM2.5、PM10、SO2、NO2、O3、CO六类大气污染物。可用于统计建模数据分析,科研学习。 数据来源:中国气象历史数据 时间跨度:历史数据更新至2022年 区域范围:全国 ...
2013-5-14-10冬虫夏草为何会被频频造假-论文.zip
2013-5-14-10冬虫夏草为何会被频频造假.doc
2013-2018年中国TOP10影片票房占比.xls
arm-linux-gcc编译器,32位的4.7-2013-10版本,还有4.6~4.9的版本的arm-linuxgcc编译器在我的资源中可以找到
2013-06-10 MVCOA工作流,分享给大家参考
Visio_Pro-2013-64
电子时钟 PCB ECO 2013-11-10 0-34-23.LOG
Myeclipse-2013-破解文件_Myeclipse-10-破解文件,兼容Myeclipse-2013和Myeclipse-10.里面有Myeclipse-10的破解教程
php中文手册最新版2013-10-24
arm-linux-gcc编译器,32位的4.8-2013-10版本,还有4.6~4.9的版本的arm-linuxgcc编译器在我的资源中可以找到
全国移动联通电信基站数据(2013-01~2013-07的更新数据)总计有10万;这些数据都是从网络中查找、整理,本人不保证数据的正确!