【论文笔记】基于图机构的推荐系统:Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba
2024-08-24 20:31:20
题外话:
阿里和香港理工联合发布的这篇文章,整体来说,还挺有意思的。
刚开始随便翻翻看看结构图的时候,会觉得:这也能发文章???
后来,细看后发现:哦~~还不错
文章简介:
基于阿里巴巴电商推荐系统的十亿规模的商品嵌入
与词向量类似,为每一个商品生成一个向量,向量间一一匹配,将相似的设定为推荐的候选
这篇文章的着重点在RS的matching,而不是ranking
针对阿里的数据集应用需要解决的三个难题:
1)数据量大
2)数据稀疏性(用户仅点击过库中数据的一小部分)→通过图谱结构解决,而不是传统的协同过滤
3)冷启动:店家会不定期上新,这些上新的商品并没有发生过用户行为,如何处理这些数据→将边信息考虑进去
渐进地提出了3个框架:BES, GES, EGES
数据:基于用户行为(点击顺序)构成的商品图谱(数据清洗:为节省计算空间以及考虑到用户的兴趣会随时间改变,构建序列时长限定为1个小时;去除刷单的用户,每月购买件数>1000或历史购买数>3500),每条边的权值由用户行为决定,如有100个用户从A点到了B,那个A到B的权值暂定为100
BES: base graph embedding
这是本篇文章中最基础的一个框架,借用的deep walk的算法,random walk后得到序列,扔进skip-gram训练
GES: graph embedding with side information
这一框架,将边信息考虑进去,边信息是指商品的属性,如品牌,店家,材质,价格等,因为认为用户的偏好可能跟这些属性有关。
在网络输入时,将商品的one-hot与各个属性的one-hot输入,embedding后直接concat,通过一个隐含层,后面的跟BES差不错
EGES: enhanced graph embedding with side information
这一框架,基于GES,认为每一个属性是带权值的,每一条边,不应同等对待。即用户同时喜欢这两件衣服,可能是因为他们都是牛仔外套,或者因为他们都是优衣库的。因此,在得到商品及属性的embedding后,乘以一个权值再进去隐含层
结果:
从下图的可视化可以看出,相同种类的可以被分到临近的区域
<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">
最新文章
- JVM实用参数(五)新生代垃圾回收
- Notepad++ 快捷键 大全
- ASP.NET中的Eval与DataBinder.Eval()方法
- jsp DAO设计模式
- (转)linux中项目部署和日志查看
- 实战案例--TEMPDB暴涨
- 如何优化Cocos2d-X游戏的内存
- BZOJ5412 : circle
- MySQL8主从配置
- vue踩坑--TypeError: __WEBPACK_IMPORTED_MODULE_1_vuex__.a.store is not a constructor
- Vue注意事项及用得较多的属性归纳
- 数电——全减器分析(用74HC138设计提示)
- 让硬盘灯不再狂闪,调整Win7系统绝技(转)
- 【WPF】TabControl禁用部分选项卡
- Spark之Task原理分析
- ThinkJava-新IO
- [CQOI2014]数三角形 组合数 + 容斥 + gcd
- MVP应用在android app上
- 54、Android 粒子效果之雨(下雨的效果)
- 第二篇:git创建流程
热门文章
- cordova ios升级插件
- Bootstrap的js插件之轮播(carousel)
- 读书笔记-HBase in Action-第三部分应用-(1)OpenTSDB
- TP的分页加查询
- iOS OC和JS的交互 javaScriptCore方法封装
- iOS使用正则匹配限制输入密码格式
- linux c编程:线程互斥一
- [转载]Hibernate如何提升数据库查询的性能
- Ubuntu 14.04 或者16.04开启root账户登录和图形界面登录root时候的报错解决方法
- Android AbsoluteLayout绝对布局