阿里的CTR预测(二):Deep Interest Evolution Network

栏目: R语言 · 发布时间: 6年前

内容简介:这篇文章发布于2018年9月,是之前的DIN的改进版。我们在我们略去背景介绍,尤其是Base Model的部分,如果大家想看的话,可以去前一篇文章中找。现在我们直接介绍DIEN的结构。DIEN最大的特点是不但要找到用户的interest,还要抓住用户interest的进化过程。作者们将GRU融合到网络中,从而抓出变化的sequence。关于GRU的介绍有兴趣的话不妨看看这篇上面两张图分别是DIN和DIEN的结构图,我们可以对比来看。

这篇文章发布于2018年9月,是之前的DIN的改进版。我们在 阿里的CTR预测(一):Deep Interest Network 中提到过,他们尝试使用LSTM来学习序列化数据的特征,但是对DIN的结果没有改善。DIEN在这一点上做了改善。

Deep Interest Evolution Network(DIEN)

我们略去背景介绍,尤其是Base Model的部分,如果大家想看的话,可以去前一篇文章中找。现在我们直接介绍DIEN的结构。DIEN最大的特点是不但要找到用户的interest,还要抓住用户interest的进化过程。作者们将GRU融合到网络中,从而抓出变化的sequence。关于GRU的介绍有兴趣的话不妨看看这篇 Understanding GRU networks

阿里的CTR预测(二):Deep Interest Evolution Network
阿里的CTR预测(二):Deep Interest Evolution Network

上面两张图分别是DIN和DIEN的结构图,我们可以对比来看。

可以看到,DIEN仍然存在Embedding Layer,并且Embedding的方法也和之前一致。其他User profile, target AD和context feature的处理方式两者都是一致的,只是把user behavior组织成了序列数据的形式,并把简单的使用外积完成的activation unit变成了一个attention-based GRU网络。

Interest Extractor Layer

现在我们具体来说Interest Extractor Layer,也就是GRU单元在的那个layer。顾名思义,这个Layer的主要目标是从embedding数据中提取出interest来。但一个用户在某一时间的interest不仅与当前的behavior有关,也与之前的behavior相关,所以作者们使用GRU单元来提取interest。

阿里的CTR预测(二):Deep Interest Evolution Network

这是一个GRU单元的表达式,其中 代表一个t时刻behaviour的embedding, 是sigmoid函数, 代表element-by-element乘法。

他们在这一步还引入了一个 ,用来辅助进行Interest Extractor。因为普通的 只能从embedding中提取信息,提取的却不一定是interest。最后的action只由final interest决定,要保留中间状态的interest需要其他的激励。通过引入 如下 阿里的CTR预测(二):Deep Interest Evolution Network

并将最终的模型目标设为 ,可以让GRU在中间状态提取出interest信息。

Interest Evolution Layer

以用户对衣服的interest为例,随着季节和时尚风潮的不断变化,用户的interest也会不断变化。

  • 追踪用户的interest可以使我们学习final interest的表达时包含更多的历史信息
  • 可以根据interest的变化趋势更好地进行CTR预测 而interest在变化过程中遵循如下规律:
  • interest drift:用户在某一段时间的interest会有一定的集中性。比如用户可能在一段时间内不断买书,在另一段时间内不断买衣服。
  • interest individual:一种interest有自己的发展趋势,不同种类的interest之间很少相互影响,例如买书和买衣服的interest基本互不相关。

为了利用这两个时序特征,我们需要再增加一层GRU的变种,并加上attention机制以找到与target AD相关的interest。其中,attention function可以表示为: 阿里的CTR预测(二):Deep Interest Evolution Network

是target AD的embedding。

把Attention和GRU结合起来的机制有很多种,

  • AIGRU:
  • AGRU:
  • AUGRU:

文章中尝试了这三种机制。


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

数据结构及应用算法教程

数据结构及应用算法教程

2011-5 / 45.00元

《数据结构及应用算法教程(修订版)》从数据类型的角度,分别讨论了四大类型的数据结构的逻辑特性、存储表示及其应用。此外,还专辟一章,以若干实例阐述以抽象数据类型为中心的程序设计方法。书中每一章后都配有适量的习题,以供读者复习提高之用。第1~9章还专门设有“解题指导与示例”一节内容,不仅给出答案,对大部分题目提供了详尽的解答注释;其中的一些算法题还给出了多种解法。书中主要算法和最后一章的实例中的全部程......一起来看看 《数据结构及应用算法教程》 这本书的介绍吧!

RGB HSV 转换
RGB HSV 转换

RGB HSV 互转工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具