xDeepFM / CIN

eXtreme Deep Factorization Machine (xDeepFM) 提出了一种新的网络Compressed Interaction Network (CIN)，在DCN的基础上进一步提升了基于FM的深度学习结构

xDeepFM的改进点主要是：DCN的交叉是bit-wise，而CIN的交叉是vector-wise的。bit-wise是指将所有特征embedding后放到一个向量中，即同一个特征embedding的每个元素进到DCN网络后都是一个”新的特征”，同一个embedding的各个元素也会交叉；而vector-wise是指将所有特征embedding后，每个特征都是一个向量，即有一个field的概念，进入CIN后是embedding向量与向量间的交叉

CIN结构

我们先看看CIN怎么做vector-wise product的：

drawing

图中的\(x^0\)是最开始的特征，大小为\(m \times D\)，\(m\)是特征数，\(D\)是embedding维度数；\(x^k\)都是CIN的中间过程，大小为\(H_k \times D\)，\(H_k\)是自己设定的，代表中间层隐含的特征数。\(z^{k+1}\)是根据\({x^k}\)和\(x^0\)得到的，是第k层和第0层在D上的每个维度的外积，这样就是vector-wise的，因为每个embedding的每个元素是一一对应相乘的，然后因为做了外积，所以得到了第k层和第0层每个特征embedding之间的乘积（第1层是第0层跟第0层做外积，相当于FM的交叉部分了）

这样得到的\(z^{k+1}\)还需要进行压缩（否则形状就无法进行下一次迭代了）：

drawing