DeepFM

1. 论文

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

创新：将WDL中Wide部分更换为FM

原文笔记： https://mp.weixin.qq.com/s/bxYag1GcJABkwwz0NmLI5g

2. 模型结构

3. 实验数据集

采用Criteo数据集进行测试。数据集的处理见utils文件，主要分为：

考虑到Criteo文件过大，因此可以通过read_part和sample_sum读取部分数据进行测试；
对缺失数据进行填充；
对密集数据I1-I13进行归一化处理，对稀疏数据C1-C26进行重新编码LabelEncoder；
整理得到feature_columns；
切分数据集，最后返回feature_columns, (train_X, train_y), (test_X, test_y)；

4. 模型API

class DeepFM(keras.Model):
	def __init__(self, feature_columns, k=10, hidden_units=(200, 200, 200), dnn_dropout=0.,
				 activation='relu', fm_w_reg=1e-4, fm_v_reg=1e-4, embed_reg=1e-4):
		"""
		DeepFM
		:param feature_columns: A list. a list containing dense and sparse column feature information.
		:param k: A scalar. fm's latent vector number.
		:param hidden_units: A list. A list of dnn hidden units.
		:param dnn_dropout: A scalar. Dropout of dnn.
		:param activation: A string. Activation function of dnn.
		:param fm_w_reg: A scalar. The regularizer of w in fm.
		:param fm_v_reg: A scalar. The regularizer of v in fm.
		:param embed_reg: A scalar. The regularizer of embedding.
		"""

5. 实验超参数

file：Criteo文件；
read_part：是否读取部分数据，True；
sample_num：读取部分时，样本数量，5000000；
test_size：测试集比例，0.2；
embed_dim：Embedding维度，8；
k：FM因子，10；
dnn_dropout：Dropout, 0.5；
hidden_unit：DNN的隐藏单元，[256, 128, 64]；
learning_rate：学习率，0.001；
batch_size：4096；
epoch：10；

6. 实验结果

采用Criteo数据集中前500w条数据，最终测试集的结果为：AUC：0.790548

Experimental dataset

Model

Traditional Model
- MF
- FM
- FFM
Neural network-based
- WDL
- Deep Crossing
- PNN
- DCN
- NFM
- NCF
- AFM
- DeepFM
- xDeepFM
Sequence Model
- DIN
- SASRec

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

DeepFM

DeepFM

1. 论文

2. 模型结构

3. 实验数据集

4. 模型API

5. 实验超参数

6. 实验结果

Experimental dataset

Model

Clone this wiki locally