-
Notifications
You must be signed in to change notification settings - Fork 1
/
config.py
84 lines (80 loc) · 2.61 KB
/
config.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
# -*- coding: utf-8 -*-
# @Author : xuyingjie
# @File : config.py
# [train_classifier, predict_single, predict_test, save_pb_model]
mode = 'train_classifier'
CUDA_VISIBLE_DEVICES = -1
# int, -1:CPU, [0,..]:GPU
# coincides with tf.CUDA_VISIBLE_DEVICES
classifier_config = {
# 模型选择
# 预训练模型:Bert/MacBert/RoBerta/DistilBert/AlBert/Electra/XLNet
'classifier': 'MacBert',
# 若选择Bert系列微调做分类,请在pretrained指定预训练模型的版本
'pretrained': 'macbert-base-chinese',
# 训练数据集
'train_file': '训练集/train.csv',
# 验证数据集
'val_file': '',
'set_val_rate': 0.15,
# 测试数据集
'test_file': '测试集/test1.csv',
# 引入外部的词嵌入,Bert作特征特征提取层
# 不填写则随机初始化的Embedding
'embedding_method': '',
# token的粒度,token选择字粒度的时候,词嵌入(embedding_method)无效
# 词粒度:'word'
# 字粒度:'char'
'token_level': 'word',
# 是否去掉特殊字符
'remove_special': True,
# 类别列表
'classes': [0, 1],
# 模型保存的文件夹
'checkpoints_dir': 'MacBert_base_model',
# 模型保存的名字
'checkpoint_name': 'MacBert_base_model',
# 设置随机种子便于结果复现
'seed': 1024,
# 学习率
# 微调预训练模型时建议更小,设置5e-5
'learning_rate': 4e-5,
# 权重衰减系数,类似模型正则项策略,避免模型过拟合
'weight_decay': 1e-2,
# 优化器选择
# 可选:Adagrad/Adadelta/RMSprop/SGD/Adam/AdamW
'optimizer': 'Adam',
# 训练epoch
'epoch': 4,
# 最多保存max_to_keep个模型
'max_to_keep': 1,
# 每print_per_batch打印
'print_per_batch': 100,
# 是否提前结束
'is_early_stop': True,
'patient': 2,
'batch_size': 32,
'max_sequence_length': 128,
'max_sequence_len_test': 80,
# 遗忘率
'dropout_rate': 0.5,
# 若为二分类则使用binary
# 多分类使用micro或macro
'metrics_average': 'micro',
# 是否使用GAN进行对抗训练
'use_gan': False,
# 目前支持FGM和PGD两种方法
# fgm:Fast Gradient Method
# pgd:Projected Gradient Descent
'gan_method': 'fgm',
# 对抗次数
'attack_round': 3,
# 使用标签平滑
# 主要用在预训练模型微调,直接训练小模型使用标签平滑会带来负面效果,慎用
'use_label_smoothing': True,
'smooth_factor': 0.1,
# 类别样本比例失衡的时候可以考虑使用
'use_focal_loss': True,
# focal loss的各个标签权重
'weight': None
}