BERT4Doc-paddle

(Unofficial) The repo is Paddle implementation of BERT4Doc.
paper: How to Fine-Tune BERT for Text Classification?
unofficial pytorch implementation: xuyige/BERT4doc-Classification: Code and source for paper
Dataset: IMDB, TREC and yahoo-answers

Dependencies

python>=3.6
paddle == 2.1.3
paddlenlp == 2.0.0

Further Pre-training

Executing further pre-training based on IMDB dataset:

python main.py \
  --data_dir data/imdb_pretraining.json \
  --model_dir further_imdb_pretraining \
  --max_steps 100000 \
  --model_name_or_path bert-base-uncased

Executing further pre-training based on yahoo-answers dataset:

python main.py \
  --data_dir data/yahoo_pretraining.json \
  --model_dir further_imdb_pretraining \
  --max_steps 100000 \
  --model_name_or_path bert-base-uncased

You can download models trained by us in here.

Fine-tuning

Using the pre-training model based on IMDB to fine-tuning IMDB dataset;

python run_discriminative_paddle_decay.py \
                          --data_dir="IMDB_data" \
                          --task_name="IMDB" \
                          --output_dir="imdb_output" \
                          --model_name_or_path="furthered_imdb_pretrained" \
                          --model_dir="imdb_model" \
                          --do_lower_case \
                          --do_train --do_eval --discr\
                          --layers 11 \
                          --trunc_medium 128 \
                          --layer_learning_rate 2e-5 \
                          --layer_learning_rate_decay 0.95

Using the pre-traning model based on yahoo-answers to fine-tuning TREC dataset;

python run_discriminative_paddle_decay.py \
                          --data_dir="TREC_data" \
                          --task_name="TREC" \
                          --output_dir="trec_output" \
                          --model_name_or_path="furthered_trec_pretrained" \
                          --model_dir="trec_model" \
                          --do_lower_case \
                          --do_train --do_eval --discr\
                          --layers 11 \
                          --trunc_medium 128 \
                          --layer_learning_rate 2e-5 \
                          --layer_learning_rate_decay 0.95

Experiment Results

Further pre-training Dataset	Fine-tuning Dataset	Accuracy
IMDB	IMDB	94,76
Yah. A	TREC	93.00

Align

forward_diff: model_diff.txt
metric_diff and loss_diff: metric_loss_diff.txt
learning_rate_diff: lr_diff.txt
backward_diff: backward_loss_diff.txt

More details about align works in here.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.idea		.idea
BERT4doc-fine-tuning		BERT4doc-fine-tuning
BERT4doc-pretraining		BERT4doc-pretraining
align_results		align_results
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

BERT4Doc-paddle

Dependencies

Further Pre-training

Fine-tuning

Experiment Results

Align

About

Releases

Packages

Languages

ncpaddle/BERT4Doc-paddle

Folders and files

Latest commit

History

Repository files navigation

BERT4Doc-paddle

Dependencies

Further Pre-training

Fine-tuning

Experiment Results

Align

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages