GitHub

Seminar DO+ML 2022 Inspired by Hooker et al https://arxiv.org/abs/1911.05248.

Studied the effect of knowledge distillation (by comparing BERT and DistilBERT) on the test error distribution on the Toxic Comment Classification Dataset (https://www.kaggle.com/c/jigsaw-toxic-comment-classification-challenge). The distilled model performs worse on examples that are harder to classify by the base model. Moreover, it seems to amplify biases that are already present in the base model.

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
BERT vs DistilBERT.ipynb		BERT vs DistilBERT.ipynb
Evaluation on Unintended Bias Dataset.ipynb		Evaluation on Unintended Bias Dataset.ipynb
Performance on Unintended Bias Dataset - BERT vs DistilBERT.ipynb		Performance on Unintended Bias Dataset - BERT vs DistilBERT.ipynb
README.md		README.md
bert_tsc.py		bert_tsc.py
dbert_tsc.py		dbert_tsc.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

megiandoni/bert_vs_distilbert

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages