Fake News Classifier

CAPP 30254 ML Final Project

Authors:

Anthony Hakim
Sasha Filippova
Yifu Hou

Project Descripion:

Research Question: Can we identify fake news articles based on article title alone?

In this project, our team designed 2 Natural Language Processing (NLP) machine learning models to classify fake news articles using only article titles. For our baseline model, we use a logistic regression model and TF-IDF techniques to classify fake news articles with 94% accuracy. We also apply a pre-trained BERT model for classification, and discover that the more complex model preforms with lower accuracy.

Directory:

baseline_model.ipynb: TF-IDF logistic regression training and testing.
classification.ipynb: Final BERT model hyperparameter tuning, training and testing.
original_bert.ipynb: Baseline BERT model training and testing.
util.py: file of helper functions to preprocess data.
data/: directory containing data.
final_presentation: final presentation of results.

Data Visualization:

Data Source:

https://www.kaggle.com/datasets/clmentbisaillon/fake-and-real-news-dataset?select=True.csv

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Fake News Classifier

Authors:

Project Descripion:

Directory:

Data Visualization:

Data Source:

About

Releases

Packages

Contributors 3

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
data		data
README.md		README.md
baseline_model.ipynb		baseline_model.ipynb
classification.ipynb		classification.ipynb
final_presentation.pptx		final_presentation.pptx
original_bert.ipynb		original_bert.ipynb
util.py		util.py

anth0nyhak1m/nlp_project_yas

Folders and files

Latest commit

History

Repository files navigation

Fake News Classifier

Authors:

Project Descripion:

Directory:

Data Visualization:

Data Source:

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages