Anomaly Detection System

CS5614 Project

First start the docker container by this command:-

docker-compose -f docker-compose-expose.yml up

Then start the producer file :

python producer.py

File Descriptions

data_parser.py

This file can parse the SSH file and generate CSV data in the format that the ML model will take in. We can use the same schema for Spark processing as well. You can find the column names in the "logs" object of the LogParser class in the same file. This file houses the logic for labelling anomalies.

INPUT: assets/SSH.log OUTPUT: assets/log_data.csv

NOTE: There are 3 ways to get information from the parser.

To parse one line at a time, parse() can be called for every line.
To get entire data as list of lists, get() can be used.
To get entire data as dataframe, get_as_dataframe() can be used.

from data_parser import LogParser

parser = LogParser()

line_dict = parser.parse(log_line) # Useful for returning single row of data parsed_data = parser.get() # Useful for returning all data as list of lists dataframe = parser.get_as_dataframe() # Useful for returning all data as dataframe

learner.ipynb

This file reads the processed data and trains a machine learning model. It should save the model in .pkl format. Some starter code has already been added to the file.

INPUT: assets/log_data.csv OUTPUT: a pickle file that stores the model

assets directory

SSH.log: Main log file.
log_file.log: A sample of the main log file (2000 lines).
tmp_log.log: A sample of the main log file (10000 lines).
log_data.csv: Processed data for the training and testing of ML model. Same structure of data should be provided to the model as input.

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
.gitignore		.gitignore
CHANGELOG.md		CHANGELOG.md
Dockerfile		Dockerfile
LICENSE		LICENSE
Project.ipynb		Project.ipynb
README.md		README.md
broker-list.sh		broker-list.sh
create-topics.sh		create-topics.sh
data_parser.py		data_parser.py
docker-compose-expose.yml		docker-compose-expose.yml
docker-compose-single-broker.yml		docker-compose-single-broker.yml
docker-compose-swarm.yml		docker-compose-swarm.yml
docker-compose.yml		docker-compose.yml
docker_buildx		docker_buildx
docker_push		docker_push
download-kafka.sh		download-kafka.sh
learner.ipynb		learner.ipynb
ml_model.pkl		ml_model.pkl
producer.py		producer.py
pyspark_learner.ipynb		pyspark_learner.ipynb
requirements.txt		requirements.txt
start-kafka-shell.sh		start-kafka-shell.sh
start-kafka.sh		start-kafka.sh
versions.sh		versions.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Anomaly Detection System

File Descriptions

data_parser.py

learner.ipynb

assets directory

About

Releases

Packages

Languages

License

prarthnadoshi/Anomaly-Detection

Folders and files

Latest commit

History

Repository files navigation

Anomaly Detection System

File Descriptions

data_parser.py

learner.ipynb

assets directory

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages