Audio Identification

Audio identification is a class of information retrieval systems designed to match a query with a set of database documents. The objective is to find the most similar track in a database given a short audio snippet.

This implementation utilizes Wang's fingerprinting method (Wang 2003), leveraging frequency pairs and time difference hashes to efficiently match query audio with the database.

Performance

80% Recall at Rank 1
90% Recall at Rank 3
Dataset: GTZAN Music Dataset

Requirements

The following Python libraries are required:

Numpy
Librosa
Matplotlib
Skimage

Install the required packages via pip:

pip install numpy librosa matplotlib scikit-image

References

An Industrial-Strength Audio Search Algorithm (Wang, 2003)

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.gitignore		.gitignore
README.md		README.md
eval.py		eval.py
fingerprint.py		fingerprint.py
identify.py		identify.py
main.py		main.py
utils.py		utils.py
visualise.py		visualise.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Audio Identification

Performance

Requirements

References

About

Releases

Packages

Languages

ruarim/audio_identification

Folders and files

Latest commit

History

Repository files navigation

Audio Identification

Performance

Requirements

References

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages