Uma análise extensa de funções wavelet para a tarefa de reconhecimento facial

Esse projeto foi parte do trabalho de conclusão de curso na Universidade Federal Rural de Pernambuco

Neste projeto de aprendizagem de máquina, são combinados métodos de extração de características como o PCA e o LDA em conjunto com a Transformada Wavelet Discreta para a tarefa de reconhecimento facial. Uma análise estatística de diferentes funções de decomposição wavelet é realizada em 7 diferentes bases de dados com diversas características. Um total de 4 classificadores foram utilizados para medir a capacidade do método de extração.

Tecnologias Utilizadas

Linguagem Python v. 2.7;
Numpy e OpenCV;
Sklearn para construção dos modelos;
Biblioteca PYWT para análise das funções.

Métodos de Extração de Características Utilizados

Principal Component Analysis (PCA);
Linear Discriminant Analysis (LDA);
Discrete Wavelet Transform (DWT).

Visualização dos 5 primeiros eigenvectors após o PCA (meio) e a dispersão entre classes após LDA (baixo) com 5 classes diferentes da base de dados Georgia Tech (topo).

from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.decomposition import PCA
pca_m = PCA(n_components=50)
pca_m.fit(training_imgs)
lda = LinearDiscriminantAnalysis(n_components=100)
lda.fit(training_imgs, classes_treino)

Imagem original (esquerda) e decomposição em um nível pela DWT (direita) com as funções de haar (topo-esquerda), bior3.7 (baixo-esquerda), db5 (topo-direita) e sym16 (baixo-direita).

import pywt
import cv2
img = cv2.imread(file)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
coeffs = pywt.wavedec2(img, wavelet, level=1)

Combinações de Métodos Utilizados

Apenas DWT;
DWT + PCA;
DWT + LDA;
DWT + PCA + LDA, nessa ordem.

Classificadores Utilizados

Nearest Neighbor Classfier (1-NN): Classificador de distância;
Gaussian Naive Bayes (GNB): Classificador probabilístico;
Support Vector Machines (SVM): Classificador com máquina de vetores suporte;
Random Forest Classifier (RFC): Classificador com árvores de decisão.

Bases de Dados Consideradas

As funções wavelets que maximizam a acurácia para a tarefa de reconhecimento são então avaliadas com um intervalo de confiança de 95%. Foram consideradas mais de 4.000.000 de taxas de acurácia média para avaliação e os experimentos mostraram que algumas dessas funções não são adequadas para a tarefa. No entanto, outras funções são significativamente diferentes para os testes específicos considerados na pesquisa. A função wavelet rbio3.1 da família Reverse Biorthogonal foi a que mais apresentou resultados de acurácia mais altos se comparada com as outras funções.

Execução

Requisitos

Python 2.7;
Bases de dados com imagens alinhadas e cortadas com detecção da face.

Primeiro, tenha certeza que as bibliotecas sklearn, pywt, cv2, csv, numpy e math estão instaladas corretamente. Caso não esteja, instale-as utilizando o pip pela linha de comando, onde <library> é qualquer uma das bibliotecas descritas:

pip install <library>

Execução

No arquivo training_test_divider.py modifique o número de classes da base de dados avaliada e quantos holdouts separar para treino e teste para o algoritmo. Modifique também o caminho da base de dados no sistema. Por padrão, 33% das imagens de cada classe são consideradas para treino e o restante para testes. Porém, caso deseje mais ou menos, basta alterar a linha 52.

Execute tal arquivo:

python training_test_divider.py

No arquivo __main__.py altere a linha 181 para o nome do arquivo .txt gerado pela execução do arquivo anterior e quais níveis utilizar na linha 190.

Execute tal arquivo, pela linha de comando, enquanto dentro da pasta principal do projeto:

python __main__.py

Por padrão, os níveis 1-6 e todas as combinações de métodos serão executadas para os arquivos .txt já existentes, com apenas 1 holdout. Arquivos .csv serão gerados com os resultados para todos os wavelets da biblioteca pywt.

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
.idea		.idea
RESULTADOS		RESULTADOS
pics		pics
.gitignore		.gitignore
AR.txt		AR.txt
CASIA.txt		CASIA.txt
CASIA_Transform.py		CASIA_Transform.py
CroppedLFW.txt		CroppedLFW.txt
GTech.txt		GTech.txt
LFW.txt		LFW.txt
LFWTransform.py		LFWTransform.py
ORL.txt		ORL.txt
README.md		README.md
Util.py		Util.py
Util.pyc		Util.pyc
YTBFaces.txt		YTBFaces.txt
YaleB.txt		YaleB.txt
_main_.py		_main_.py
faces95.txt		faces95.txt
pca_variance.py		pca_variance.py
training_test_divider.py		training_test_divider.py
waveletfaces_method.py		waveletfaces_method.py
ytbfaces_script.py		ytbfaces_script.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Uma análise extensa de funções wavelet para a tarefa de reconhecimento facial

Tecnologias Utilizadas

Métodos de Extração de Características Utilizados

Combinações de Métodos Utilizados

Classificadores Utilizados

Bases de Dados Consideradas

Execução

Requisitos

Execução

About

Languages

fabriciop1/waveletfaces

Folders and files

Latest commit

History

Repository files navigation

Uma análise extensa de funções wavelet para a tarefa de reconhecimento facial

Tecnologias Utilizadas

Métodos de Extração de Características Utilizados

Combinações de Métodos Utilizados

Classificadores Utilizados

Bases de Dados Consideradas

Execução

Requisitos

Execução

About

Topics

Resources

Stars

Watchers

Forks

Languages