A FatoraĆ§Ć£o de Matrizes NĆ£o-Negativas (NMF) Ć© um conjunto de algoritmos utilizado para anĆ”lise de problemas multivariĆ”veis e de Ć”lgebra linear, sendo tambĆ©m encarada como uma tĆ©cnica de aprendizado nĆ£o supervisionado amplamente usada em diversas Ć”reas como:
- Processamento de sinais de Ɣudio
- Astronomia
- VisĆ£o computacional
- BioinformƔtica
- RecomendaĆ§Ć£o de sistemas
- AnƔlise de documentos
O NMF consiste na fatoraĆ§Ć£o de uma matriz
IlustraĆ§Ć£o da aproximaĆ§Ć£o da matriz
A matriz
-
$W$ : ContĆ©m uma base otimizada, de dimensĆ£o$m \times r$ , onde$r$ Ć© escolhido pelo usuĆ”rio. -
$H$ : Coeficientes de combinaĆ§Ć£o linear, de dimensĆ£o$r \times n$ , usados para aproximar$V$ .
A equaĆ§Ć£o de aproximaĆ§Ć£o pode ser escrita como:
A NMF pode ser usada para representar imagens como uma combinaĆ§Ć£o de partes bĆ”sicas (por exemplo, rostos e suas partes como olhos, nariz e boca), com valores nĆ£o-negativos tornando a interpretaĆ§Ć£o mais intuitiva.
RepresentaĆ§Ć£o de faces usando algoritmos de aprendizado non-negative matrix factorization (NMF), principal component analysis (PCA) e vector quantization (VQ). A base de dados utilizada tinha 2429 imagens de 19 X 19 pixels e foram fatoradas em 49 imagens base (Nature 1999)
Em documentos textuais, a NMF pode ser aplicada para encontrar padrƵes semĆ¢nticos ao fatorar a matriz de frequĆŖncia de palavras em bases otimizadas e seus coeficientes.
UtilizaĆ§Ć£o do non-negative matrix factorization (NMF) para descobrir caracterĆsticas semĆ¢nticas de 30991 artigos da enciclopĆ©dia Grolier, considerando um vocabulĆ”rio de 15276 palavras para cada documento. Foram extraĆdas 200 caracterĆsticas semĆ¢nticas desses documentos, sendo exibidas no canto esquerdo superior algumas delas
O problema de NMF Ć© resolvido usando Gradiente Descendente Alternado (GD), onde as matrizes
As atualizaƧƵes seguem um esquema multiplicativo que garante a nĆ£o-negatividade dos elementos em cada iteraĆ§Ć£o.
- ConvergĆŖncia local: O algoritmo nĆ£o garante encontrar o mĆnimo global, mas assegura uma convergĆŖncia local.
-
Esparsidade: Muitas vezes, as soluƧƵes encontradas sĆ£o esparsas, ou seja, muitas entradas de
$W$ e$H$ sĆ£o zero, facilitando a interpretaĆ§Ć£o. - InterpretaĆ§Ć£o intuitiva: As matrizes fatoradas sĆ£o mais interpretĆ”veis devido Ć restriĆ§Ć£o de nĆ£o-negatividade.