Skip to content

danielshz/nmf-applications

Folders and files

NameName
Last commit message
Last commit date

Latest commit

Ā 

History

5 Commits
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 
Ā 

Repository files navigation

Non-Negative Matrix Factorization (NMF)

IntroduĆ§Ć£o

A FatoraĆ§Ć£o de Matrizes NĆ£o-Negativas (NMF) Ć© um conjunto de algoritmos utilizado para anĆ”lise de problemas multivariĆ”veis e de Ć”lgebra linear, sendo tambĆ©m encarada como uma tĆ©cnica de aprendizado nĆ£o supervisionado amplamente usada em diversas Ć”reas como:

  • Processamento de sinais de Ć”udio
  • Astronomia
  • VisĆ£o computacional
  • BioinformĆ”tica
  • RecomendaĆ§Ć£o de sistemas
  • AnĆ”lise de documentos

O NMF consiste na fatoraĆ§Ć£o de uma matriz $V$ (nĆ£o negativa) em duas matrizes $W$ e $H$, onde todos os elementos sĆ£o nĆ£o-negativos. Embora nĆ£o haja uma soluĆ§Ć£o exata para essa fatoraĆ§Ć£o, uma aproximaĆ§Ć£o numĆ©rica pode ser utilizada.

FatoraĆ§Ć£o

IlustraĆ§Ć£o da aproximaĆ§Ć£o da matriz $V$ representada por duas matrizes menos $W$ e $H$, usando non-negative matrix factorization (Wikipedia).

Estrutura

Matriz de Entrada

A matriz $V$ (dimensĆ£o $m \times n$) contĆ©m valores multivariados nĆ£o-negativos, ou seja, maiores ou iguais a zero (ex: intensidade das cores de pixels em imagens).

Matrizes de FatoraĆ§Ć£o

  • $W$: ContĆ©m uma base otimizada, de dimensĆ£o $m \times r$, onde $r$ Ć© escolhido pelo usuĆ”rio.
  • $H$: Coeficientes de combinaĆ§Ć£o linear, de dimensĆ£o $r \times n$, usados para aproximar $V$.

A equaĆ§Ć£o de aproximaĆ§Ć£o pode ser escrita como: $$V \approx W \times H$$

AplicaƧƵes

Processamento de Imagens

A NMF pode ser usada para representar imagens como uma combinaĆ§Ć£o de partes bĆ”sicas (por exemplo, rostos e suas partes como olhos, nariz e boca), com valores nĆ£o-negativos tornando a interpretaĆ§Ć£o mais intuitiva.

FatoraĆ§Ć£o

RepresentaĆ§Ć£o de faces usando algoritmos de aprendizado non-negative matrix factorization (NMF), principal component analysis (PCA) e vector quantization (VQ). A base de dados utilizada tinha 2429 imagens de 19 X 19 pixels e foram fatoradas em 49 imagens base (Nature 1999)

AnƔlise de Texto

Em documentos textuais, a NMF pode ser aplicada para encontrar padrƵes semĆ¢nticos ao fatorar a matriz de frequĆŖncia de palavras em bases otimizadas e seus coeficientes.

FatoraĆ§Ć£o

UtilizaĆ§Ć£o do non-negative matrix factorization (NMF) para descobrir caracterĆ­sticas semĆ¢nticas de 30991 artigos da enciclopĆ©dia Grolier, considerando um vocabulĆ”rio de 15276 palavras para cada documento. Foram extraĆ­das 200 caracterĆ­sticas semĆ¢nticas desses documentos, sendo exibidas no canto esquerdo superior algumas delas

Algoritmo

O problema de NMF Ć© resolvido usando Gradiente Descendente Alternado (GD), onde as matrizes $W$ e $H$ sĆ£o atualizadas iterativamente para minimizar a funĆ§Ć£o de erro:

$$ \min | V - W H |_F^2 $$

As atualizaƧƵes seguem um esquema multiplicativo que garante a nĆ£o-negatividade dos elementos em cada iteraĆ§Ć£o.

CaracterĆ­sticas

  • ConvergĆŖncia local: O algoritmo nĆ£o garante encontrar o mĆ­nimo global, mas assegura uma convergĆŖncia local.
  • Esparsidade: Muitas vezes, as soluƧƵes encontradas sĆ£o esparsas, ou seja, muitas entradas de $W$ e $H$ sĆ£o zero, facilitando a interpretaĆ§Ć£o.
  • InterpretaĆ§Ć£o intuitiva: As matrizes fatoradas sĆ£o mais interpretĆ”veis devido Ć  restriĆ§Ć£o de nĆ£o-negatividade.