Esse código converte um dataset gerado frame by frame de vídeos de palavras em libras, para uma linha com junção de diversos frames em x tempo, que será usado para o treinamento final. A quantidade de tempo e de frames pode ser definido no ponto inicial do código. Atualmente são 4 frames por 1 segundo em uma única linha.
- Giovanna Lima Marques
- Ricardo Augusto Coelho (https://github.com/tiorac)
- Tiago Goes Teles
- Wellington de Jesus Albuquerque
- Carrega todo o dataset de frame.
- Obtem todos os ids únicos de vídeo para o processo.
- Para cada ID único de vídeo:
- Obtem todos os frames com o ID.
- Calcula o quantos frames deve pular para a mesma linha.
- Do último para o primeiro frame, gera a linha do dataset de junção, obedecendo os pulos.
- Quando ter que gerar linha vazia, passa para a próxima palavra.
- Salva o dataset com as junções de linhas.
- Instale as dependências.
- Clone o repositório.
git clone https://github.com/ia-equipe-6/libras-dataset-transform.git
- Copia o dataset gerado na pasta do código clonado com o nome 'words_dataset.csv'
- Execute o conversor de dataset:
python .\libras-dataset-transform.py
A saída é um novo dataset chamado "libras_dataset.csv".
Utilize o código de normalização e treinamento (Em Breve)
Esse código foi testado na versão 3.9 do Python e utiliza as seguintes bibliotecas para conversão do dataset:
- Pandas
pip install pandas