Virtual news production using Tacotron2 and Wav2Lip
- 목적: 인공지능 기술을 사용하여 음성 합성 및 Deepfake 기술이 적용된 뉴스를 서비스
- 결과: Virtual news를 1분 30초 안에 생성하여 제공 (AWS g4dn.xlarge)
##설치방법
- Docker을 활용 -> docker-compose -f docker-compose-dev.yml up
- GPU 환경 사용 시, NVIDIA Container Toolkit 설치:
- NVIDIA Container Toolkit 설치 가이드
- 백엔드: Spring
- 프론트엔드: React
- 데이터베이스: MySQL (AWS RDS), Docker Volume (AWS EFS)
- 인공지능: Python, tensorflow-tts(tactron2), wav2lip
- 네트워크: Nginx 기반의 리버스 프록시
- 컨테이너화: Docker, Docker-compose, AWS ECS
- Docker을 활용한 MSA 아키텍처의 설계 및 구현
- nginx의 리버스 프록시를 활용한 네트워크
- Spring을 활용한 백엔드 API 개발
- AWS ECS를 통한 배포 (docker-compose-prod.yml)
- tensorflow-tts(tactron2)를 활용한 음성합성
- wav2lip을 활용한 입모양 deepfake
- 라이브러리 충돌: Docker와 MSA 아키텍처를 도입하여 서비스를 독립적인 컨테이너로 분리
- 컨테이너 간의 네트워크 연결 문제: Docker-compose의 네트워크 기능과 Nginx의 리버스 프록시 기능 활용
- 클라우드 환경 배포: AWS ECS를 사용하여 다양한 인스턴스를 효율적으로 관리 및 서비스 과부하 해결, AWS ALB로 로드 밸런싱 구현