Skip to content

how to use

EunSeop Shin edited this page Apr 2, 2021 · 2 revisions

How to use

Index

What is Ocean?

Ocean은 Kubernetes 기반의 GPU 관리 및 실험 플랫폼입니다. Ocean에는 Volume, Instance, Job 3개의 Workload 타입이 있습니다.

Storage

Volume

Volume은 Ocean에서 사용되는 영구 개인용 데이터 저장소입니다. 쉽게 생각해서 Ocean에서 사용되는 HDD나, SSD로 생각할 수 있습니다.
생성된 Volume은 Instance와 Job에서 마운트되어 읽거나 쓸 수 있습니다. 기본적으로 Volume은 /root/volume/에 마운트되어 사용됩니다.

⚠️ Volume에 저장되지 않은 데이터는 언제든지 삭제 될 수 있습니다. /root/volume/을 작업디렉토리로 사용하세요.

Computing

Computing Workload는 프로그램이 돌아가는 환경입니다. Docker 기반의 환경으로 구성되며, 개발하고자하는 환경에 맞춰서 Docker Image를 선택하여 생성할 수 있습니다. 또한 선택된 Volume이 마운트되어 영구 저장소로서 사용됩니다. Volume과 별개로 각 Computing Workload에는 /dataset에 기본적인 데이터셋이 저장되어 마운트되어 있습니다. Computing Workload는 사용 목적에 따라 Instance와 job으로 구분됩니다.

Instance

Instance는 보통 1개의 GPU를 포함한 서버로서 개인용 PC처럼 사용이 됩니다.
기본적으로 GPU 1개 짜리 Instance만 사용할 수 있으며, 생성시 ssh연결이 가능한 Port번호가 같이 생성됩니다.
Instance에서는 주로 코드 개발 및 디버깅, 간단한 코드 학습이 가능합니다.

Job

Job은 Instance로는 돌릴수 없는 큰 크기의 모델학습 혹은 여러번의 같은 실험을 돌리기 위해 사용됩니다.
Job은 생성될 때 받는 Command만 실행하고 삭제되는 형태로 실행중에 접속을 통한 디버깅이 불가능합니다.
그러나 standard output을 기반으로한 실시간 로그를 확인 할 수 있습니다.

Sign-up and Sign-in

Ocean에 접속하면 먼저 Sign-in화면이 나타납니다. 회원가입을 하기위해 Sigin-in버튼 아래에 있는 Register now를 클릭합니다.

회원가입 정보를 입력하고 Sign-up 버튼을 클릭하여 회원가입을 완료합니다.

다시 Sign-in화면에서 로그인을 하면 profile페이지로 넘어갑니다.

현재는 관리자 승인을 받지 못해 왼쪽위에 경고문구가 표시되어 있습니다. 관리자의 승인이 있어야 Ocean의 기능을 사용할 수 있습니다. 관리자 승인을 요청하세요.

관리자가 회원가입을 승인하면 위와 같이 경고문구가 사라지고 로그인하면 기본적으로 Home으로 가게 됩니다.

Home

Home에서는 현재 ocean에서 사용중인 Workload와 Resource를 사용량을 확인 할 수 있습니다.

Use Volume

Create Volume

Volume은 영구 저장소로서 모든 Computing workload를 만들기 전에 필수적으로 필요합니다. 왼쪽 위 +버튼을 클릭하여 Volume을 생성합니다.

볼륨 이름과 크기를 설정한 후 Save 버튼을 클릭하여 생성합니다. 크기는 기본적으로 최대 100Gi까지 사용이 가능합니다.

생성한 직후 볼륨의 statusPending상태인데, 생성되기까지 약간의 시간이 필요합니다.

생성이 완료되면 statusBound로 변경됩니다.

Delete Volume

Use Instance

Create Instance

Instance는 코드 개발 및 디버깅을 위해 사용됩니다. 왼쪽 위 +버튼을 클릭하여 생성합니다.

name, image, instance type, volumes를 선택합니다.

  • name: Instance의 이름입니다.
  • image: Instance에서 사용될 이미지 입니다. 기본으로 제공되는 이미지 이외에 도커 허브나, 기타 공개된 이미지 또한 사용이 가능합니다.
  • instance type: Instance 하드웨어 사양입니다. 인스턴스 타입은 다음 문서를 참고하세요.
  • volumes: Instance에 마운트 될 Volume을 선택합니다.

save버튼으로 생성합니다.

status에 흰색 로딩바가 돌아가면 Instance 생성이 요청되어 생성중인 상황입니다.

status에 초록색 체크 표시가 뜨면서 Instance 생성이 완료되었습니다.

Instance의 상태, 이름, 사용중인 resouce, SSH Port, 마운트된 Volume이 확인 가능합니다.

ssh root@mlvc.khu.ac.kr -p <PORT NUM>으로 ssh 접속이 가능하며 기본 비밀번호는 root로 반드시 첫 로그인 후 비밀번호를 변경하시기 바랍니다.

Delete Instance

Instance가장 오른쪽 Action에 보이는 휴지통 버튼을 클릭하여 Instance를 삭제할 수 있습니다.

Quota Requests

처음 회원가입을하면 할당되는 GPU는 1개 입니다. 더 사용하기 위해서는 Quota Requests를 이용하여 할당량을 요청해야합니다.

먼저 오른쪽 위 아바타를 클릭하여 profile 화면으로 이동합니다.

아래쪽에 있는 Quota Requests옆의 +버튼을 이용하여 새로운 Quota Requests를 생성합니다.

사용하고 싶은 GPU 갯수, 사용 기간, 사용이유를 작성하고 Save버튼을 눌러 요청을 전송합니다.

GPU 갯수는 추가 요청 갯수가 아닌 총 요청 갯수입니다. i.e.) 1개 사용중, 8개 추가요청 => GPU에 9 적기

요청이 되면 status가 Pending으로 관리자의 승인을 기다리는 상태가 됩니다.

관리자가 요청을 승인하면 approved로 status가 변경되면서 GPU사용량이 증가됩니다.

Use Job