-
Notifications
You must be signed in to change notification settings - Fork 2
how to use
Ocean은 Kubernetes 기반의 GPU 관리 및 실험 플랫폼입니다.
Ocean에는 Volume
, Instance
, Job
3개의 Workload 타입이 있습니다.
Volume은 Ocean에서 사용되는 영구 개인용 데이터 저장소입니다. 쉽게 생각해서 Ocean에서 사용되는 HDD나, SSD로 생각할 수 있습니다.
생성된 Volume은 Instance와 Job에서 마운트되어 읽거나 쓸 수 있습니다. 기본적으로 Volume은 /root/volume/
에 마운트되어 사용됩니다.
⚠️ Volume에 저장되지 않은 데이터는 언제든지 삭제 될 수 있습니다./root/volume/
을 작업디렉토리로 사용하세요.
Computing Workload는 프로그램이 돌아가는 환경입니다.
Docker 기반의 환경으로 구성되며, 개발하고자하는 환경에 맞춰서 Docker Image를 선택하여 생성할 수 있습니다. 또한 선택된 Volume이 마운트되어 영구 저장소로서 사용됩니다.
Volume과 별개로 각 Computing Workload에는 /dataset
에 기본적인 데이터셋이 저장되어 마운트되어 있습니다.
Computing Workload는 사용 목적에 따라 Instance와 job으로 구분됩니다.
Instance는 보통 1개의 GPU를 포함한 서버로서 개인용 PC처럼 사용이 됩니다.
기본적으로 GPU 1개 짜리 Instance만 사용할 수 있으며, 생성시 ssh연결이 가능한 Port번호가 같이 생성됩니다.
Instance에서는 주로 코드 개발 및 디버깅, 간단한 코드 학습이 가능합니다.
Job은 Instance로는 돌릴수 없는 큰 크기의 모델학습 혹은 여러번의 같은 실험을 돌리기 위해 사용됩니다.
Job은 생성될 때 받는 Command만 실행하고 삭제되는 형태로 실행중에 접속을 통한 디버깅이 불가능합니다.
그러나 standard output을 기반으로한 실시간 로그를 확인 할 수 있습니다.
Ocean에 접속하면 먼저 Sign-in
화면이 나타납니다. 회원가입을 하기위해 Sigin-in
버튼 아래에 있는 Register now
를 클릭합니다.
회원가입 정보를 입력하고 Sign-up
버튼을 클릭하여 회원가입을 완료합니다.
다시 Sign-in
화면에서 로그인을 하면 profile
페이지로 넘어갑니다.
현재는 관리자 승인을 받지 못해 왼쪽위에 경고문구가 표시되어 있습니다. 관리자의 승인이 있어야 Ocean의 기능을 사용할 수 있습니다. 관리자 승인을 요청하세요.
관리자가 회원가입을 승인하면 위와 같이 경고문구가 사라지고 로그인하면 기본적으로 Home
으로 가게 됩니다.
Home
에서는 현재 ocean에서 사용중인 Workload와 Resource를 사용량을 확인 할 수 있습니다.
Volume
은 영구 저장소로서 모든 Computing workload를 만들기 전에 필수적으로 필요합니다.
왼쪽 위 +
버튼을 클릭하여 Volume
을 생성합니다.
볼륨 이름과 크기를 설정한 후 Save
버튼을 클릭하여 생성합니다. 크기는 기본적으로 최대 100Gi까지 사용이 가능합니다.
생성한 직후 볼륨의 status
는 Pending
상태인데, 생성되기까지 약간의 시간이 필요합니다.
생성이 완료되면 status
가 Bound
로 변경됩니다.
Instance
는 코드 개발 및 디버깅을 위해 사용됩니다. 왼쪽 위 +
버튼을 클릭하여 생성합니다.
name
, image
, instance type
, volumes
를 선택합니다.
- name:
Instance
의 이름입니다. - image:
Instance
에서 사용될 이미지 입니다. 기본으로 제공되는 이미지 이외에 도커 허브나, 기타 공개된 이미지 또한 사용이 가능합니다. - instance type:
Instance
하드웨어 사양입니다. 인스턴스 타입은 다음 문서를 참고하세요. - volumes:
Instance
에 마운트 될Volume
을 선택합니다.
save
버튼으로 생성합니다.
status
에 흰색 로딩바가 돌아가면 Instance
생성이 요청되어 생성중인 상황입니다.
status
에 초록색 체크 표시가 뜨면서 Instance
생성이 완료되었습니다.
Instance의 상태, 이름, 사용중인 resouce, SSH Port, 마운트된 Volume이 확인 가능합니다.
ssh root@mlvc.khu.ac.kr -p <PORT NUM>
으로 ssh 접속이 가능하며 기본 비밀번호는 root
로 반드시 첫 로그인 후 비밀번호를 변경하시기 바랍니다.
Instance
가장 오른쪽 Action
에 보이는 휴지통 버튼을 클릭하여 Instance
를 삭제할 수 있습니다.
처음 회원가입을하면 할당되는 GPU는 1개 입니다. 더 사용하기 위해서는 Quota Requests
를 이용하여 할당량을 요청해야합니다.
먼저 오른쪽 위 아바타를 클릭하여 profile
화면으로 이동합니다.
아래쪽에 있는 Quota Requests
옆의 +버튼을 이용하여 새로운 Quota Requests
를 생성합니다.
사용하고 싶은 GPU 갯수, 사용 기간, 사용이유를 작성하고 Save
버튼을 눌러 요청을 전송합니다.
GPU 갯수는 추가 요청 갯수가 아닌 총 요청 갯수입니다. i.e.) 1개 사용중, 8개 추가요청 => GPU에 9 적기
요청이 되면 status가 Pending으로 관리자의 승인을 기다리는 상태가 됩니다.
관리자가 요청을 승인하면 approved로 status가 변경되면서 GPU사용량이 증가됩니다.
Copyright (c) All right reserved. EunseopShin(@kairos03)