모바일 메뉴 닫기
 

데이터센터

자원관리정책

 

 

1. 저장공간은 그룹에 관계없이 계정당 100G씩 주어짐

 

2. 제출가능한 job의 수 
동시 수행(running)되는 job의 수는  현재 제한이 없으므로 GPU 개수만큼 가능함

인당 제출가능한 job의 수는 50개임

 

3. job의 실행 시간 

  - 3일까지 실행 가능함

  - 시간 옵션: --time="days-hours:minutes:seconds"

 

*** default 값 지정옵션이 없고 최대치(3일)가 default값으로 들어가므로 대기하는 유저들을 배려해

    실제 사용할 만큼의 시간옵션을 지정해주시길 바랍니다. 그래야 대기자의 입장에서 실제적인 대기 시간 추정이 가능합니다 ***

 

4. QoS 

  - 현재 3가지 QoS 임: base QoS (gpu 4개까지 사용가능), big QoS (gpu 개수 제한 없음), cpu QoS (node 4개까지 사용가능)

  - 선택 옵션: base QoS는 default이므로 옵션 지정 안해도됨, big QoS는 -q big_qos 옵션을 줘야 함

    실행 예) sbatch -p big-q big_qos --gres=gpu:4 --time=1:00:00 ~/myjob.sh

 

  - preemption 적용: 독점을 막고자 base partition에서는 base QoS job이 

    big QoS job보다 우선적으로 수행되도록 함.

    base partition은 인당 최대 4개의 GPU 사용하는 것을 원칙으로 하나, 유휴시 

    big QoS로 job을 돌릴 수 있음. 하지만 base QoS job이 대기하는 생길 경우 3시간 유예

    priority를 고려하여 preemption됨

 

5. Partition

  - 전체 3가지 파티션으로 나뉨: base partition, big partition, cpu partition

  - 선택옵션: base partition은 default 이므로 option 지정안해도 됨, big partition은 -p big 옵션을 줘야 함

 

(2022.4.13일 기준. 향후 변동 가능)