ISBN 89-5884-670-4 98560
테라 스케일 가시화 시스템의 설계
(Design of Tera-scale Visualization System)
구 기 범 (
Gee Bum Koo)
voxel@kisti.re.kr
Visualization Team, Supercomputing Center
한 국 과 학 기 술 정 보 연 구 원
<제목 차례>
1. 서론 ··· 1 2. 국내외 동향 ··· 2 가. 가시화 전용 컴퓨팅 시스템 동향 ··· 2 나. 소프트웨어 동향 ··· 3 다. KISTI의 고성능 가시화 시스템 현황 ··· 3 3. 가시화 시스템의 설계 ··· 6 가. 가시화 시스템에 대한 요구사항 ··· 6 나. 소프트웨어 ··· 7 다. 가시화 시스템의 구성요소 ··· 8 라. 가시화 전용 컴퓨팅 시스템의 노드 구성 ··· 9 마. 출력장치의 구성 ··· 10 바. 기타 고려해야 할 사항 ··· 11 4. 벤치마크 ··· 12 가. 개요 ··· 12 나. 벤치마크 분야 ··· 12 1) 개별요소 벤치마크 ··· 13 2) 종합 성능측정 ··· 14 다. 벤치마크 결과 ··· 15 5. 결론 및 향후계획 ··· 18 6. 참고문헌 ··· 18<표 차례>
표 II-1. LLNL의 GAUSS 시스템 사양 ··· 2
표 II-2. SNL의 Red RoSE 시스템 사양 ··· 3
표 II-3 KISTI의 Onyx3400 사양 ··· 4
표 II-4. Onxy3400과 최신 서버의 CPU 성능 비교 ··· 4
표 II-5. Onyx3400과 일반 PC의 그래픽 성능 비교 ··· 4 표 II-6. KISTI 슈퍼컴퓨팅센터의 가시화 클러스터 사양 ··· 5 표 III-1. 가시화 시스템에서 운영 가능한 소프트웨어의 실행형태 ··· 8 표 III-2. 가시화 시스템의 구성요소 ··· 9 표 III-3. 가시화 전용 컴퓨팅 시스템의 노드 구분 ··· 9 표 III-4. 출력장치 비교 ··· 10
<그림 차례>
그림 II-1. LLNL의 가시화 미들웨어 스택 ··· 3 그림 IV-1. Quadrics 성능 (버퍼 크기 : 10K) ··· 16 그림 IV-2. Quadrics 성능 (버퍼 크기 : 100K) ··· 16 그림 IV-3. Quadrics 성능 (버퍼 크기 : 1M) ··· 17 그림 IV-4. Quadrics 성능 (버퍼 크기 : 100M) ··· 17-CPU
제조회사 AMD
Graphics
제조회사 NVIDIA
모델명 Opteron 모델명 QuadroFX 4500
Clock 2.4 GHz Vertex 181 M/sec
코어 수 Single Texel 10.8 G/sec
Node CPU 수 2 CPUs/node 네트워크 제조회사 Voltaire Node 수 256 형태 Infiniband 메모리 12 GB/node 대역폭 10 Gbps 표 II-1. LLNL의 GAUSS 시스템 사양
3 -CPU
제조회사 Intel
Graphics
제조회사 NVIDIA
모델명 Xeon EM64T 모델명 QuadroFX 3400
Clock 3.6 GHz Vertex 117 M/sec
코어 수 Single Texel 4.2 G/sec
Node CPU 수 2 CPUs/node 네트워크 제조회사 Voltaire Node 수 264 형태 Infiniband 메모리 4 GB/node 대역폭 10 Gbps
표 II-2. SNL의 Red RoSE 시스템 사양
CPU 소켓 수 20 코어/소켓 1 이론 성능 16 GFLOPS 메모리 6 GB 그래픽 Pipe 수 5 vertex/sec N/A pixel/sec 1.25G pixel/sec/카드 디스크 용량 432 GB 대역폭 50 MB/sec 전후
표 II-3 KISTI의 Onyx3400 사양
Onyx3400 서버
MIPS
Model MIPS R12000
Intel
Model Intel Xeon
Clock 350 MHz Clock 2.66 GHz
성능 700 MFLOPS 성능 21.28 GFLOPS
표 II-4. Onxy3400과 최신 서버의 CPU 성능 비교
시스템 일반 PC SeeMore
제조회사 NVIDIA ATI Onyx 3400
모델명 QuadroFX 5500 FireGL V7350 InfiniteReality3
메모리 1 GB / 256-bit 1 GB / 256-bit 256MB+frame buffer Vertex 처리 225M triangle/sec 1200M vertices/sec N/A
Pixel 처리 15.6G texel/sec 9.6G pixel/sec 1.25 Gpixel/sec
OpenGL 지원 v2.0 v2.0 v1.2
5 -CPU 소켓 수 16 코어/소켓 1 이론 성능 83.2 GFLOPS 메모리 96 GB 그래픽 Pipe 수 8 vertex/sec 171Mvertex/sec/pipe pixel/sec 6.3 Gpixel/sec/pipe 표 II-6. KISTI 슈퍼컴퓨팅센터의 가시화 클러스터 사양
-업무 실행 방식 및 요구사항 소프트웨어
대용량 데이터 가시화
• Interactive MPI job 지원 • Multi-GPU 동시 사용 • 외부와의 고속 네트워크 연결 • 가상현실 입력 장치
자체 개발
데이터 압축
• Batch MPI job 지원 • 대용량 메모리 • Multi-GPU 동시 사용 자체 개발 OptIPuter • 외부와의 고속 네트워크 직접 연결 • 오디오 장비 • 고해상도 HD 카메라 직접 연결 SAGE DMX • 고해상도 데스크톱 화면 • Highly interactive task • 오디오 장비 DMX 가시화 애플리케이션 • 다수의 GPU를 동시에 이용한 실시간 분산 렌더링 • 대용량 메모리 (SMP 노드 포함) • 가상현실 입력장치 일반 가시화 애플리케이션 기타
Render Farm • 다수의 CPU 장시간 이용 • Batch 스케쥴러 Steering • 슈퍼컴퓨터와 연계 • 다수의 GPU를 동시에 이용한 실시간 분산 렌더링 • 대용량 메모리 • 가상현실 입력장치 GPGPU • 다수의 GPU 장시간 이용 표 III-1. 가시화 시스템에서 운영 가능한 소프트웨어의 실행형태
9 -종 류 개 요 특이사항 전용 컴퓨팅 시스템 • 다수의 CPU와 고성능 GPU • 대용량 메모리 • 대용량 외부 저장장치 • Interconnection network 클러스터 출력장치 • 프로젝터 • 대형 스크린 입체영상 출력 지원 외부 네트워크 • 슈퍼컴퓨터와 가시화 시스템을 연결하는 초고속 네 트워크 가상현실 입력장치 • 가상현실 애플리케이션의 원활한 실행을 위한 3차원 입력장치 음향 시스템 • 5.1 채널 이상의 음향 입/출력 시스템 표 III-2. 가시화 시스템의 구성요소 그룹 명칭 노드 명칭 용도 외부 서비스 로그인 노드 • 외부 사용자 접속 • 프로그램 컴파일 및 테스트 관리 서버 • 시스템 관리 전용 서버 웹 서버 • 시스템 현황 등 제반 정보 제공 (외부 사용자) 게이트웨이 게이트웨이 • 내부 노드의 외부 네트워크 접속 지원 애플리케이션 서버 라이선스 서버 • 상용 애플리케이션을 위한 라이선스 서버 스케쥴러 • Batch job 스케쥴링 전용 서버 입력장치 서버 • 헤드 트래커, 완드 등의 입력장치 전용 서버 애플리케이션 마스터 • User interactive 애플리케이션 실행의 시작점 컴퓨팅/렌더링 노드 • 병렬 계산 / 병렬 렌더링을 수행하는 노드의 집합 컴포지터 컴포지터 • 시스템의 그래픽 성능을 향상시키기 위한 장비 일체 • 출력장치(프로젝터)와 직접 연결 파일 서버 파일 서버 • 내부 노드에 파일 서비스 제공 표 III-3. 가시화 전용 컴퓨팅 시스템의 노드 구분
스크린과 프로젝터 LCD 모니터 해상도 비교적 낮음 높은 해상도 구현 가능 가격 중저가 ~ 고가 저가 공간 소요 넓은 공간 소비 좁은 공간 소비 입체영상 지원 가능 미지원 표 III-4. 출력장치 비교
13
15
-►
그림 IV-1. Quadrics 성능 (버퍼 크기 : 10K)
17
-그림 IV-3. Quadrics 성능 (버퍼 크기 : 1M)
z z z z