페이징 - Index of /2711

디스크를 사용하는 주된 이유의 하나는 바로 가상 메모리다. 페이징^Paging은 대표 적인 가상 메모리 관리 기법으로 컴퓨터의 메모리 공간을 일정 크기(페이지 단위)⁰⁵로 나누어 관리하며, 지금 당장 사용하지 않는 메모리 공간은 디스크와 같이 좀 더 큰 공간에 저장하고 사용한다. 일반적으로 컴퓨터가 사용할 수 있는 메모리 공간은 사 용하는 비트의 크기에 따라 결정되는데, 예를 들어 32비트 CPU는 사용할 수 있는 최대 주소 공간이 2의 32승까지다. 당연히 64비트 CPU는 2의 64승만큼 사용할 수 있다.

요즘은 메모리 가격이 싸져서 4GB 정도의 메모리는 쉽게 확보하지만, 2의 64승만 큼의 메모리를 사용하는 경우는 드물다. 페이징은 이렇게 실제 메모리 크기가 사용 할 수 있는 메모리 공간보다 작을 때 하드 디스크와 같은 외부 저장 장치를 가상의 메모리처럼 사용할 수 있게 해준다. 간단히 설명하면 하드 디스크를 메모리, 그리 고 메모리를 CPU 캐시로 사용한다고 할 수 있다.

예를 들어, 컴퓨터가 32비트 CPU를 사용한다면 사용할 수 있는 전체 메모리 공간 은 약 4GB가 된다. 하지만 컴퓨터에 설치된 메모리가 1GB밖에 안 된다면 1GB 이 상의 프로그램이나 데이터는 사용할 수 없다. 이때 페이징을 사용하면 1GB는 실 제 메모리에, 그리고 나머지 3GB는 디스크에 할당하여 사용한다. 실제 메모리나 디스크에 있는 가상 메모리는 페이지^Page라는 단위로 관리되며 일반적으로 4KB가 기준 단위다.

CPU가 데이터를 처리하기 위해서는 데이터가 실제 메모리에 적재되어야 하는데 만약 처리해야 하는 데이터가 디스크에 저장되어 있으면 실제 메모리에 있는 페이

05　 일반적으로 페이지 크기는 4KB다.

14 1장 I/O

지 중에서 사용하지 않는 하나를 다시 디스크에 저장하고, 필요한 데이터 페이지 를 디스크에서 가져와서 비워진 실제 메모리 공간에 적재하는 방식으로 동작한다.

동작하는 기본 원리는 캐시와 거의 같다고 볼 수 있다. 필요한 데이터가 캐시에 없 으면 이를 ‘캐시 미스’라고 해서 메모리에서 데이터를 가져와서 캐시에 저장한다.

캐시 미스와 비슷하게 실제 메모리에 필요한 데이터가 없을 때는 ‘페이지 폴트^Page

Fault’라고 하며 페이지 폴트가 발생하면 실제 메모리에서 페이지 하나를 비우고 필

요한 페이지를 디스크에서 가져와 메모리에 적재하는 과정을 거친다. 다음 그림은 개인 컴퓨터에서 사용하고 있는 메모리에 대한 현황이다.

[그림 1-6] 윈도우 작업 관리자를 통해 확인할 수 있는 시스템 자원량

실제 메모리의 용량(4GB)에 비해서 사용하는 프로그램이 많지 않아서 페이지 폴트 가 거의 발생하지 않고 있다. 페이징 기법은 성능의 이점뿐 아니라 실제 물리적인 메모리보다 더 큰 메모리 공간을 사용할 수 있도록 해주므로 기본적으로는 사용하 는 것이 좋다. 그리고 페이징 기법 때문에 고려해야 할 부분도 거의 없어서 이론적 인 부분에 대한 이해는 많이 필요하지 않다.

전체 3199MB 중에서 1861MB가 여유 공간이다.

struct my_data data[10];

fd = open("./data.dat", O_RDWR);

// 100번째 오프셋으로 이동한 뒤 데이터를 읽어온다.

01 lseek(fd, 100, SEEK_SET);

for(i=0; i<10; i++) 02 read(fd, &data[i], 20);

……

// 읽어온 데이터를 처리한다.

for(i=0; i<10; i++) {

data[i].a = data[i].b + data[i].c;

06　 각 함수의 사용 방법은 MSDN이나 man 명령으로 통해서 쉽게 알 수 있으므로 자세한 설명은 생략한다.

void *file_in_memory;

fd = open("./data.dat", O_RDWR);

01 fstat(fd, &statBuf);

17 1장 I/O

02 file_in_memory = mmap(NULL, statBuf.st_size, PROT_READ | PROT_WRITE, MAP_SHARED, fd, 0);

03 data = (struct my_data *)(file_in_memory + 100);

// 읽어온 데이터를 처리한다.

for(i=0; i<10; i+ +) {

data[i].a = data[i].b + data[i].c;

data[i].b = data[i].b + data[i].c / 10;

18 1장 I/O

셋부터 사용할 구조체 데이터가 저장되어 있으므로 구조체 배열로 사용할 포인터 변수인 data의 주소값을 ‘mmap의 반환 주소 + 100’으로 지정한다. [코드 1-5]에 서 03 부분이 이 내용이다. 이제 data 변수에 저장된 주소는 파일에서 100번째 오 프셋부터 시작하는 구조체 데이터의 가장 처음을 가리키게 되고 data 변수를 배열 처럼 사용하여 파일에 기록된 내용을 읽고 쓸 수 있다.

물론 페이지에 매핑된 영역을 더는 쓸 필요가 없다면, munmap 함수를 호출해서 해당 메모리 영역을 해제해야 한다. 운영체제가 페이지 폴트가 발생할 때 또는 주 기적으로 내용이 바뀐 페이지를 디스크에 기록하므로 파일에 데이터를 기록하는 것은 신경 쓸 필요가 없다.

[코드 1-5]는 페이징 기법을 사용하는 간단한 예시지만, 페이지를 활용하는 방법 은 실로 무궁무진하다. 메모리처럼 사용하므로 사용 방법이 매우 직관적이며 파일 내용에 대한 공유도 쉽다. 또한, 읽기 전용의 파일이나 내용일 때는 메모리 공간을 덜 차지하고 여러 프로세스가 동일한 내용을 공유할 수 있어서 공간 효율성을 극대 화할 수 있다. 예를 들어, 운영체제는 읽기만 하는 공용 라이브러리 코드의 경우 메 모리 공간에 한 번만 적재하고 해당 라이브러리 코드를 요청하는 모든 프로세스에 동일한 페이지 주소를 알려준다. 즉, 100개의 프로세스가 하나의 표준 라이브러리 를 사용하며 표준 라이브러리 코드 크기가 4KB라면, 메모리에 적재되는 표준 라이 브러리 코드의 전체 크기는 4KB × 100이 아니라 그냥 4KB가 된다.

문서에서 Index of /2711 (페이지 24-29)