생체인식을 위한 생리학적 생체신호 DB구축 현황 분석
한윤희
1, 이명원
2,*1
Analysis of Physiological Bio-signal Database Construction Status and for Biometrics
Yun-Hee Han
1, Myung-Won Lee
2*요 약
본 논문은 생체인식을 위해 다양한 데이터베이스 구축 현황에 대해서 다룬다. 생체인식은 보안을 필요로 하는 각 분야에서 활발히 연구가 되고 있으며 많은 곳에 적용되어 쓰이고 있다. 하지만 기존 의 방법들은 여러 가지의 단점들이 존재하여 육안으로 보이지 않는 생체신호들이 새로운 수단으로 떠오르고 있다. 사람은 개인이 갖고 있는 유전자에 의하여 고유하게 식별되고, 이 유전자의 DNA와 RNA에서 단백질이 형성되고 이렇게 형성된 단백질이 심장 등 생체 기관의 형성에 기여하는 만큼, 심장의 활동 상태에 의하여 나타나는 심전도에서, 각 사람의 고유한 특성을 파악하여 인식하고 인증 하는 것이 논리적으로 가능하다고 할 수 있다. 따라서 본 논문에서는 육안으로 확인할 수 없는 생체 신호를 기반으로 한 DB 구축 현황에 대해서 분석 한다.
Abstract
Abstract This paper deals with various database for biometrics. Biometrics is being actively studied in various fields requiring security and is used in many places.
However, existing methods have various disadvantages, and invisible vital signals are emerging as new means. A person is uniquely identified by an individual's genes, proteins are formed in the DNA and RNA of this gene, and the protein thus formed contributes to the formation of a living organs such as the heart. In an electrocardiograms, It is logically possible to identify, recognize and authenticate the unique characteristics of each person. Therefore, in this paper, we analyze the status of database construction based on biometric signals that can not be visually confirmed.
Keywords : ECG, PPG, database, biometrics, analysis
1티클로버(주)
2조선대학교 IT연구소
*Corresponding Author : [email protected] 접수일자 : 2018. 05. 10.
1차 심사 : 2018. 06. 01.
2차 심사 : 2018. 06. 11.
심사완료 : 2018. 06. 14.
1. 서 론
현재의 정보화 사회는 개인의 정보를 안전하 게 취급하기 위한 인증의 기술이 급속하게 발 전하고 있다. 다양한 방법을 이용한 개인 인증 기술이 발전하고 있는데, 보편적으로 얼굴, 홍 채, 지문, 정맥 등 해부학적 지표를 통한 인증 기술이 발전하였다. 이러한 인증기술은 외형적 으로 표출된 해부학적, 물리학적형태의 정보를 이용하는 것이기 때문에 다양한 단점이 존재한 다. 얼굴의 경우 조명 및 환경과 영상의 각도에 민감하며, 변장, 세월이 흐름에 따라 생기는 얼 굴 변화, 성형 수술 등의 문제점이 발생한다.
홍채는 콘택트렌즈나 안경 착용자의 경우 인식 할 시 거부감이 생길 수 있으며, 시스템 구축 시 비용이 높다. 정맥은 손등의 피부 배경으로 부터 정맥이 분포한 부분을 추출하기가 쉽지 않고 하드웨어 구성이 복잡하고 소형화가 어려 워 시스템의 크기가 크고 구축비용이 높다. 지 문의 경우 지문이 손상되거나 없어진 경우 적 용이 불가능하고 잘리거나 메마른 피부, 붕대 사용, 굳은 피부의 경우 지문인식기 사용에 어 려움이 존재한다[1-4].
그림 1. 생체 인식 기술의 분류기준.
Fig. 1. Classification criteria of biometrics technology.
이러한 부분에서 생리학적 생체 신호를 이용 한 개인 인증은 보안에서 강인한 새로운 인증 방법을 제공하여 줄 것으로 기대된다. 생체 신 호는 생리학적 지표를 통한 신체 내부에서 발 생하는 신호로 외부로 보이지 않으며, 개인마다 신체적 특성에 따라 다르게 나타나기 때문에
보안에서 강인하다고 할 수 있다. 생리학적 지 표에 해당하는 생체 신호에는 심전도, 뇌전도, 안전도, 근전도, 피부전도도, 심탄도, 광용적 맥파 등 다양한 신호가 있다.
2. 국내 생리학적 생체신호 데이터베이스
2.1 KISA와 서울대학교병원
한국인터넷진흥원과 서울대학교병원에서는 생체신호별 개인 식별성 및 개인 인증률이 어 떻게 다른지에 대한 평가를 위한 데이터베이스 를 구축하였다[5]. 국내의 건강한 성인 50명을 대상으로 서로 다른 날 총 2회에 걸쳐 휴식 상 태의 뇌파, 심전도, 심탄도, 광용적 맥파를 반 복 측정하였다. 데이터 취득 환경은 일반 사무 실에 상온에서 앉은 상태에서 측정하였다. 카페 인이나 약물 섭취 여부, 수면시간, 실험 전후 심리 상태 등의 설문으로 조사하여 데이터베이 스를 구축하였다.
또한, 개인정보 보호를 위하여 측정된 데이터 는 디지털화하여 관리자가 제공하는 서버 컴퓨 터에 암호화된 압축파일로 보관하고 데이터베 이스에 저장된 지문 및 뇌파, 심전도 등 생체 신호는 대상자 식별번호로만 저장하여 관리하 였다.
그림 2. 한국인터넷진흥원과 서울대학교병원.
Fig. 2. KISA and Seoul National University Hospital.
2.2 아주대의과대학 ECG-ViEW
아주대 의과 대학에서는 1994년부터 2011 년까지 총 17년에 해당되는 심전도 데이터를 공개하였다[6]. 대상은 진료를 받은 환자와 정 상인이며 인원은 37만 명에 해당된다. 이
ECG-ViEW 데이터는 심전도 데이터 71만 건 과 성별, 나이, 심전도 측정 1년 전부터 측정 후 한 달 사이에 발생한 모든 진단명과 약 처 방 정보 3700만 건, 검사 결과 300만 건 등 다양한 임상 데이터를 가지고 있다.
ECG-ViEW는 심전도 데이터와 자료 추출 프 로그램, 프로그램 자료를 학술연구 목적으로 공 개하고 있다. 공개하기 전에 임상자료에서 개인 을 식별할 수 없도록 개인정보를 모두 삭제하 고, 민감한 진단명과 약 처방은 삭제하였다.
그림 3. 아주대의과대학, ECG-ViEW.
Fig. 3. Ajou University Medical Center, ECG-ViEW.
2.3 서울대학교
그림 4. 서울대학교, (a)심전도와 광용적 맥파 취득, (b) 운동 전·후에 취득, (c) 운동 중 취득.
Fig. 4. Seoul National University, (a) Acquisition of ECG and PPG, (b) Acquisition of before and after the workout, (c) Acquisition during exercise.
서울대학교에서는 심박 수 변화에 따른 영향 을 알아보기 위해 심전도와 광용적 맥파를 취 득하였다[7]. 장비는 Biopac MP150을 활용 하여 취득하였고 남자 21명, 여자 34명에 대해
서 취득하였다. 앉아서 쉬었을 때, 스탭퍼를 이 용한 운동을 하고 있는 상태, 운동 후를 기록하 였다. 취득된 데이터로 LDA를 통하여 심전도 신호에서 특징 선택 및 분류를 하여 사용자 식 별에 사용하였다. 그림4는 데이터 취득을 할 때의 상황을 보여준다.
그림 5. MIT-BIH 부정맥 데이터.
Fig. 5. MIT-BIH Arrhythmia.
3. 국외 생리학적 생체신호 데이터베이스
3.1 MIT-BIH Arrhythmia
보스턴의 베스 이스라엘 병원에서는 입원환 자와 외래환자로부터 수집한 24시간 동안 내원 한 심전도 기록 중 랜덤하게 23개의 기록을 선 택하여 사용하였다[8]. 총 47명에 해당하는 환 자이고 기간은 1975년부터 1979년으로 5년에 걸쳐서 진행되었다. 그림 5는 데이터의 일부분 을 보여주고 있다. 저장은 채널 당 초당 360샘 플로 10mV 범위의 11비트 해상도로 디지털화 하였다. 이 데이터베이스는 각종 저널 등에서의 인용횟수가 960회에 달할 정도로 많은 곳에서 사용하고 있다.
3.2 PTB Diagnostic
PTB 특수 증상 데이터베이스는 290명에 해 당되는 인원으로 17세에서 87세까지의 남성 209명과 여성 81명으로 총 549개의 레코드로 구성되어 있는 데이터베이스이다[9]. 각 레코드 에는 15개의 동시 측정된 신호가 포함되어 있고 기존의 12개의 리드와 함께 3개의 프랑크 리드 를 추가하여 취득되었다. 신호는 초당 1000 샘 플로 16비트 해상도로 디지털화되어 있다.
그림 6. PTB Diagnostic 데이터.
Fig. 6. PTB Diagnostic.
3.3 European ST-T
European ST-T 데이터베이스는 총 78명으 로 사람마다 360개의 특징을 가지고 있다 [10]. 각 대상은 심근 국소 빈혈이 진단 또는 의심되는 상태이다. ST 세그먼트 변화 367회 와 T파 변화 401회, 30초에서 분 단위 기간 동안 100마이크로 볼트에서 1밀리볼트 이상의 피크 변위가 포함되어 있다. 각 레코드는 2시 간동안 지속되며 2개의 신호를 포함하고 있고 각 신호는 초당 250으로 샘플링 되어있다. 헤 더 파일에는 사용된 리드, 환자의 연령, 성별 및 약물, 임상 소견 및 녹음 장비에 대한 정보 가 포함되어 있다.
3.4 Long-Term ST
허혈성 및 비 허혈성 ST에 대한 정확한 분류 가 가능한 알고리즘의 개발 및 평가를 위해 심 근 허혈의 구조 및 역학에 대한 기본연구에 쓰 기위해 데이터베이스를 구축하였다[11]. 이 데 이터베이스의 기록은 1994년부터 2000년 사 이에 미국과 유럽의 일상적인 임상 진료 환경 에서 얻은 Holter 기록에서 선택하였다. 기록 인원은 80명으로 개별 기록은 21시간에서 24 시간 사이이며 2개 또는 3개의 심전도 신호를 포함하고 있고 12비트 분해능으로 초당 250 샘플로 디지털화하였다.
그림 7. European ST-T 데이터.
Fig. 7. European ST-T.
그림 8. Long-Term ST 데이터.
Fig. 8. Long-Term ST.
3.5 MHEALTH Dataset
MHEALTH Dataset은 다양한 신체 활동을 수행하면서 다양한 사람들의 10명의 자원봉사 자의 몸에 대한 운동 및 생체 신호를 기록하였 다[12]. 센서는 피검자의 가슴, 오른쪽 손목 및 왼쪽 발목에 각각 부착하였다. 데이터 취득은 서있는 자세, 앉은 자세, 누워 있는 자세, 걷는 자세, 계단을 오르는 자세, 허리를 앞으로 숙인 자세, 정면으로 팔을 든 상태, 무릎을 굽힌 상 태, 자전거를 탄 상태, 조깅, 달리기, 점프를 하 는 12가지의 행동에 대해서 취득하였다.
그림 9. MHEALTH 데이터.
Fig. 9. MHEALTH Dataset.
3.6 Non-Invasive Fetal Electrocardiogram Non-Invasive Fetal Electrocardiogram 데이터베이스는 임신 21-40주 사이의 단일 과 목에서 얻은 55개의 다중 채널 복부 태아 심전 도 기록을 포함하고 있다. 기록에는 다양한 기 간이 있으며 매주 기록하였다[13]. 이 데이터 베이스의 목적은 신호 분리 알고리즘을 테스트 하는데 유용하다. 그림 10. 과 같이 속성은 흉 부 신호 2개, 3개 혹은 4개의 복부신호를 포함 하고 있고 16비트의 해상도를 가지고 있다.
4. 결과 및 고찰
국내의 생체신호 관련 데이터베이스를 분석 한 결과 KISA와 서울대학병원에서 진행한 개 인 식별용 데이터베이스의 경우 다른 기관이나 기업의 인식율 검증용으로 쓰이게 되며 구축된 데이터베이스의 일부분만을 사용할 수 있다. 그 리고 아주대학병원에서 공개해놓은 데이터의 경우는 17년 동안 수집한 많은 데이터를 공개 하고 있지만 개인 식별보다는 환자의 병의 유 무를 확인할 수 있는 데이터이다. 그리고 서울 대학교에 있는 연구실에서 취득된 데이터의 경 우 일반적인 상황과 운동 중, 운동 후에 취득되 었지만 공개되어지진 않고 있다. 국내에서 세 가지 이외에 공개되거나 학술 연구용으로 사용 할 수 있는 데이터베이스는 없다고 봐도 될 정 도로 관련 문헌이나 데이터가 공개되어 있지 않다.
그림 10. Non-Invasive Fetal Electrocardiogram.
Fig. 10. Non-Invasive Fetal Electrocardiogram.
국외의 생리학적 생체신호 관련 데이터베이 스의 경우 본 논문에서 다뤄진 데이터 이외에 도 많은 데이터가 Physionet에서 공개되어 있 다. 하지만 여기에 공개되어 있는 데이터베이스 도 의료행위를 통하여 취득된 심전도 데이터가 주를 이루고 있다. 생체신호 데이터는 외부 환 경 요인이나 사람의 상태에 따라 달라질 있기 때문에 개인 인증이나 인식을 위해서는 환경요 인이나 상태에 따라 데이터베이스를 구축해야 할 필요성이 있다.
5. 결 론
본 논문에서는 생체인식을 위한 생리학적 생 체신호 데이터 취득을 위해 국내외 생체신호 데이터베이스에 대한 현황을 파악하였다. 국내 의 경우에도 인식이나 인증을 위한 연구 및 데 이터베이스가 구축이 되고 있지만 비공개 데이 터베이스이며 외부 환경요인과 사람의 상태에 따라 신호가 어떻게 달라질 수 있는지 연구가 제대로 이뤄지고 있지 않다. 이에 대해 일상생 활에서 신체 내부에 발생하는 생체신호를 바탕 으로 개인 인증이나 식별을 위해서는 외부 환 경요인을 일정하게 유지한 상태에서 데이터베 이스를 구축하고 신체 내적 요인인 운동 상태 나 휴식 등 여러 가지 상황을 정의하고 데이터 베이스를 구축할 필요가 있다.
참고 문헌
0[1] 정연덕, “생체인식기술의 효과적 활용과 문제 점”, 지식재산21, Vol. 85, 2004.
0[2] 정연덕, “생체인식기술의 효과적 활용과 문제 점(II)”, 지식재산21, Vol. 86, 2004.
0[3] 문해민, 최규호, 반성범, “바이오신호기반 생체 인식 시스템 기술 분석”, 정보기술융합공학논 문지, Vol. 6, No. 1, 2016.
0[4] 김민구, 문해민, 반성범, “영상 감시 시스템에 서 바이오인식 기반 휴먼인식 기술 분석”, 정 보기술융합공학논문지, Vol. 2, No. 1, 2012.
0[5] 김지훈, 박광석, “생체신호를 이용한 개인인증 기술 및 DB 구축”, TTA Journal, Vol.
156, pp. 41-46, 2016.
0[6] 아주대의과대학, http://www.ecgview.org 0[7] Dongsuk. Sung, Jeehoon. Kim,
Myungjun. Koh, and Kwangsuk. Park,
“ECG Authentication in Post-Exercise Situation”, 39th Annual International Conference of the IEEE Engineering, pp. 446-449, 2017.
0[8] MIT-BIH Arrhythmia Database,
https://www.physionet.org/physiobank/
database/mitdb/
0[9] PTB Diagnostic Database,
https://www.physionet.org/physiobank/
database/ptbdb/
[10] EUROPEAN ST-T Database,
http://physionet.org/physiobank/databa se/edb
[11] Long-Terms ST Database,
http://physionet.org/physiobank/databa se/ltstdb/
[12] MHEALTH Dataset,
http://archive.ics.uci.edu/ml/datasets/
mhealth+dataset
[13] Non-Invasive Fetal Electrocardiogram Database,
http://physionet.org/physiobank/pn3/nif ecgdb/