Vol. 3, No. 1 (2010) pp. 38 − 42
SOFM 신경망을 이용한 수화 형상 인식
박경우†
Sign Language Shape Recognition Using SOFM Neural Network
Kyung-Woo Park†
Abstract
인간은정보전달을위하여언어이외에동작
,
표정과같은비언어적인수단을이용한다.
이러한비언어적인수단을정 확히분석할수있다면인간과컴퓨터간의자연스럽고지적인인터페이스를구축할수있게된다.
본논문은별도의센 서를부착하지않은단일카메라환경에서손형상을입력정보로사용하여손영역만을분할한후자기조직화특징지 도(SOFM: Self Organized Feature Map)
신경망알고리즘을이용하여손형상을인식함으로서수화인식을위한보다안 정적이며강인한인식시스템을구현하고자한다.
제안방법으로는피부색정보를이용하여배경으로부터손영역만을 추출한후추출된손영역의형상을인식한다(
전처리과정으로모델이미지의사이즈와압축및컬러에대한정보를정규 화시켰다).
또한인식효율을높이기위해SOFM
신경망알고리즘을적용함으로서보다안정적으로손형상을인식할 수있게되었으며,
손형상인식률에대한안전성과정확성을향상시킬수있었다.
그리고인식된손형상의의미를텍스 트로보여줌으로서사용자의의사를정확하게전달할수있다.
Key words
: Hand Recognition, SOFM, Sign Language Recognition, Neural Network
1. 서 론
최근사용자친화형유저인터페이스구현환경이 대두되면서인간과컴퓨터간의원활한상호작용의필 요성이커짐에따라인간의행동을분석하는연구가 많이수행되고있다
.
[1]인간은정보전달을위하여언어이외에동작
,
표정과같은비언어적인수단을이용한다.
인간과의사소통이자유스럽고보다지적인시스템을 제작하기위해서는무엇보다도이러한비언어적대화 수단을자동화함이필요하다
.
[2,3]그중에서도손은인 간에게있어서가장중요한도구의하나로그동작과 모양이의미하는바를인식하는것은정보시스템과 인간사이의자연스러운인터페이스를실현할수있다 는점에서오랜기간동안많은사람들의연구테마로 다루어져왔다.
그러나복잡한환경으로부터사람의손형상만을정확히추출하고인식하여의미있는입력정 보로사용하는것은어려운일이다
.
기본적으로정확한손영역분할을위한알고리즘이필수이며손형상의 분석과인식을위한빠른처리속도또한고려해야할 요소이다
.
본논문은별도의센서[4]를부착하지않은단일카메 라환경에서손형상을입력정보로사용하여손영역 만을분할한 후
SOFM(Self Organized Feature Map)
신경망알고리즘을이용하여손형상을인식함으로서 수화인식을위한보다안정적이며강인한인식시스템 을구현하고자한다
.
이는비장애인과장애인간상호편리하게대화할수있는인터페이스를제공하려하며
,
제안하는방법으로는카메라로들어오는영상을입력 영상으로하여피부색정보를이용해배경으로부터손 영역만을추출한후추출된손영역의형상을인식한 다
.
또한인식효율을높이기위해SOFM
신경망[5]알고리즘을적용함으로서보다안정적으로손형상을인 식할수있게되었으며
,
손형상인식률에대한안전성 과정확성을향상시킬수있었다.
그리고인식된손형상의의미를텍스트로보여줌으로서사용자의의사를 정확하게전달할수있다
.
광주보건대학병원전산과 (Dept. of Hospital Information Management Gwangju Health College)
†Corresponding author: kwpark@ghc.ac.kr
(Received : January 28, 2010, Accepted : March 20, 2010)
2. 피부색 정보를 이용한 손 영역 검출
칼라공간에서사람의살색분포는자연계의다른 물체와구분할수있는뚜렷한특징을가지고있으므 로색차성분을이용하면쉽게살색영역을추출할수 있다
.
[6]2.1. Skin Color Filtering
본논문에서는칼라정보만을이용하여손영역을 검출하기위해다음과같이제안한다
.
이방법은간단 하고빠르게RGB
공간안에서피부색을추출할수있다
. RGB
데이터의영상이입력되면피부색은RED
값이다른
GREEN
이나BLUE
보다크다고가정했다. (
식1)
과같이피부색에해당하는부분은그픽셀을1
로할당하여주고이이외에해당하는픽셀의위치에서는 살색이아닌영역으로판정하여
0
의값으로할당을하게된다
.
(
식1)
2.2. 손 영역 검출
입력영상에서피부색정보를이용하여손영역을 추출할때칼라필터를사용하더라도손만을정확히 추출하기란쉽지않다
.
본연구는칼라필터가적용되 고남아있는피부색정보의픽셀들은대부분손에속해있기때문에횡좌표
X
축으로피부색픽셀들의수 를계산하여배경영역으로부터손영역만을분리한다(labeling). (
그림2)
는입력영상에서의손영역을추출한것이다
.
3. 신경망을 이용한 손 형상 인식
본논문에서는손형상을정확히분석하고인식하기
위해서자기조직화특징지도
(SOFM:Self Organized
Feature Map)
란신경망알고리즘[7]을사용하였다.
본 논문에서제안한알고리즘구성은(
그림3)
과같다.
3.1. 제안한 신경망 알고리즘
본논문에서는손형상을정확히분석하고인식하기
위해서
SOFM
신경망알고리즘을사용한다. SOFM
은입력뉴런들
,
출력뉴런들,
그리고입·출력뉴런간에연결된시냅스들로구성되어있으며학습단계에서다차 원공간상의특징벡터로표현되는객체들이경쟁층에 서스스로유사한패턴끼리
2
차원의특징지도를조직화하여영역지도를형성한다
.
그리고인식단계에서는 이미학습단계에서훈련된연결가중치하에서미지의 특징벡터에대하여경쟁층에서반응이일어나는위치 를통하여해당클래스를인식하게된다.
또한,
입력패턴이주어졌을때출력뉴런들은경쟁을한후단한 개의출력뉴런만이승리하게된다
.
I
z( )x y
,1
(RED BLUE
≥ )(
RED GREEN
≥ )0 Otherwise
}⎩⎨
⎧
x y,
= ∑
그림 1.살색정보를이용한손영역추출
.
Fig. 1.
Hand area detection using skin color.
그림 2.입력영상의손영역추출
.
Fig. 2.
Hand area detection in input image.
그림 3.구성도.
Fig. 3.
System structure.
3.2. SOFM의 학습과정
SOFM
의학습과정은경쟁과정,
협동과정,
적응과정의세가지과정으로이루어진다
. 3.2.1.
경쟁(Competitive)
과정SOFM
에서경쟁층상에있는각뉴런은입력공간을구성하는
N
차원의특징벡터와연결강도에의하여연결된다
.
연결강도는0
에서1
사이(0~1)
로정규화된임의의값으로초기화되어있다
.
학습단계에서어떤입력패턴이주어지면모든뉴런의연결강도와의거 리를계산하여거리가최소가되는뉴런이승자가되 는경쟁의규칙을가진다
(
그림4).
3.2.2.
협동(Cooperation)
과정협동과정에서는경쟁과정에서의승자뉴런과인접 한이웃뉴런들만이제시된입력벡터에대하여학습 이허용된다
.
즉,
유사한특징패턴에민감하게경쟁층에서지도를형성하기위해승자뉴런은이웃한뉴런
을정해진함수에의하여결정하고그뉴런의연결강 도를갱신한다
.
승자만이출력을낼수있으며,
승자와그의이웃들만이연결강도를조정할수있도록한다
(
그림5).
3.2.3.
적응(Adaptation)
과정적응과정에서는승자뉴런과그와이웃한뉴런들이 특정한입력값에더욱민감해지도록활성함수를적 응시켜연결강도를갱신한다
.
이과정을통하여승자뉴런과인접해있는뉴런들은멀리떨어져있는뉴런
보다더강하게적응이된다
(
그림6).
3.3. SOFM
의학습3
단계1
단계:
연결강도 초기화N
개의입력으로부터M
개의출력뉴런사이의연결 강도를작은값의임의수로초기화한다.
초기의이웃반경은모든뉴런들이포함될수있도록충분히크게 잡았다가함수
h
ik( t )
에따라점차줄어든다.
2
단계:
입력벡터가제시되고경쟁입력벡터와모든뉴런들간의거리를계산한다
.
입 력과출력뉴런K
사이의거리는(
식2)
와같이계산되고그중에서가장최소값이선택된다
. (
그림7)
은(
그림
4)
의입력영상과모델영상사이의거리를계산하 여가장최소값(0)
이되는모델(
최상위모델)
을찾은것이다
.
그림 4.경쟁과정
.
Fig. 4
. Competitive course.
그림 5.협동과정
.
Fig. 5.
Cooperation course.
그림 6.적응과정
.
Fig. 6.
Adaptation course.
그림 7.입력영상과모델영상의거리
.
Fig. 7.
Input and model of distance.
(
식2)
여기서
X
(∈는시간t
에서의i
번째입력벡터이고W
j는시간
t
에서의i
번째입력벡터와j
번째출력뉴런사 이의연결강도이다.
모든연결강도와의거리를계산하여최소거리에있는출력뉴런을선택한다
(
그림7).
3
단계:
선택된뉴런과그이웃반경내의뉴런들의연결강도를갱신
(
협동과정과적응과정)
연결강도의갱신은
(
식3)
에의해갱신된다.
W
k= W
k+
η( t )
·h
ik( t )
·( X
(∈ −W
j) (
식3)
η
( t )
·h
ik( t )
는0
과1
사이의값을가지는이득항(Gain
Term)
인데시간이경과함에따라점차작아진다.
학습이득항에는지수함수적으로학습이득을감소시키는 함수
(
학습률감소함수)
를사용하며, (
식4)
와같다.
(
식4)
η0
:
초기학습이득, t :
학습반복회수T
1:
학습률시상수출력뉴런의편중학습과미사용문제를보완하기위 하여승리뉴런과함께이웃뉴런을학습하는데이때학 습의범위인σ
( t )
도역시학습이진행됨에따라학습이득항과같이감소시키는함수
(
이웃감소함수)
를사용하며
, (
식5)
와같다.
(
식5)
σ0
:
초기학습이웃의범위, t :
학습반복회수T
2:
이웃뉴런학습의시상수학습되는양을결정하는방법에는거리와무관하게 동일한이득항으로갱신하는방법과거리에따라학습 되는이득을다르게적용하는방법이있다
.
본논문에 서는거리에따라다른이득으로학습되는방법을적 용하였으며,
학습알고리즘에서시냅스Weight
학습함수는
(
식6)
과같다.
w
ij(t + 1) = w
ij( t ) + h(t) m
ij( x
i( t )
−w
ij( t )) (
식6) m
ij:
이웃뉴런의이득4. 실험결과
본논문에서는수화인식을하기위한손형상인식 시스템을구현하고자한다
.
먼저손형상을정확하게인식하기위해전처리과정으로모델영상의크기를
100*100
으로정규화했으며,
인식속도를높이기위해영상을
Gray Level
로변환하였다.
카메라로들어오는영상을입력정보로사용하였으며
,
피부색정보를이용하여영상의전체영역에서손영역만을분리하였다
.
분리된손영역으로부터손형상을정확하고안정적으
로인식하기위해
SOFM
신경망알고리즘을사용하였다
.
4.1. 손 형상 인식 결과
수화인식을위한손형상인식시스템은입력영상 을전처리과정에의해손영역을분할하고
,
분할된손영역을손형상으로인식한다
.
입력영상이들어오면DB
안에서입력영상의특징벡터와모델영상의특징벡터사이의거리를
SOFM
신경망알고리즘의경쟁과정
(
그림4),
학습과정(
그림5),
적응과정(
그림6)
을통 해비교하고,
거리가가장최소값(0)
이되는모델을찾는다
.
거리가가장최소값이되는모델이우리가찾는최상위모델로인식된다
.
또한이미부여한각영상의 수화의미도보여준다. (
그림8)
은최상위모델의손형상인식과수화의미이다
.
단
,
전체모델영상에속하지않을때의인식률은0%
이다.
이는최상위모델에가장인접한모델을최상i X
( ( ∈)= arg min
jX
( ∈– W
jη( ) η
t
0t T
1---
⎝
–
⎠⎛ ⎞
exp
=
σ( ) σ
t
0t T
1---
⎝
–
⎠⎛ ⎞
exp
=
그림 8.최상위모델로인식된손형상과수화의미
.
Fig. 8.
Hand shape recognition of a higher model and meaning sign language.
그림 9.모델영상에속하지않는영상에대한인식결과
.
Fig. 9.
About a result image that not belong model image.
위모델로선택하였기때문에모델영상과입력영상 간일치하지않으므로인식결과가
0%
가된다(
그림9).
5. 결 론
본논문에서는장애인과비장애인간원활한의사 전달을위하여수화를인식하고
,
수화의의미를전달하 는수화인식시스템을구현한다.
수화를인식하기위해서는손형상을인식해야한다
.
인식과정은첫째,
카메라로부터들어온입력영상의전체영역에서피부색 정보를이용하여손영역만을추출한다
(
전처리과정으로
100
개의전체모델영상에대해사이즈를100*100
으로정규화하였으며
,
연산속도를줄이기위해모델 영상을Gray Level(
회색조)
정규화시켰다).
둘째,
전체영상으로부터추출된손영역을손형상으로정확하고 안정적으로인식하기위해
SOFM(Self Organized Feature
Map)
신경망알고리즘을적용한다.
셋째, SOFM
알고리즘의경쟁과정
,
학습과정,
적응과정을통해입력영 상의특징벡터와모델영상의특징벡터의거리를계 산한후초기연결강도로부터점차연결강도의가중치 를부여함으로서입력영상과모델영상간의거리가 최소값(0)
이되는모델을찾고,
찾은최소값의모델을최상위모델로선택하며
,
최상위모델로인식한다(
그림10).
향후에는복잡한배경에서의정교한분할과조명변 화에강한방법과다른알고리즘과의접목으로손형 상인식에더좋은결과를낼수있도록노력을아끼지 않을것이다
.
참고문헌
[1] C. Ragael, Gonzalez and E. Richard, Woods “Dig- ital Image Processing”, Prentice Hall, 2002.
[2] E. Y. Kim, S. K. Kang, K. C. Jung, H. J. Kim, “Eye mouse:mouse implementation using eye tracking”, IEEE Consumer Electronics, 2005. ICCE. 2005 Digest of Technical Papers. International Confer- ence on 8-12 Jan. 2005.
[3] J. Segen and S. Kumar, “Shadow Gestures: 3D Hand Pose Estimation Using a Single Camera,”
CVPR99, vol. 1, pp. 479-485, Fort Collins, Colo- rado, June, 23-25, 1999.
[4] K. Imagawa, S. Lu and S. Igi, “Color-Based Hand Tracking System for Sign Language Recognition,”
Proceedings of International Conference on Auto- matic Face and Gesture Recognition, Killington, 1996.
[5] T. Kohonen, “Self-Organization and Associative Memory,” Springer Verlag, 1984.
[6] D. Chi, King N. Ngan “Face Segmentation Using Skin-Color Reference map in Videophone Applica- tions”, IEEE Transactions on Circuits and Systems for Vidoe Technology, vol.9, June 1999
[7] T. Kohonen, “Self-Organizing Maps,” Springer Series in Information Science. Vol. 30, Springer, Berlin, Heidelberg, New York, 1995, 1997, 2001, Third Extended Edition.
그림 10.수화인식을위한손형상인식시스템
.
Fig. 10.