• 검색 결과가 없습니다.

Design and Implementation of Media Control Application Based on Speech and Motion Recognition

N/A
N/A
Protected

Academic year: 2021

Share "Design and Implementation of Media Control Application Based on Speech and Motion Recognition"

Copied!
2
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

한국컴퓨터정보학회 동계학술대회 논문집 제28권 제1호 (2020. 1)

77

● 요 약 ●

본 논문에서는 미디어 플레이어 제어가 어려운 지체 장애인들을 위해 음성과 동작 인식 기반의 미디어 제 어 애플리케이션을 설계하고 구현한다. 이 애플리케이션은 사용자의 음성 인식을 위해 먼저 명령어를 정하 고, 명령에 매핑되는 키워드 관리하는 데이터 모델을 생성한다. 그리고 이 데이터 모델을 JSON 파일로 정제 하여 사용한다. 그리고 키넥트 센서를 활용한 동작 인식은 오른쪽 어깨를 중심으로 오른쪽 손목의 좌표값을 인식함으로써 동작 인식 제어 컨트롤을 실행한다. 오른쪽 어깨를 기준점으로 오른쪽 손목의 좌표값으로 현재 팔의 위치를 정하고, 영역 1~4 에 따라 동작을 인식한다.

키워드: 미디어 제어(media control), 음성인식(speech recognition) , 동작인식(motion recognition)

음성 및 동작 인식 기반의 미디어 제어 애플리케이션 설계 및 구현

이원주*, 간명해O, 강민수*, 김태완*, 임정주*, 강지우*

O인하공업전문대학 컴퓨터정보과,

*인하공업전문대학 컴퓨터정보과

e-mail: [email protected], [email protected]

Design and Implementation of Media Control Application Based on Speech and Motion Recognition

Won Joo Lee*, Kan MyeonghaeO, Kang Minsu*, Kim Taewan*, Im Jeongju*, Kang Jiwoo*

ODept. of Computer Science, InHa Technical College,

*Dept. of Computer Science, InHa Technical College

I. Introduction

Fig. 1. 연도별 등록 장애인 현황

최근 유튜브, 영화, 드라마 같은 각종 미디어 콘텐츠를 이용하는 사용자가 증가하고 있다. 시각 장애 또는 청각 장애 사용자를 위해 구글 실시간 자막 앱이나 맞춤형 TV 등이 제작되고 있다. 하지만 지체장애인을 위한 서비스는 부족하다. 2017년 12월 기준으로 국내 등록장애인은 약 255만명으로 전국 주민등록 인구대비 4.9%이다.

특히 65세 이상 노년층 장애인은 2016년 43.4%에서 2017년 45.2%로 지속적으로 증가하고 있다. 15개 장애 유형중에 지체장애인 비율은 49.3%로 가장 높다[1].

따라서 본 논문에서는 지체장애인들을 위해 음성과 동작 인식을 기반으로 미디어 콘텐츠 제어를 할 수 있는 애플리케이션을 설계하고 구현한다. 이 애플리케이션은 키넥트 센서의 음성 및 동작 인식 기능을 활용한다[2].

II. 미디어 제어 애플리케이션 설계 및 구현

본 논문에서는 음성과 동작 인식 기반의 미디어 제어 애플리케이션 을 설계하고 구현한다. 이 애플리케이션은 키넥트 센서의 음성 및 동작 인식 기능을 활용한다. 먼저 사용자의 음성 인식을 위해 먼저 명령어를 정하고, 명령에 매핑되는 키워드 관리하는 데이터 모델을 생성한다. 그리고 이 데이터 모델을 JSON 파일로 정제하여 사용한다.

명령어와 키워드를 입력하면 JSON으로 정제해주는 폼을 생성함으로 써 JSON 파일 관리를 쉽게 할 수 있다. 이때 인식된 음성이 정제된 JSON 파일과 매핑되면 해당 명령어를 실행한다. 그림 2는 명령어와 키워드를 매핑한 예이다.

(2)

한국컴퓨터정보학회 동계학술대회 논문집 제28권 제1호 (2020. 1)

78

Fig. 2. Mapping example of command and keyword

키넥트 센서를 활용한 동작 인식은 오른쪽 어깨를 중심으로 오른쪽 손목의 좌표값을 인식함으로써 동작 인식 제어 컨트롤을 실행한다.

모션 인식 범위는 그림 3과 같다.

Fig. 3. Motion recognition range

오른쪽 어깨를 기준점으로 오른쪽 손목의 좌표값으로 현재 팔의 위치를 정하고, 그림 3의 해당 영역 1~4 에 따라 동작을 인식한다.

즉, 오른쪽 어깨를 기준으로 오른쪽 손목이 어깨보다 x값이 작고 y값이 크면 1영역이고, x값이 크고 y값이 크면 2영역이다. 그리고 오른쪽 어깨를 기준으로 오른쪽 손목이 어깨보다 x값이 작고, y값이 작으면 3영역이고, x값이 크고, y값이 작으면 4영역이다.

Fig. 4. Media control application execution

그림 4는 미디어 제어 애플리케이션의 실행화면이다. 그림 4에서 U_LR 값을 받을 때 오른쪽 팔을 1영역에서 2영역으로 이동하며 원을 계속 그리면 1초씩 후로 계속 돌리고, 오른쪽 팔을 2영역에서

1영역으로 이동하며 원을 계속 그리면 1초씩 전으로 계속 돌린다.

D_LR 값을 받을 때 오른쪽 팔을 3영역에서 4영역으로 이동하면 10초 후로 돌리고, 오른쪽 팔을 4영역에서 3영역으로 이동하면 10초 전으로 돌린다. DL_UL 값을 받을 때 왼쪽 팔을 3영역에서 1영역으로 이동하면 동영상 재생을 정지한다.

III. Conclusions

본 논문에서는 음성 및 동작 인식으로 미디어 플레이어를 제어할 수 있는 애플리케이션을 설계하고 구현하였다. 이 애플리케이션은 키넥트 센서의 음성 및 동작 인식 기능을 활용하였다. 향후 연구과제로 는 음성 인식의 정확성과 인식률을 높여 사용자의 불편을 최소화하는 것이다. 그리고 스마트폰의 음성 인식 기능과 카메라를 활용하여 모바일 환경에서도 활용할 수 있도록 구현하는 것이다.

REFERENCES

[1] "장애인현황 통계정보보고서," 보건복지부, Dec. 2018.

[2] J. K. Ko, "Kinect Programing," Korea Electronics Association, 2012.

수치

Fig.  4.  Media  control  application  execution

참조

관련 문서

모션 인식에 기반한 드론 제어 기술은 가속도를 측정해 물체의 방향 변화를 감지하는 센서와 지표면을 기준으로 가속도와 기울기를 이용한 가속도 센서를

엘리베이터 제어 시스템은 스트리밍서비스, 사용 자 입력 서비스 그리고 엘리베이터 상태 정보 제공 서비스를 포함하고 있으며 Elevator Control Viewer, Media Streaming

음성인식을 위해 음성인식 라이브러리 Snowboy를 사용하였으며, 음성정보를 지정된 위치의 좌표로 변환하여 터틀봇을 이동시키는 시스템을 설계하여 구현한다.. 2.2

본 논문에서는 Kinect Framework를 사용하여 모니터 제어 기 능을 개발한다. 구현

Test 설계 및 작성 : 정해진 우선순위에 따라 Test를 설계하고, 그 설계를 위한 테스트 케이스를 구현 하는 단계이다.. 테스트 케이스는 각

본 논문에서는 풍력발전기의 실시간 상태 정보를 계측하며 원격 제어 기능을 제공하는 무선 센서 네트 워크 기반의 풍력발전기 모니터링 및 제어 시스템을

본 논문에서는 이미지를 통해 상품을 검색하고 이에 대한 상품 구입을 하는 쇼핑몰 시스템을 설계, 구현한다. 쇼 핑몰 서비스에서, 이미지는 다양한 형태로 얻게 된다.

정지선과 횡단보도 인식 애플리케이션을 위한 사용자 인터페이스(UI)는 그림 8과 같다. 이때 인식결과값은 인식에 성공하면 결과란에 인식유형이 표시되고