• 검색 결과가 없습니다.

User Clustering based on Genre Pattern for Efficient Collaborative Filtering System

N/A
N/A
Protected

Academic year: 2021

Share "User Clustering based on Genre Pattern for Efficient Collaborative Filtering System"

Copied!
2
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

한국컴퓨터정보학회 하계학술대회 논문집 제19권 제2호 (2011. 6)

171

효율적인 협업적 여과 시스템을 위한 장르 패턴 기반의 사용자 클러스터링

최자현, 하인애*, 홍명덕*, 조근식**

○*인하대학교 정보공학과, **인하대학교 컴퓨터정보공학과 e-mail: {cjhyun81,inay,hmdgo}@eslab.inha.ac.kr, [email protected]

User Clustering based on Genre Pattern for Efficient Collaborative Filtering System

Jahyun Choi, Inay Ha*, Myung-Duk Hong*, Geun-Sik Jo**

○*Department of Information Engineering, Inha University

**School of Computer & Information Engineering, Inha University

● 요 약 ●

협업적 여과 시스템은 사용자에 대한 클러스터링을 구축한 후, 구축된 클러스터를 기반으로 사용자에게 영화를 추천한다. 하지 만 사용자 클러스터링 구축에 많은 시간이 소요되고, 사용자가 평가한 영화가 피드백이 되었을 경우 재구축이 쉽지 않다. 본 논 문에서는 사용자 클러스터링의 재구축을 용이하게 하기 위해 빈발패턴 네트워크를 이용하여 클러스터링을 구축하고, 이를 협업 적 여과 시스템에 적용하여 영화를 추천한다. 구축된 클러스터를 통해 사용자 클러스터를 재구축시 소요되는 시간 비용을 줄이 면서, 전통적인 협업적 여과 시스템과 유사한 성능의 추천이 가능하게 되었다.

키워드: 협업적 여과(Collaborative Filtering), 빈발패턴네트워크(Frequent Pattern Networks), 클러스터링(Clustering)

I. 서론

협업적 여과[2] 시스템은 사용자에 대한 클러스터링을 구축 후, 구축된 클러스터를 기반으로 사용자에게 영화를 추천한다. 하지만 사용자 클러스터링 구축에 많은 시간이 소요되고, 사용자가 평가 한 영화가 피드백 될 때 사용자 클러스터링의 재구축이 쉽지 않다.

본 논문에서는 사용자 클러스터링의 재구축을 용이하게 하기 위해 빈발패턴 네트워크를 이용하여 사용자 클러스터링을 구축하고, 이 를 협업적 여과 시스템에 적용하여 영화를 추천한다. 본 논문에서 제안하는 사용자 클러스터링은 빈발패턴 네트워크를 이용하여 사 용자가 평가한 영화 분석하며, 사용자가 평가한 영화를 통해 선호 하는 장르 패턴을 추출한다. 추출된 장르 패턴과 유사한 사용자를 클러스터링 하고, 이를 기반으로 협업적 여과를 수행한다. 사용자 가 평가한 영화가 피드백 되었을 경우, 빈발 패턴 네트워크를 이용 하면 정보를 쉽게 누적시켜 패턴을 추출할 수 있게 된다[1]. 제안 된 방법을 통해 사용자 클러스터링의 재구축시 소요되는 비용을 감소시키면서 효율적으로 추천을 할 수 있다.

II. 관련 연구

영화 추천 시스템을 위해 영화 장르를 고려한 협업적 여과에 대 한 연구가 진행되고 있다[3][4]. [3]은 영화를 추천하기 위해 영화 장르에 가중치를 적용하여 사용자 클러스터링에 활용하였다. 단일

장르에 소속된 경우엔 추천 성능이 높지만, 다중 장르의 경우에서 는 추천 성능이 저하됨을 알 수 있었다. 그리고 [4]는 사용자의 선 호 장르를 분석 후, 선호 장르가 같은 사용자 집단을 이용하여 사 용자 클러스터링을 하였다. 하지만 위와 같은 연구들은 사용자가 평가한 영화가 피드백 될 경우, 피드백 된 정보를 반영하여 사용자 클러스터링을 구축하는 것이 용이하지 않다. 따라서 본 논문에서 는 사용자 클러스터링의 재구축을 용이하게 하기 위한 방법으로 빈발패턴 네트워크를 적용하여 사용자 클러스터링를 구축하였다.

III. 본론

1. 장르 패턴 기반의 사용자 클러스터링을 통한 향상된 협업적 여과 시스템

그림 1. 시스템 구조 Fig. 1. System Architecture

(2)

한국컴퓨터정보학회 하계학술대회 논문집 제19권 제2호 (2011. 6)

172

본 논문에서 제안하는 구조는 그림1과 같이 빈발패턴 네트워크 구축, 협업적 여과 및 선호도 예측을 통한 영화 추천으로 구성된 다. 사용자가 평가한 영화의 장르는 빈발패턴 네트워크에서 트랜 잭션으로 활용되며, 사용자의 장르 패턴을 추출하는데 사용된다.

추출된 사용자의 장르 패턴을 기반으로 패턴이 유사한 사용자의 클러스터링을 형성한다. 협업적 여과는 형성된 사용자 클러스터를 기반으로 수행된다. 피어슨 상관 계수를 이용하여 클러스터 내 사 용자 유사도를 계산하고 K명의 최근접 이웃을 선정하여 선정된 이웃을 기반으로 사용자의 평가되지 않은 영화에 대해 예측 후 N 개의 영화를 사용자에게 추천한다.

2. 실험 및 결과

실험데이터는 1,682편의 영화와 943명의 사용자로부터 생성된 MovieLens 데이터를 이용하였다. 영화는 18개 장르를 가지고 있 고, 80%의 학습데이터와 20%의 실험데이터로 구분하여 활용하 였다.

실험 평가는 제안된 방법을 적용한 추천 성능과 사용자 클러스 터링 재구축에 소요되는 시간 비교를 통해 이루어졌다.

표 1은 전통적인 협업적 여과 시스템과 논문에서 제안된 시스 템의 성능을 나타낸다.

Recall Precision F1

Basic_CF 0.319 0.835 0.462

Proposal_CF 0.322 0.843 0.466

표 1. Basic_CF와 Proposal_CF 성능 비교 Table 1. Comparing Basic_CF and Proposal_CF

F1의 성능지표에 있어 제안한 방법이 전통적인 방법에 비해 크 게 향상되지 않음을 알 수 있다. 이는 빈발패턴 네트워크를 이용하 여 사용자 장르 패턴을 추출할 때, 탐욕적인 방법을 이용하여 가장 선호되는 패턴만 적용하였기 때문이다. 이는 [3], [4]와 같이 장르 패턴에 가중치 적용을 통해 향상될 수 있다.

그림 2. 클러스터링 재구축 비교 Fig. 2. Comparing Re-clustering of User

본 논문에서 제안하는 방법을 통해 그림 2와 같이 초기 사용자 클러스터링 구축에 있어 전통적인 협업적 여과 기법과 비슷한 시 간비용이 들었지만, 사용자가 평가한 영화가 피드백 됨에 따라 사 용자 클러스터링의 재구축에 소요되는 비용이 크게 감소됨을 볼 수 있다.

IV. 결 론

본 논문에서는 장르 패턴을 기반으로 사용자 클러스터링을 구 축하여 협업적 여과 시스템에 활용하였다. 장르 패턴을 위해 사용 된 빈발패턴 네트워크는 초기 사용자 클러스터링 구축 시 전통적 인 협업적 여과 기법과 비슷한 시간비용이 들었지만, 사용자가 평 가한 영화가 피드백 됨에 따라 사용자 클러스터링의 재구축에 소 요되는 시간이 크게 감소됨을 확인할 수 있었다. 또한 전통적인 협 업적 여과 시스템보다 향상된 추천 성능을 보였다.

제안하는 시스템의 추천 성능 향상을 위해선 빈발패턴 네트워 크를 이용하여 사용자 장르 패턴을 추출할 때, 최상위 패턴뿐만 아 니라 발견된 패턴 전체를 이용하여 선호하는 장르 패턴을 결정하 는 것이 필요하다.

참고문헌

[1] K. Oh, J. Jung, I. Ha, G. Jo, “Discovering Association Rules using Item Clustering on Frequent Pattern Network”, Journal of The Korea Intelligent Information System Society, Vol. 14, No. 1, pp.1-17, 2008 [2] P. Resnick, N. Iacovou, M. Suchak, P. Bergstrom, J.

Riedl, "GroupLens: an open architecture for collaborative filtering of netnews”, ACM conference on Computer supported cooperative work, pp.175-186, 1994

[3] S. Lee, S. Park, “Performance Improvement of a Movie Recommendation System using Genre-wise Collaborative Filtering”, Journal of The Korea Intelligent Information System Society, Vol. 13, No.4, pp.65-78, 2007

[4] J. Wang, N. Zhang, J. Yin, “Collaborative Filtering Recommendation Based Fuzzy Clustering of User Preferences”, Fuzzy Systems and Knowledge Discovery, pp.1946-1950, 2010

참조

관련 문서

이에 본 논문에서는 협업 필터링 기반의 추천 시스템을 적용하여, 추 천된 콘텐츠에 대한 사용자 선호도를 예측하고 예측된 선호도와 실제 사용자의 선호도의 차이를

그러나 스팸에서만 등장하는 단어나 패턴은 스팸 필터링 시스템에 의해 걸러지지 않기 위해 지속적으로 변화하고 있기 때문에, 기존 기계 학습 메커니즘으로는 새로운

본 논문에서는 공장생산관리 서비스를 적용시키기 위해 공 장에 네트워크를 설치하고 유지하는 부분에서 장비의 이동성 및 빠른 생산 가동을 위해 유선 네트워크 통신

공격자가 사용자 및 서버의 비밀 정보를 모르고도 인증단계에서 전달되는 메시지들을 이용해서 사용자 혹은 서버를 가장할 수 있으면, 가장 공격에 성 공했다고

본 논문은 다양한 네트워크를 편리하게 분석할 수 있는 실용적인 유전 알고리즘 기반 경로탐색 시스템인 GAPS 를 제안하고자 한다. 이러한 목적을 위해 GAPS는

본 논문에서는, 이러한 플랫폼 제약성 및 시뮬레이션 제어 스크립트의 표준화를 위해, 웹 기반 3차원 시뮬레 이션 환경을 구축하고, 교육적 효과가 높은 Python 스

본 논문에서는 industrial IoT를 위해 장비의 변수 정보를 DB화하여 장비를 제어하는 데이터베이스 접근 기반 장비 제어 시스템을 제안한다.. 제안하는 시스템을

용하여 사용자의 취향이나 관심사를 실시간으로 반영할 수 있으며, GRU 언어 모델 기반의 학습을 통해 대중들 의 관심사 및 해당 영화의 내용을 분석할 수 있어