상품평의 사연어 처리 분석과 자동분류를 통한 소비자 선호도 파악 시스템
CASE STUDY #12
순 서
연구의 필요성 및 목적
시스템 구조
상품평 사전구축
상품평 분석
실험결과
질문 답변
연구의 필요성 및 목적
연구의 필요성
– 인터넷 상의 전자상거래가 활발하게 이루어지고 있다.
– 온라인상의 판매자와 구매자의 정보교환 및 의견표출을 위한 상품평(댓글)이 있다.
– 상품평에는 구매자의 평가가 담겨있다.
– 정량적인(별점)과 정성적인(상품평)이 관련이 있는 것 인가.
연구의 목적
– 정성적인 소비자의 선호도를 자동적으로 파악할 수 있는 시스템의 구현과 평가
순 서
연구의 필요성 및 목적
시스템 구조
상품평 사전구축
상품평 분석
실험결과
질문 답변
시스템 구조
순 서
연구의 필요성 및 목적
시스템 구조
상품평 사전구축
상품평 분석
실험결과
질문 답변
상품평 사전구축
vp 29%
p 36%
u 6%
n 23%
vn 6%
실험에 사용된 분류코드 분포 분류코드 설명
vp Very positive (매우 긍정)
p Positive
(긍정)
u Unknown
(미정)
n Negative
(부정) vn Very negative
(매우 부정)
상품평 사전구축
분류코드 단어
vp 훌륭하다, 우수하다, 잘, 좋다, 발휘, 추천, 친절, 기분, 역시, 참, 대만족, 강추, 적극, 부 럽다, 감사, 놀랍다, 깔끔, 최고, 시원시원, 고급, 최상, 완벽, 매력
p 그립, 괜찮다, 맘(마음)에 든다, 부드럽다, 빠르다, 만족, 반가운, 넓다, 쓸만하다, 무난 하다, 이만한, 튼튼, 견고, 저렴, 싸다, 안정, 선명하다, 즐겁다
u 별로, 고민, 모르겠어요, 상관없다
n
투박한, 불가, 해오름-_-, -_-;, 아닌지, 맘에 안드네요, 아쉬운 점, 없다, 글쎼다, 감수, 부담, 걱정, 맛이갔다, 비싸다, 흐리멍텅, 망설이다, 약간, 수긍, 조심, 어둡다, 각오, 실
망, 힘들다, 거슬리다, 참다, 뿌엏다, 좁다, 우려, 걱정, 어렵다, 부담, 부족, 부실하다
vn
아직도, 취소, 우류, 자주, 짜증, 영, 짱나는, 한참, 지루, 찜찜하다, 후회, 비추, 황당, 화 나다, 팍, 피해, 심해다, 거짓, 무성의, 치밀다, 강제, 불만족, 불편, 물리다, 환불, 열받
다, 심하다, 거슬리다
Extreme 전혀, 그런데, 많이, 아주, 정말, 전부, 다, 절대, 너무, 넘, 무진장, 훨, 훨씬, 모두, 엄청,
상품평 사전구축
분류
단어
n p u vn vp투박 2 0 0 0 0
하 80 108 13 22 71
디자인 2 3 0 0 4
. 168 140 44 30 100
가볍 1 1 0 0 4
키보드 1 1 0 0 3
ncn 344 390 52 91 353
sy 13 15 1 0 0
sl 3 2 0 1 3
jp 18 15 3 2 18
순 서
연구의 필요성 및 목적
시스템 구조
상품평 사전구축
상품평 분석
실험결과
질문 답변
상품평 분석
) ( A B B
A
Demster-Schafer증거이론
가볍 1 1 0 0 4
디자인 2 3 0 0 4
디자인+가볍 0.01 0.01 0 0 0.08
키보드 1 1 0 0 3
디자인+가볍
+키보드 0.01 0.01 0 0 0.0316
순 서
연구의 필요성 및 목적
시스템 구조
상품평 사전구축
상품평 분석
실험결과
질문 답변
실험결과
n p u vn vp 평균
정확률 0.74 0.57 0.09 0.09 0.51 0.40 재현율 0.33 0.36 0.01 0.01 0.29 0.20
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80
단어
실험결과
n+vn p+vp u 평균
정확률 0.72 0.83 0.09 0.54
제현율 0.34 0.66 0.01 0.33
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80
단어 분류축소
실험결과
n p u vn vp 평균 0제외
평균 정확률 0.26 0.76 0.00 0.00 0.02 0.21 0.35 재현율 0.20 0.77 0.00 0.00 0.04 0.20 0.33
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90
품사정보
실험결과
n+vn p+vp u 평균 0제외
평균
정확률 0.25 0.82 0.00 0.35 0.53
재현율 0.20 0.80 0.00 0.33 0.50
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90
품사정보 분류축소
실험결과
n p u vn vp 평균 0제외
평균 정확률 0.74 0.67 0.00 0.00 0.30 0.34 0.57 재현율 0.29 0.55 0.00 0.00 0.16 0.20 0.33
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80
단어/품사정보
실험결과
n+vn p+vp u 평균 0제외
평균
정확률 0.64 0.86 0.00 0.50 0.75
재현율 0.29 0.71 0.00 0.33 0.50
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90