2. 1. text의 주관성, 객관성 판단
-> SO polarity (Pang and Lee,
2004; Yu and Hatzivassiloglou,
2003)
2. 주관성을 지닌 text의 긍정, 부
정 판단
-> PN polarity (Pang and Lee,
2004; Turney, 2002)
3. 얼마나 긍정/부정인지 판단
예) 조금 긍정, 약간 긍정, 아주
긍정
-> strength of text PN polarity
(Pang and Lee, 2005; Wilson et
al., 2004)
3. Polarity classification
Bo Pang and Lillian Lee, A Sentimental Education: Sentiment Analysis
Using Subjectivity Summarization Based on Minimum Cuts
4. WordNet
synset
- 영어의 의미 어휘
목록
- synset (유의어 집
단)으로 분류하여
단어집과 유의어,
반의어 사전의 배
합을 만듬.
- 심리학 교수인 조
지 A. 밀러가 지도
하는 프린스턴 대
학의 인지 과학 연
구소에 의해 만들
어졌고, 유지되고
있음.
9. Lp, Ln, Lo -> vectorial representation -> label Ci
-> 2개의 classifier 생성
1. Positive / not Positive 로 분류하는 classifier
2. Negative / not Negative 로 분류하는 classifier
Classifier
“Supervised learner”
Positive
∩
10. Lp, Ln, Lo -> vectorial representation -> label Ci
-> 2개의 classifier 생성
1. Positive / not Positive 로 분류하는 classifier
2. Negative / not Negative 로 분류하는 classifier
Classifier
“Supervised learner”
Negative
∩
11. Lp, Ln, Lo -> vectorial representation -> label Ci
-> 2개의 classifier 생성
1. Positive / not Positive 로 분류하는 classifier
2. Negative / not Negative 로 분류하는 classifier
Classifier
“Supervised learner”
Objective
∩ ∩
∪
12. Precision = Tp / (Tp + Fp)
: True라고 예측한 것 중에서 실제로 true인 것의 비율
Recall = Tp / (Tp + Fn)
: 실제로 true인 것중에 내가 얼마나 맞췄는지
(Tp : true라고 예측했는데 실제로 true,
Fp : true라고 예측했는데 실제로 false,
Fn : false라고 예측했는데 실제로 true,
Tn : false라고 예측했는데 실제로 false)
K를 정하려면?
K
Precision
Recall
Small
Training set
noise
(Andrea Esuli1 and Fabrizio Sebastiani2, Determining Term Subjectivity and
Term Orientation for Opinion Mining)