pos_neg_prediction.ipynb
학습——-
input file : 긍부정 리뷰가 같은 비율로 담긴 파일
input file의 20퍼센트는 테스트셋, 80퍼센트는 훈련셋으로 함
output file : ?
tokenize_korean_text
- 텍스트를 tokenize해서 adjective, verb, noun만 추출하는 함수
예측——
guess_good_or_bad
- 긍부정 예측 함수
- input file : 긍부정 리뷰가 담긴 파일
- output : 해당 파일을 복사한 csv에 ‘predict_label’ 이라는 컬럼을 만들어서 각 리뷰별 긍부정 예측값 씀
해결해야할 문제
- 정확도를 높이는 문제