전처리 테스트를 하기 위한 테스트 데이터입니다.
데이터 설명
구글 맵 리뷰 데이터입니다.
블루보틀 데이터는 3500개 정도의 블루보틀 전국 매장+ 일본 일부 매장의 구글 맵 리뷰 데이터입니다.
나노 테스트 데이터는 블루보틀 데이터 중 일본 매장의 리뷰 데이터를 전부 제거하고 한국 매장도 일부 삭제해 1,000 행으로 축소한 데이터입니다.
대형 테스트 데이터는 스타벅스 일부 매장, 할리스, 폴바셋, 투썸 등의 구글 맵 리뷰 데이터 중 100,000개를 추출한 데이터입니다. 속도 테스트 시 사용하면 좋습니다.
데이터 구조
테스트 방법
#상위100개정도 symbol, 불용어, 표제화 볼드처리 해두기