text 갯수 분포
전처리(정리 필요)
단어 빈도 수
N-gram