Blei, D. M. (2012). Probabilistic topic models. Communications of the ACM55(4), 77-84.

Probabilistic Topic models의 키포인트

LDA(Latent Dirichlet Allocation)의 기본 아이디어

(사람들이 글을 쓸 때, 문헌에 어떤 주제가 들어갈 지 대략 생각하고, 주제를 선정해 주제에 포함될 단어를 선정하고 그 단어를 문헌에 추가한다고 가정)

2단계 프로세스를 통해 단어 생성

  1. 주제에 대한 분포에서 무작위로 주제 선택