꼬꼬마에서는 위와 같은 배제 조건을 이용한 형태소 분석후보 생성 방법뿐만 아니라, 생성된 분석 후보중에서 더 가능성이 높은 분석 후보를 확률 모델(Probabilistic Model)을 이용해서 선택한다. 본 확률 모델은 띄어쓰기 오류와 형태소 분석 호부 선택을 동시에 최적화 하는 분석 후보를 찾는 것으로 기존의 방법들보다 발전된 것이다. 자세한 모델은 파일을 통해서 확인할 수 있다.
동적 프로그래밍을 이용한다고 해도, 분석 후보의 수는 줄어들지 않기 때문에 분석 후보의 수를 적당한 순으로 유지하면서 최종 후보로 확장해 나가야 한다. 이를 위해 어느정도 길이 이상의 어절에 대해서는 도중에 부적합할 것이라고 여겨지는 분석 후보에 대한 가지치기 (Pruning)을 수행하면서 성능 개선을 시도하였다. will be updated...
아래 그림은 1), 2), 3), 4)를 포함하는 과정을 수행하는 프로그램 흐름을 모식도로 보여준다.
출처 : [꼬꼬마, 한글 형태소 분석기] http://kkma.snu.ac.kr/documents/index.jsp?doc=algorithm