Wednesday, January 06, 2010

한글 형태소분석기 moHANA 사용 후기

한글 stemmer를 검색하다가
CMU LTI김재동 형과 강인호 박사님이 개발에 참여하신
moHANA를 알게 되었다.

아는 사람들이 만든 것이고,
학술용 free beta version이 있어서 돌려봤는데,
일단 잘 돌아간다.

더 자세한 사용기는 추후에 좀 더 써 보고...

moHANA를 사용하다가 생긴 setting 문제...

input encoding은 euc-kr이어야 한다.
환경변수 LANG=ko_KR.eucKR, LC_ALL=ko_KR.eucKR로 세팅하고, 사용하는 터미널의
encoding을 EUCKR로 세팅해야 함

No comments: