Saladin’s Blog

Keyword Extraction Algorithm

Posted on: 3월 31, 2008

 

Text Grinder의 추출 알고리즘을 좀 더 강력하게 하기 위해서는 공부가 필요하다. 지금의 분석수준가지곤 제대로된 서비스가 될 수 없다! Text Grinder의 긴글을 넣으면 문서에 관련된 키워드를 뽑아내는 단순해 보이는 것이 코어펑션이라고 하면 혹자는 볼 거 없네 라고 코웃음 칠지도 모른다. 뭐 실제로 많은 사람들이 그런 반응을 보인다. 

하지만 그 코웃음이 지구상에서 문명인간이 개발한 모든 알고리즘 중에서 가장 실현 가능하기 어려운 분야가 바로 언어분석이라는 것을 알고 치는 코웃음인지는 두고볼일이다.ㅋ 컴퓨터가 인간이 쓴 문서의 내용과 전체 맥락을 우리 사람 처럼 바로 이해하길 바라는가? 

괜히 국내 최고의 기술진을 갖춘 Daum에서 구글에도 없는 문맥키워드 추출 API를 내놓고서 욕듣는게 아니다. 그만큼 어려운 분야다. 만일 완벽한 문맥분석이 개발되어 이것이 음성과 연동되고, 방대한 언어DB가 가능하다면, 검색엔진은 이용자가 원하는 단 몇개의 완벽한 결과만을 찾아줄것이고, 로봇의 언어이해 인공지능은 앉아서 떡먹기다. 

여튼 공부 공부.. 

참조 URL

http://withzest.tistory.com/tag/KEA

Advertisements

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중

일자별 보기

3월 2008
« 2월   4월 »
 12
3456789
10111213141516
17181920212223
24252627282930
31  

최근 사진

%d 블로거가 이것을 좋아합니다: