교재링크(광고 아님): freelec.co.kr/book/인공지능을-위한-수학/

 

6-1 자연어 처리로 문서의 카테고리 알아맞히기

6-2 카테고리별 데이터 세트

 

 

6-1 자연어 처리로 문서의 카테고리 알아맞히기

자연어 처리(NLP, natural language processing)를 이용하여 카테고리 판별기라는 툴(tool)을 만들 것 같다. 카테고리 판별기는 어떤 문장이 어느 영역의(예를 들어 인문, 경제 등) 문장인지를 판별하는 프로그램이다. 이 절은 그에 대한 오버뷰 정도라 보면 되겠다.

그리고, 원서에서는 일본어에 대한 자연어 처리 내용이었겠으나, 번역을 하면서 로컬라이징을 한듯 보인다.

 

 

6-2 카테고리별 데이터 세트

프리렉 출판사 발간 책들 중 카테고리별로 몇몇을 발췌하여 데이터 세트를 만든 걸 설명하고 있다. 교재에 나온 깃헙(github) 사이트에 가면 파일이 있을 것 같다. 나중에 실습할 때 찾아봐야 겠다.

 

Posted by JMAN