Komoran

public class Komoran implements Cloneable

KOMORAN core 클래스입니다.

Constructors

Komoran

public Komoran(String modelPath)

modelPath 디렉토리에 있는 모델 파일들을 로딩하여 객체를 생성합니다.

modelPath 디렉토리에는 pos.table, observation.model, transition.model, irregular.model 파일이 포함되어 있어야 합니다. 각 파일은 ModelBuilder를 통해 생성됩니다.

Parameters:
  • modelPath – 모델 파일들이 포함되어 있는 디렉토리 경로

Komoran

public Komoran(DEFAULT_MODEL modelType)

Komoran에서 기본으로 제공되는 모델을 로딩하여 객체를 생성합니다.

별도의 경로를 지정할 필요가 없습니다.

Parameters:
  • modelType – 기본으로 제공되는 모델의 타입

Methods

analyze

public List<KomoranResult> analyze(List<String> sentences, int thread)

여러 문장을 입력 받아 형태소 분석을 진행합니다.

Parameters:
  • sentences – 분석할 문장들이 담긴 List. 각 원소는 하나의 문장이라고 간주합니다.
  • thread – 분석 시 사용할 thread 수
Returns:

문장 별 형태소 분석 결과가 담긴 List

analyze

public KomoranResult analyze(String sentence)

입력된 문장에 대해서 형태소 분석을 진행합니다.

Parameters:
  • sentence – 분석 대상 문장
Returns:

형태소 분석 결과

analyze

public List<KomoranResult> analyze(String sentence, int nbest)

입력된 문장에 대해서 형태소 분석을 진행 후 n-best 결과를 반환합니다.

Parameters:
  • sentence – 분석 대상 문장
  • nbest – 분석 결과 중 추출할 상위 n개의 수
Returns:

형태소 분석 결과 중 nbest 수 만큼의 결과

analyzeTextFile

public void analyzeTextFile(String inputFilename, String outputFilename, int thread)

파일 단위로 형태소 분석을 진행합니다.

Parameters:
  • inputFilename – 분석할 파일 경로
  • outputFilename – 분석 결과가 저장될 파일 경로
  • thread – 분석 시 사용할 thread 수

setFWDic

public void setFWDic(String filename)

형태소 분석 시 사용될 기분석 사전을 로드합니다.

형태소 분석 진행 전에 로드되어야 합니다.

Komoran komoran = new Komoran(DEFAULT_MODEL.STABLE);
komoran.setFWDic("user_data/fwd.user");
KomoranResult komoranResult = komoran.analyze("감기는 자주 걸리는 병이다");
Parameters:
  • filename – 기분석 사전 파일 경로

setUserDic

public void setUserDic(String userDic)

형태소 분석 시 사용될 사용자 사전을 로드합니다.

형태소 분석 진행 전에 로드되어야 합니다.

Komoran komoran = new Komoran(DEFAULT_MODEL.STABLE);
komoran.setUserDic("user_date/dic.user");
KomoranResult komoranResult = komoran.analyze("바람과 함께 사라지다를 봤어");
Parameters:
  • userDic – 사용자 사전 파일 경로