目次へ

4. Senの使用法

2005.09.28 株式会社四次元データ 宮澤了祐

4.1. 簡単なサンプル

この章ではSen単体での使用法を解説します。 すでにSenをインストールし、辞書を作成しているとします。 Senのインストールにはこちらを参考にしてください。 クラスパスにsen.jarおよびcommons-logging.jarを追加しておきます。

import java.io.IOException;

import net.java.sen.StringTagger;
import net.java.sen.Token;

public class SenSample {
    public static void main(String[] args) throws IllegalArgumentException, IOException {
        StringTagger tagger = StringTagger.getInstance();
        
        String str = "今日は良い天気です。";
        
        Token[] token = tagger.analyze(str);
        
        for(int i=0; i<token.length; i++){
            System.out.println(token[i].getBasicString()
            	+"("+token[i].getTermInfo()+")");
        }    
    }
}

net.java.sen.StringTagerは、java.lang.Stringを使用した文字列を形態素解析するクラスです。 StringTaggerのanalyze(String)メソッドによって、形態素解析を行います。

net.java.sen.Tokenは形態素の情報を保持するクラスです。 TokenのgetBasicString()で、基本形を出力できます。また語句の詳しい説明はToken.getTermInfo()で表示出来ます。

Senを利用したプログラムを実行するには、Senのインストールされているフォルダを環境変数sen.homeに設定する必要があります。

System.setProperty("sen.home","c:/sen");
をプログラムの先頭に含めるか、またはプログラム実行時に-Dオプションで次の用に指定してください。
$ java -Dsen.home=c:/sen

次のように出力されれば、成功です。

今日(名詞,副詞可能,*,*,*,*,今日,キョウ,キョー)
は(助詞,係助詞,*,*,*,*,は,ハ,ワ)
良い(形容詞,自立,*,*,形容詞・アウオ段,基本形,良い,ヨイ,ヨイ)
天気(名詞,一般,*,*,*,*,天気,テンキ,テンキ)
です(助動詞,*,*,*,特殊・デス,未然形,です,デショ,デショ)
。(記号,句点,*,*,*,*,。,。,。)

↑このページの先頭へ

こちらもチェック!

PR
  • XMLDB.jp
  • シナジーマーケティング研究開発グループブログ
Loading