オプション
実行時のオプション
形態素解析の実行については,いくつかのオプションが用意されている.以下にそれをまとめる.-r など引
数をともなうオプションでは,オプションと引数の間には空白があってもなくてもかまわない.
茶筌の起動についてのオプション
3
-s 茶筌サーバの起動 -P port 茶筌サーバのポート番号の指定 (-s オプションとともに使用,デフォルト値は31000) -D host[:port] 茶筌サーバに接続 -a 環境変数CHASENSERVER があってもスタンドアロンで実行 ² 解が曖昧性を含む場合の表示方法(曖昧性がない場合はどの方法も同じ表示となる) -b 後方最長一致の解を一つだけ表示する(デフォルト) -m 曖昧性のある部分だけ,複数の形態素を表示する -p 曖昧性の組合せを展開し,すべての解を個別に表示する ² 各形態素の表示方法 -f カラムを整えて表示(デフォルト) -e 完全な形態素情報を文字で表示 -c 完全な形態素情報をコードで表示 -d 各形態素をProlog の複合項で表現し,それらをリストにしたものを出力 -v 美茶のための詳細表示 -F format 形態素をformat で指定された形式で出力 -Fh -F オプションの出力フォーマットのヘルプを表示 ² その他 -j 句点あるいは空行を文の区切りとして解析 -o file 解析結果出力ファイルを指定 -w width コスト幅を指定 -C コマンドインタプリタを使用 -r rc file rc file をchasenrc ファイルとして使用 -R クライアントモード(-D) のときはchasenrc ファイル を読み込まない,スタンドアロンのときはデフォルト のchasenrc ファイル(PREFIX/etc/chasenrc) を読み 込む -L lang 言語を指定 -lp 品詞番号と品詞名のリストを表示 -lt 活用型番号と活用型名のリストを表示 -lf 活用型番号,活用形番号と活用形名のリストを表示 -h ヘルプメッセージを出力 -V 茶筌のバージョンを出力 -j オプションについて
茶筌では通常,改行をもって一つの入力文字列の終了とする.そのため,文の途中で改行が挿入されている
ファイルを解析した場合,正しい結果が得られなくなることが多い.
そのようなときは-j オプションをつけると,句読点など(デフォルトでは「.。!?」の4 文字) あるいは空行
を文の区切りとして解析を行うようになる.
また,chasenrc ファイルの「区切り文字」の項目を指定することにより,-j オプションをつけた時の文の
区切り文字を設定することができる.
4