YamCha: Yet Another Multipurpose CHunk Annotator

$Id: index.html,v 1.10 2001/07/08 16:13:33 taku-ku Exp $;


はじめに

YamCha は, Support Vector Machines に基づく汎用的な Chunker です. Chunker とは言っても, Chunking (Chunk 同定)を Tagging (Tag 付与)とみなすため, 一般的な Tagger として利用することも可能です.

Chunking (Chunk 同定問題)とは, 自然言語処理において, 最も基本的な処理の 1つとして認識されています. 簡単に言えば, 「与えらえた文を適当な解析単位に分割し, その分割した各要素に名前を付与する.」 という一連の処理のことを指します. 実際に, 多くの処理が Chunking の範疇に入ります. 例えば, 文節切り, 英語の基本句同定(Base Phrase Chunking), 形態素解析, わかち書き, 固有名詞抽出 などがあります. YamChaは, Support Vector Machines を学習アルゴリズムとし, 統一的な枠組でこれらの処理を行います.

解析精度に関して言えば, BaseNP Chunking において 2001年 6月現在 最も高い精度を示しています. また, 2000年 9月に行なわれた, CoNLL2000 Shared Task, Chnking においては, 11チーム中 1位の成績を修めています.

特徴

新着情報

ダウンロード

YamCha は GNU Lesser General Public Licenseに従ったフリーソフトウェアです.

インストール

使い方

YamCha に関する発表

参考文献, リンク


$Id: index.html,v 1.10 2001/07/08 16:13:33 taku-ku Exp $;

taku-ku@is.aist-nara.ac.jp