単語リストやKWICコンコーダンス等を作成するフリーの検索ソフトです。 (作者:塚本 聡氏)
入手先:http://www.chs.nihon-u.ac.jp/eng_dpt/tukamoto/kwic.html
ここでは単語リストを作成してみましょう。
KWIC Concordancerを起動したら、最初にコーパスを設定します。
「File」メニューから「Corpus Setup」をクリックします。
Setup Corpus Files画面が開きます。
入力ファイルを指定しましょう。「Add」ボタンをクリックしてください。
「開く−コーパスファイル設定」画面が開いたら、単語リストを作成したいファイルを選択して「開く」ボタンをクリックします。
ここでは、ワシントンポストのホームページからダウンロードし、HtoXでタグを削除したファイルの一つを選択しました。
入力ファイルの選択が終わったら「OK」ボタンをクリックします。
入力ファイルは複数選択できます。
次に、「Wordlist」メニューから「Descending Wordlist」をクリックします。頻度の高い順にソートされた単語リストを作成するためです。
以下のように単語が一語づつ切り出されて頻度順に表示されました。単語の右側の数字は出現回数です。大文字は全て小文字に変換されます。(israeli、palestinianなど)。
一番下までスクロールするとTotal Tokens(総単語数)とTotal Types(重複語を省いた単語数)が表示されています。
翻訳する前に原文のWordlistを作成すれば、キーワードを抽出したり、語彙数による原文の難易度を調べたりできます。
Copyright(c)2002 Babel K.K.All Rights Reserved ■月刊「eとらんす」 ■MT研究会