Windowsでスパイダリーーング(3)
完全にスパイダリングの枠からははずれるけれども、組み合わせるとトキメク感じがするので、「オープンソース形態素解析エンジン MeCab」を入れてみる。
極端にいってしまえば、Windows版の場合これで完了。
ただ今回はPerlスクリプトとつなげたいので、下記手順もしやす。
これでActivePerlからMeCabが使えるようになります。
MeCab 0.91用Shift_JIS版、UTF-8版辞書も公開: ナマズのブログ
によると、ふつーにActivePerlからMeCabを使うには辞書ファイルが必要とのこと。
上記URLの説明に従いましょう。辞書も手に入ります。
※もともと検索エンジンのNamazu専用ライブラリだったために、辞書ファイルの漢字コードがEUC-JP限定だったそう。ActivePerlをWindowsで動かしている訳なので、辞書ファイルの漢字コードをShift-JISにしたものを配布してくれたって訳
ざざざっとだけ手順を。
- http://www.akaneiro.jp/public/mecab-ipadic-sjis.zip をダウンロード
- 解凍
- C:\に解凍した中身のusrディレクトリごとコピー
- コンパネ→システム→環境変数で環境変数を追加
今度こそActivePerlで最新版MeCabを動かせる環境ができあがり。