Windowsでスパイダリーーング(3)

完全にスパイダリングの枠からははずれるけれども、組み合わせるとトキメク感じがするので、「オープンソース形態素解析エンジン MeCab」を入れてみる。

mecab公式
http://mecab.sourceforge.jp/
  1. 今日現在でWindows版のバージョンがmecab-win-32-0.91だそうなので、こいつをばダウンロード。
  2. 実行
  3. インストールウィザード開始→たんたんとどうぞ

極端にいってしまえば、Windows版の場合これで完了。
ただ今回はPerlスクリプトとつなげたいので、下記手順もしやす。

  1. ppm install http://www.akaneiro.jp/PPMPackages/800/MeCab.ppd

これでActivePerlからMeCabが使えるようになります。

MeCab 0.91用Shift_JIS版、UTF-8版辞書も公開: ナマズのブログ
によると、ふつーにActivePerlからMeCabを使うには辞書ファイルが必要とのこと。
上記URLの説明に従いましょう。辞書も手に入ります。
※もともと検索エンジンNamazu専用ライブラリだったために、辞書ファイルの漢字コードがEUC-JP限定だったそう。ActivePerlをWindowsで動かしている訳なので、辞書ファイルの漢字コードをShift-JISにしたものを配布してくれたって訳

ざざざっとだけ手順を。

  1. http://www.akaneiro.jp/public/mecab-ipadic-sjis.zip をダウンロード
  2. 解凍
  3. C:\に解凍した中身のusrディレクトリごとコピー
  4. コンパネ→システム→環境変数環境変数を追加


今度こそActivePerlで最新版MeCabを動かせる環境ができあがり。