Install of namazu
 namazu のインストール
バナー

テキスト検索をする検索エンジンの 1つに「namazu」というものがあります.
これは FreeBSD JAPAN の Q&A 検索でも使われている検索エンジンで,あらかじめ文章のインデックスを作成しておき,それを元に検索するので,検索がかなり軽い検索エンジンです.
これを使うと,インデックス作成に少々時間はかかりますが,自分のマシンでテキストの全文検索が可能となります.
今回はこの namazu でどるこむ過去ログのスレッド分割ファイルを全文検索するまでのインストール方法,及び生びゅ〜のスレッド分割出力までの説明を行いたいと思います.



ここでの説明は以下の環境で試したことを元に再現されています.

  • ハード:PC-9821Xa/U8W
  • OS:Windows NT 4.0 Workstation + SP5
  • namazu for Win32 のバージョン:Version 1.3.0.10
  • Kakasi for Win32 のバージョン:Version 1.14
  • Search-s for Win32 のバージョン:0.7.3

    おそらく Win98 の方でもほぼ同じようにインストールできると思います.



    このドキュメントでの注意事項は以下の通りです.

  • 「x:\」は適当なドライブを指します.



  • ■スレッドファイル作成 (生びゅ〜使用)

    0. ここでの生びゅ〜の各種確認事項
    生びゅ〜は以下のディレクトリに格納されていることを前提とします.

  • インストールディレクトリ:x:\namalog
  • 各種設定:全てデフォルト

    1. 生びゅ〜の設定
    生びゅ〜を起動させて「設定」ボタンを押すと,以下のようなウィンドウが出ます.

    生びゅ〜設定ウィンドウ

    デフォルトでいい部分もあるのですが,沢山のファイルが出力されるため,1カ所だけ設定を変更する必要が出てきます.
    「ファイル」タブの「スレッドインデックスファイル」の項目を x:\namalog\sledindex\index.html というように,namalog_lt.exe があるディレクトリの下にさらにディレクトリ (sledindex\) を掘って,その中にスレッドファイルを吐き出すように設定してやります.
    指定はファイル名も含めて指定して下さい
    あとは全てデフォルトでかまいません.

    なお,sledindex ディレクトリは指定するだけではダメで,ご自分で掘らなければなりません.ご注意ください.

    さて,メインウィンドウに戻ります.
    メインウィンドウでは,「スレッドファイル出力形式」「分割」に,「HTML を出力する」のチェックボックスにチェックを入れておきます.
    そのほかの 3つのチェックボックスはチェックを外しておきます.

    2. スレッドファイル吐き出し
    「開始」ボタンを押して生ログファイルを選択した後,「開く」ボタンを押して吐き出しを行います.
    吐き出しは先ほど指定したディレクトリに吐き出されます.

    吐き出された後はこの下に,更に掲示板ごとのディレクトリを掘り,その中には今作成した日付のディレクトリを掘り,その中にスレッドファイルもろとも移動させます.
    図で示すと以下の通り.

    x:\namalog\sledindex
    |
    +--- 98mania
    |       |
    |       +--- 199905
    |       |
    |       +--- 199906a
    |       :
    |
    +--- 98mobile
    :
    
    上記の日付ごとのディレクトリに別々にスレッドファイルを放り込んでいきます.
    たとえば 98マニアックス掲示板の 1999年5月分は 98mania\199905\ ディレクトリに,1999年6月 (A) の分は 98mania\199906a\ ディレクトリにと言うふうに入れていきます.

    このとき,できれば生ログを複数選択した状態でのスレッドファイルは作成しない方がいいでしょう.時々ログ壊れてますから.
    まぁ,ファイル名の後ろに a とか b とかついてない物だったら一緒くたにしてもいいですけどね.

    例えば 199904.txt,199905.txt,199906a.txt,199906b.txt,199907.txt,199908.txt とある場合,

  • 199904.txt と 199905.txt を一緒くたに作成
  • 199905.txt と 199906a.txt は各テキストを個別に選択して作成
  • 199906b と 199907.txt と 199908.txt を一緒くたに作成

    とすると大丈夫でしょう.

    吐き出されたことを確認したら次のステップへ進みましょう.

  • ■namazu インストール

    0. 必要なファイル群
    namazu を稼働させるには以下のファイル群が必要です.
    (ファイルへの直リンクを張っています)

  • Namazu for Win32 (自己解凍型)
  • Kakasi for Win32 (自己解凍型)
  • Active Perl (自己解凍型)
  • DCOM95 (Win95 ユーザーのみ必要.Win98 及び NT4.0 ユーザーは必要なし // 自己解凍型)
  • nkf for Win32 (LHa 圧縮)
  • search-s for Namazu (自己解凍型)

    ※DCOM95 は Win95 で Active Perl を動作させるために必要です.

    1. まずは Active Perl のインストール
    namazu などの perl スクリプトで書かれたものを Win32 上で動かすために,Active Perl をインストールしなければなりません.
    api519p.exe をクリックしてこれをインストールして下さい.

    インストール先は x:\usr にすると,あとあと幸せになれます.
    (x: は適当なドライブ)

    なお,C ドライブが書き込み不可のメディアだった場合,インストールが出来ない可能性があります.
    FDD であれば適当に FD を入れておくか,もしくは「書き込めない」とエラーが出たときに「NO」で回避するか出来ます.
    (これはインストールログを保存する場所がどうも C ドライブに限られているという,誠に困った使用であります(汗))

    インストールが終わったら,AUTOEXEC.bat に以下の行を書き加えて下さい.

    PATH=x:\usr\bin;%PATH%

    あとは,Win9x ユーザーの方は再起動WinNT4.0 ユーザーの方は再ログオンしたあとにマイコンピューター右クリックでプロパティ開いて「環境」タブ選択したら「システム環境変数」の PATH 項目をクリックした後に「値」のテキストボックスクリックして「設定」を押した後に「OK」ボタンを押す (面倒だったら再起動) という作業をしましょう.

    2. namazu のインストール
    nmz13010.exe をダブルクリックすると,「C:\usr\local\ に展開するか」と聞いてくるので,適当なドライブに変更してやりましょう.
    ディレクトリ名はこのまま使うと後々楽なので,x:\usr\local\ にしておきます.

    成功すると README.txt だけが開きますが,なにかエラーがあると ERROR.txt も開きます.
    もし ERROR.txt が開いたら,以下の項目を確認して下さい.

  • Active Perl のインストール後に,Win9x ユーザーの方は再起動WinNT4.0 ユーザーの方は再ログオンしたあとにマイコンピューター右クリックでプロパティ開いて「環境」タブ選択したら「システム環境変数」の PATH 項目をクリックした後に「値」のテキストボックスクリックして「設定」を押した後に「OK」ボタンを押す (面倒だったら再起動) という作業をしたか?
  • AUTOEXEC.bat に Active Perl へのディレクトリパスが記載されているか?

    今までの説明の順番で行くと問題は出ないはずです.

    次に namazu 設定ファイルをリネームします.
    x:\usr\local\namazu\lib\namazu.conf-dist を namazu.conf にリネームします.

    3. Kakasi のインストール
    kks225w4.exe をダブルクリックすると,「C:\usr\local\ に展開するか」と聞いてくるので,適当なドライブに変更してやりましょう.
    ディレクトリ名はこのまま使うと後々楽なので,x:\usr\local\ にしておきます.

    あとの説明 (トラブルシューティングなど) は上記と同じです.

    4. Search-s のインストール
    srchs073.exe をダブルクリックすると,何処にインストールするか聞いてくるので,適当なドライブにインストールしましょう.
    これは何処のドライブ,何処のディレクトリでもかまいませんが,namazu サポートツールと言うこともあり,私は x:\usr\local\search-s にインストールしました.

    5. nkf のインストール
    nkf3217.lzh を適当なディレクトリに展開し,中にある nkf.exe を namazu.exe と同じディレクトリに入れるか,またはパスの通ったディレクトリに入れて下さい.
    展開した残りのファイルは必要ないのでポイしちゃってかまわないです.
    (ドキュメントは残しておくといいかも)
  • これで namazu 他,サポートツールなどのインストールは完了です.
    ココで一旦,Win9x,WinNT4.0 どちらのユーザーも再起動しておきましょう.

    ■検索用インデックスファイルの作成

    0. 各ディレクトリのおさらい
  • namazu のインストールディレクトリ:x:\usr\local\namazu\
  • どるこむ過去ログのスレッドファイルのディレクトリ:x:\namalog\sledindex\

    1. 検索対象ファイルリストを作る
    namazu は通常,検索対象ファイルリストを作らなくてもインデックスを作成できます.
    しかし,そうするとスレッドファイル (sledxx.html) のメニュー (index.html) まで検索対象に入ってしまい,検索ヒット率が別の意味で最悪になります.(^▽^;
    そこで,検索対象をスレッドファイルに絞り,検索精度を上げてやることにします.

    まず,スレッドファイルを作成したディレクトリ (x:\namalog\sledindex\) に移動して


    x:\namalog\sledindex>dir /s /b sled*.htm* > list.txt


    と打ちましょう.すると,list.txt にスレッドファイルのみのファイルリストがディレクトリ名付きで出力されます.
    検索用ファイルリスト作成はこれで終わりです.

    2. 検索用インデックスファイルを作る
    出力されたファイルリストを使って今度は検索用のインデックスを作成します.
    namazu のインデックス作成ディレクトリ (デフォルトでは x:\usr\local\namazu\index\) に移動して


    x:\usr\local\namazu>mknmz -F x:\namalog\sledindex\list.txt


    を実行します.するとインデックスが作成されていくのでしばらく待ちましょう.
    ちなみに所要時間は以下の通り.

    << ログ:1999年5月〜1999年7月 (仮どる含む) >>
    << スレッドファイル数:約 2,700個 >>
    << 総ファイルサイズ:28.4MB >>

  • K6-2 380MHz / 256MB RAM / HDD:DTTA-350640 (UDMA mode) の WinNT4.0WS で 30分ほど.
  • K6-2 408MHz / 80MB RAM / HDD:AC32100 の WinNT4.0WS で 60分ほど.

    なお,上記のコマンドを手打ちでやるとミスをする可能性はなきにもあらずなので,以下のようなバッチファイルをスレッドファイル格納ディレクトリに作っておけば幸せになれるかもしれません.


    REM ↓ディレクトリリストを出力する.
    dir /s /b sled*.htm* > list.txt

    REM ↓namazu のインストールされているディレクトリに移動.
    cd \usr\local\namazu\index

    REM ↓インデックスファイル作成開始!
    REM  現在いるディレクトリはインデックス出力ディレクトリなので,
    REM  リストファイルへのするパスを指定しましょう.
    call mknmz -F x:\dorcom_oldlog\list.txt

    REM ↓お掃除するにょ.
    del x:\dorcom_oldlog\list.txt


  • ■検索方法

    検索は「namazu インストール - 4. Search-s のインストール」でインストールした Search-s で検索します.
    スタートメニューに登録されているので,そこから Search-s を起動します.
    すると内部ブラウザを持った状態で起動しますので,以下のような設定を行います.

  • 「設定」「出力先」「外部」
  • 「設定」「Namazu」「Namazu のパス」Namazu のインストールされているディレクトリをファイル名付き (Z:\usr\local\namazu\bin\namazu.exe) で記述
  • 「検索」「検索パス」 に,検索用インデックス作成ディレクトリ (x:\usr\local\namazu\index) を指定する.

    設定が終わればテキストボックスに検索キーを入れるとすぐに検索結果が出ます.

  • ■参考リンク

  • 全文検索システム Namazu for Win32

    あとは全てここからリンクを辿れるので省略します.(^^;

  • ■あとがき

    いや〜,ワイバーンがベース 68MHz の 408MHz で安定しているようなので,障害も無しに執筆できました.(笑)
    (いままでだったら起動から 10分ほどで絶対にページフォールト起こしてた(汗))

    このドキュメントは実際にインストール作業をしながら書いているので,わかりやすく書けたかと思います.
    namazu の詳しい使い方に関しては namazu のドキュメントを見て下さいね.



    ←戻る Made with PC-9821Xa/U8W K.O.T.B.G. Special Tune Model "Wyvern" Go to NEC Web Page
    Made by HyperEdit for Windows Go to HyperEdit Web Page