かばやきサンバをつくろう

Updated : 2004/07/28       



Kabayakiの検索ページ
   
かばやきサンバのサーバー
  Kabayaki 全文検索システムの画面

  かばや きサンバ・サーバー


■ このページでは 「かばやきサンバ」のつくりかたを説明します
 このページでは、ファイルサーバーに全文検索システムを連携させた「かばやきサンバ」の作り方を説明しています。 Kabayaki はタイムインターメディア社 の商用の全文検索システムです。ここでは同社の提供する Kabayaki の無償版 (Linux 版 )を利用します。かばやきサーバーのしくみや操作方法は説明していません。
この記事は、とにかく起動して使用することを優先して書きました。  古くなったパソコンも Linux が安定して利用できれば、かばやきサーバーをインストールして、ファイルサーバーとして再利用してみてはどうでしょうか?

かばやきサンバの構成図 

★Kabayaki について
 kabayaki は、全文検索システムとして有名な Namazu ( 高林哲さんが開発 ) を一般ユーザーでも使いやすくしたソフトウェアです。なまずサンバでは、共有ディレクトリ内のフォルダーについて、Kabayaki で全文検索できるように両者を連携させます。
Kabayaki のソフトウェアには、Windows版 とLinux 版が用意されています。Windows版は有償ですが、Linux版には無償版もありますので、今回はこれを利用します。無償版とはいってもコアの基本機 能なので、これだけでも十分に実用性があります。さらに付加機能が付いた有償版が必要になれば、ライセンスを購入して乗換えることもできます。

● セキュリティーは自己責任で適応してください! ●
 LANなどの安全なイントラネットでの利用を想定しているので、セキュリティー対策は説明していません。
自分の利用環境にあわせて「セキュリティー」設定をしてご利用ください。



このページの情報は、すべてのパソコンでの動作を保証するもので はありません。
書かれている情報は、1つの使用事例として自己責任で利用してください。




■  メニュー
  1. Kabayaki のここがすばらしい! 
  2. かばやきサーバー構築作業のロードマップ 
  3. 準備するもの 
  4. Red Hat Linux 9 のインストール 
  5. Samba のセットアップ 
  6. Apache のセットアップ 
  7. Kabayaki のセットアップ 
  8. かばやきサンバの使い方  工事中
  9. 機能を追加する 
  10. メモ  


  Kabayaki のここがすばらしい!

 Windows 98/Me/2000/XP のもつ「ネットワーク共有」機能を利用したファイルサーバーは便利です。
便利なファイルサーバーですが、保管するファイルはしだいにふえて、せっかく作成したファイルも忘れられがちです。そこで、ファイル サーバーに Yahoo や Google のような「キーワード検索機能」をつけることで、忘れてしまったファイルも、キーワードを手がかりに検索・抽出することができます。それも、ファイルサー バー全体のインデックスをあらかじめ自動的に作成するので、検索作業も Google のように簡単にすばやくできるのです。
 Kabayaki 自体は、全文検索エンジン Namazu を使いやすくしたソフトウェアです。この Kabayaki をファイルサーバー Samba と連携させることで、「全文検索付きファイルサーバー」のかばやきサーバーを構築します。

Kabayaki の公式サイト: http://www.kabayaki.jp/portal/top/

このページでは、ことばの混乱を避けるために、タイムインターメディア社の配布する全文検索システムとソフトウェアは、「Kabayaki」 のそのままの名前で呼びます。ひらがな名の「かばやき」は、「Kabayaki にファイルサーバーの Samba を組合せたサーバー全体」の名前として説明します。

 「かばやき」の基本的なしくみですが、ファイルサーバー、全文検索システム、Webサーバーの3つで構成されます。
ファイルサーバーに保管したファイルは、LANにつながったパソコンの IE (インターネットエクスプローラ)で閲覧できます。
ファイルサーバーに保管されたファイルについて、全文検索エンジンでインデックス ( 索引 ) をあらかじめ作成しておきます。
保管したファイルの文書内の単語は、すべてインデックスに登録されているので、Yahoo や Google のようにキーワード検索できるわけです。この検索機能は、保管するファイル数が多くなるほど、保管する期間が長くなるほどパワーを発揮します。

 もちろんかばやきサーバーは利点ばかりではありません。保管ファイルが増加すると、インデックス作成にかかる時間も増加します。また、検索する事前 に、インデックスを作成しておくことが必要なため、サーバーを利用しない夜間に自動作成させます。パワーのない古いパソコンでも利用できますが、ハード ディスクはCPUパワーに見合った容量でご利用ください。




  かばやきサーバー構築のロードマップ 

   このページで説明する「かばやきサーバー構築」のロードマップです。
  1. Red Hat Linux をインストールする。
  2. ファイルサーバー Samba のセットアップをする。
  3. Webサーバー Apache をセットアップして、ファイルサーバーの共有ディレクトリを閲覧可能にする。
  4. 全文検索エンジン Kabayaki をインストール・セットアップする。
  かばやきサーバーのくわしい使い方については書いてありません。



  準備するもの 

  ■ サーバーに使うパソコンなど

・ 古いパソコンても安定して動作するセレロン 300MHz 同等かそれ以上の安定したCPUのPCをおすすめします。
・ メモリーは、128MB 以上 ( 256MBを推奨 )。
・ ハードディスクは、最低 5GB 以上
・ ネットワークカード 10BASE-T または 100BASE-TX
・ CD-ROMドライブ ( インストール時にだけ利用します。)
・ フロッピーディスクドライブ ( 起動フロッピーディスク作成で使用します。)
・ フロッピーディスク 1枚

 ■ ソフトウェア

 Red Hat Linux 9 のCD-ROM  ・ Linux 雑誌の付録 CD-ROMを利用する。
 ・ FTPサーバーから CD-ROM の ISOイメージをダウンロードして焼く。
  Kabayaki 関連のソフトウェア  タイム インターメディア社のWebサイトからダウンロードする。
 そのほ かの関連フトウェア  イン ターネットでフリーで入手できる物をダウンロードする。

・ Red Hat Linux 9 のCD-ROMの入手先  ミラーFTP 

 
■ インストールしたサーバーマシン 

このページでは、以下のような小型の自作パソコンを使ってインストールの手 順を説明してゆきます。

 CPU
  Intel Celeron 533MHz Socket-370
 マザー ボード
  FreeTech 製 P6F215B
  ネッ トワークカード
 マザー ボード内臓品 ( Realtech RTL-1839C )
  ビデ オカード
 マザー ボード内臓品  (
 メモ リー  SD- RAM 128MB ( PC-133 CL=3 )
 ハード ディスク
  40GB ( Western Digital 製 ATA-100/5400rpm )
 CD- ROMドライブ
  Slim CD-ROM 東芝
 フロッ ピードライブ
  インストール時だけFDDを接続して使用する。
 本体 ケース(専用外付け電源付)
 C- 138 


  手持ちパーツや中古品を使ったので、おおざっぱな出費金額は4万円台でした。

 ハードウェアの写真など  工事中

 主要なパーツ、ケースと完成写真など。
FreeTech P6F215

組み立てた「ばばやきサンバ」サーバー
  Freetech マザーボード P6F215 ほか

  完成した「かばやきサンバ」

 ケース内部が狭いので、効果的な排熱をするために、HDD と CD-ROM のケーブルはラウンドケーブルを使った。
「かばやきサンバ」サーバーの完成後、CPU交換、CPUファン交換、ハードディスク交換 ・ ・ ・  など、いろいろなチューニングをした。CPU の発熱対策と、冷却ファンの騒音対策がチューニングの目的だった。冷却ファンは、静音ファンに交換した。発熱対策は、ケースをタテ置きするのがもっとも効 果的だった。



  Red Hat Linux 9 のインストール 

 Kabayaki のソフトウェアの Linux 版は、RedHat Linux 7.2/7.3/8.0/9.0 および RedHat Enterprise Linux 3.0 に対応しています。レッドハットリナックス社では、すでに Red Hat Linux 9のサポートを完了していますがこれを利用します。
Kabayaki  は  Red Hat Linux 9 の後継のFedoraCore 2 には対応していません。

 ■ インストール手順の要点

インストール手順については、現在ではわかりやすい書籍や雑誌が多数あるので、 Red Hat Linux 9 用を選んで参照してください。
ここではくわしいインストール手順は省略して、要点だけを書いておきます。

  Language Selection
 インス トール時に使用する言語を選択 ( Japanese )
 キー ボードの選択  自分の キーボード仕様 (通常は 日本語)
 マウス 設定
 2ボタ ンマウスマウスの場合は「3ボタンエミュレート」も設定する
 インス トールの種類
 「ワー クステーション」選択
 ディス クパーティションの設定
  「Disk Druid を使用して手動パーティション設定」
 ディス クの設定
  /var を共有に使うので、/var を最大限の容量に設定する
 事例 /   : 3〜4GBぐらい
/var  : 残ったHDD領域全部
swap : サーバーのRAM の 1.2〜2倍の容量
 ブート ローダーの設定
 デフォ ルト値のままで設定
 ネット ワークの設定
  固定IPアドレスを設定:192.168.0.100 ネットマスク 255.255.255.0
 ホスト名: celeron
デフォルトゲートウェイ: 192.168.0.1 ルーターのIPアドレス
DNS : 加入プロバイダー指定のDNSサーバーのIPアドレス
 セキュ リティーの設定
 「ファ イアーウォールなし」
 タイム ゾーンの設定
  Asia/Tokyo
  Rootパスワードの設定
  適切なパスワードを設定
 パッ ケージグループの設定
 ワーク ステーション
  「カスタマイズ」を選び必要なパッケージを追加する  工事中
 ブート ディスクの作成
 作成す る ( FD1枚 )
 グラ フィックカードの設定
 使って いるVGAカードを指定する
 モニ ターの設定
 使って いるモニターカードを指定する
 Xのカ スタマイズ
 デフォ ルト設定

インストール終了後、再起動して X-Window の画面が表示できればインストールは完了です。
うまく起動できない場合は再度インストールしてください。

GNOME デスクトップ画面

 起動した Linux にログインすると、左の写真の GNOME(グノーム) デスクトップの画面が表示されます。

 GNOME は起動するためにメモリーを大量に使用します。メモリーが少ない場合は、GNOME画面が起動するまでに1〜3分ぐらい要することがあります。


    ● マシンのハードウェア認識情報

インストール後に、ネットワークカードやグラフィックカードが間違って認識されて いることがあります。
Linux からハードウェアがどのように認識されているかを知るには、dmesg コマンドを利用します。

  dmesg を見る



  Samba のセットアップ 

 Linux のインストールの終了後、Linux のデスクトップからファイルサーバーの Samba のセットアップを実行します。
Samba サーバーを利用して Linux の特定のディレクトリをLANで共有させます、LANにつながった Windows パソコンから、この共有ディレクトリにアクセスできて、「ファイルの書き込みと読み出し」ができるようにセットアップします。

共 有ディレクトリ
  /var/archives/cabinet
アクセス制限
  だれでも読み・書き可能


Samba の設定手順 Samba を GNOMEデスクトップからセットアップする


■ Samba の動作確認テスト

 Samba サーバーのセットアップ終了後、LANにつながった Windows パソコンから「Sambaの共有フォルダー」を開いてテストしてください。チェック項目は以下の2点です。

 Windows のパソコンから 「Samba の共有ディレクトリ」にアクセスする 
  1. 「マイネットワーク」を開いて、「Samba サーバーのアイコン」が見える。
  2. 「Samba サーバーのアイコン」 -->「共有ディレクトリ」を開き、何かファイルを書き込み(ファイルをドラッグ&ドロップする)できる。
 LANにつながった Windowsパソコンから、「共有ディレクトリ」にファイルの「書き込み」と「読み出し」ができれば成功です。
この時点で、一般的なファイルサーバーとして利用することができます。ディレクトリ名については日本語を使うと文字化けすることがあります。ファイルサー バー上のディレクトリ名は、なるべく英数字のディレクトリ名を使ってください。


■  トラブルの時は?

Samba サーバーの GNOME デスクトップから Nautilus を起動して アクセス可能なコンピューターを調べてください。

 ノー チラスを使って共有ディレクトリをしらべる

うまく 「Samba サーバーのアイコン」が見えない場合は、設定手順をみなおしてください。
Samba の設定を変更した場合は、Sambaを再起動させてください。




  Apache のセットアップ 

 Sambaサーバーのセットアップが終了後、Webサーバーの Apache をデスクトップから設定します。
Sambaサーバーの「共有ディレクトリ」を、パソコンのブラウザー(IE)で閲覧可能に設定します。

Apacheの設定 デス クトップエディターの使い方


■  設定ファイル httpd.conf  の変更

エディターを使い /etc/httpd/conf/httpd.conf を編集する

 156行目   #Listen 12.34.56.78:80
          ↓
          Listen 80

 173行目   #ServerName new.host.name:80
          ↓
        ServerName celeron:80

 550行目 以下の8行を追加する

### Kabayaki-Samba Directory "cabinet"  2004/06/15 ###
Alias /cabinet "/var/archives/cabinet"
<Directory "/var/archives/cabinet">
    Options Indexes MultiViews
    AllowOverride None
    Order allow,deny
    Allow from all
</Directory>

790行目あたりの以下の行の行頭に # をつけてコメントアウトする。
AddDefaultCharset ISO-8859-1
  ↓
# AddDefaultCharset ISO-8859-1





■  /etc/hosts の変更

エディター を使い /etc/hosts に以下の設定を 1行追加する。
  かばやきサーバーの 「IPアドレス」と「ホスト名」( httpd.conf で設定した名前 ) を登録します。


# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1        localhost.localdomain localhost epia
192.168.0.100        celeron



■  Apache の起動とサービス設定

設定ファイル httpd.conf を変更した場合は、Apache を再起動することで設定が反映される。
コンソールから、次のコマンドで Apache を再起動させます。


# apachectl restart

 コマンド実行後にエラーメッセージが出なければ再起動は成功です。


■  Apache のテスト

httpd.conf の設定を変更後、Apache を再起動させて次の事項をチェックします。
  1. Apache が正常に再移動している。
  2. ブラウザーで http://192.168.0.100/cabinet/ をアクセスすると「Sambaの共有フォルダー」が閲覧でき る。
LANにつながったWindows のパソコンから、「Sambaの共有フォルダー」が閲覧できれば成功です。

■  「Sambaの共有フォルダー」が見えないときは?

Apache は設定が間違っていると起動できない場合があります。
httpd.conf  をチェックして修正をしたら再起動してください。
「Sambaの共有フォルダー」に何も入っていない場合は、正常に起動してもファイル等は表示されません。

次のセクションで Kabayaki をインストールすると、全文検索機能をもった「かばやきサーバー」に変身します。




  Kabayaki のセットアップ 

 Samba と Apache のインストール終了後、全文検索システムの Kabayaki をインストールします。
Kabayaki を利用するには、関連するソフトウェアを必要とします。フリーで使える日本語解析、日本語辞書、全文検索エンジン、スクリプト処理、・ ・ ・ などのソフトウェアを部品として利用するのでインストールします。そのあとで、それらの部品を統括コントロールする Kabayaki をインストールします。
Kabayaki を Webサーバー上のCGIで動かすことで、ファイルサーバーに保管したファイルの全文検索が可能になるわけです。


■  Kabayaki と関連ソフトウェアをタイムインターメディア社のWebサイトからダウンロードする

Kabayaki 公式サイト : http://www.kabayaki.jp/business/top/
GPL版 Kabayaki のページ : http://www.kabayaki.jp/portal/top/
ダウンロードディレクトリ : http://www.kabayaki.jp/pub/gpl/redhat90ja/RPMS/i386/
2004年6月30日に最新バージョン 1.4.0 がリリースされました。
ドキュメントの入手先 : http://www.kabayaki.jp/portal/dw/
ダウンロードするのは、RedHat Linux 9用のバイナリーパッケージのすべてです。[プログラムのリスト]

オプションパック sansyo のお試し版は、Kabayaki が無事に稼動できてから自力でインストールしてください。
この sansyo の試用ライセンスは期限付きなので、Kabayaki になれてからインストールした方が安心して試せます。
http://www.kabayaki.jp/business/enq/download.cgi

ドキュメントの「インストール取扱説明書」(PDFファイル)を読ん でインストールを実行してください。
制限条項も読んでおきましょう  http://www.kabayaki.jp/business/dw/restrict.html


■  ソフトウェアをインストールする

「インストール取扱説明書」の手順にしたがってソフトウェアをインストールしま す。
ソフトウェアはすべて RPM のバイナリーパッケージです。

インストールを実行して「 conflict ・ ・ ・ already installed ・ ・ ・ 」というメッセージが出たら、「すでに Linux といっしょにそのソフトウェアはインストール済みです。」というメッセージなので、そのソフトウェアはインストールをしないでください。


Kabayaki のインストール手順 Kabayaki のインストール手順を見る

インストール後に、ブラウザーで「Kabayaki の画面」が閲覧できればおわりです。



  かばやきサンバの使い方 

 Kabayaki の全文検索機能の使い方は、「取扱説明書」に書かれています。

■ かばやきサーバーを利用・設定する場合の注意点
  1. 制限条項により機能が制限されているので、使用前によく知っておいてください。
  2. 「ファイルフィルター」で表示されたすべてのファイル形式には対応してない。
  3. 「インデックス作成」実行後の「完了メッセージ」は、ブラウザー下側の「ステータスバー」に小さく表示されます。
  4. 「インデックス作成」の実行中は、Sambaサーバーでファイルの書き込みをしないこと。

 かば やきサンバの使い方

■  トラブルが起きたら?

かばやきサンバを利用していてトラブルが起きたら、まず最初に Samba か Kabayaki のどらのサーバーに起因する原因か調べます。ファイルサーバーの共有ディレクトリの、ファイルを転送したり読み込むことができない場合は Samba に原因があると考えられます。また、キーワード検索でトラブルがある場合は、Kabayaki に原因があると考えられます。

  かばやきサンバのトラブル解決 



  機能を追加する 

kabayaki 製品版(有償版)の機能を評価するために、期間限定のお試し版 sansyo を利用することができます。
ここでは sansyo については説明しないので、希望者はドキュメントを読んで使用してください。
以下のページからダウンロードしてインストールします。

sansyou のダウンロードサイト
http://www.kabayaki.jp/business/enq/download.cgi
製品版の説明ページ
http://www.kabayaki.jp/business/seihin/index.html
上記のページのアンケートに答えると、sansyo のお試し版がダウンロードできます。
ダウンロード後に、登録したメールアドレスに「試用ライセンス」(期限付き)が送られてきます。
このライセンスの制限期間内だけ利用することができます。
インストールをしたのですが、時間がたりなかったために機能をテストすることができませんでした。

Sansyo をインストールすると ・ ・ ・

sansyo をインストールしましたが、本質的な機能はテストできませんでした。
sansyo をインストールすることで、Kabayaki のインデックス作成時に日本語辞書に特定のキーワードを登録したり、Excel や Word のプロパティーを検索できるようになるそうです。また、「Webスパイダー」機能を利用することで、ローカル(共有ディレクトリ内)の文書だけでなく、イ ンターネット上にあるコンテンツの検索もできるそうです。
 Kabayaki



  メモ

 かばやきサーバーの元ネタは、月刊「リナックスワールド」2003年1月号の特 集記事「Kabayakiを使って社内に検索サイトを作る」です。リナックスワールド編集部で、PDFファイルの「バックナンバー記事」を Kabayaki を使って全文検索システムを構築するという記事内容でした。

タイムインターメディア社の Kabayaki は、全文検索システム namazu.cgi をさらに使いやすくしたソフトウェアです。このページでは kabayaki の一部の機能しか使っていません。有償で使える機能も含めると、さらにいろいろな応用ができます。

■  Web検索機能をテストしたら?

  Kabayaki の無償版では、Webスパイダー機能がありません。この機能が利用できると、Yahoo! や Google のようなインターネット上のWebサイトを検索することができます。しかし、特定のサイトの丸ごとコンテンツを取り込むことができれば、そのディレクトリ について「チューニング」を実行し、キーワード検索をすることができました。

■ やはり kabayaki は実務系で使いやすい

  今回の「かばやきサンバ」のテストは、同時にやっていた「なまずサンバ」のテスト と同一マシンで実行したために、違いがよくわかりました。どちらも検索エンジンには Namazu を利用していますが、開発者の高林さんが研究者のせいでしょうか、研究者にとっての使い勝手のよいソフトウェアになっています。自分も含めて理工系出身者 にとっては、設定作業をエディターですることに何の抵抗がありませんが、実務で利用するものにとっては高いハードルになります。その点では、 Kabayaki は Webインターフェースで設定作業ができるので、利用者にとっては配慮のある製品となっています。
マニュアルについてだけ、「できる・・・シリーズ」や「わかる・・・シリーズ」のテキスト本のような解説があると、もっといい製品になると思いま した。タイムインターメディアさん、よろしくお願いします。 m(_ _)m

■ 安定したサーバー運用をするには?

工事中
工事中





もどる もどる