かばやきサンバをつくろう
|
![]() |
|
![]() |
|
Kabayaki 全文検索システムの画面 |
かばや
きサンバ・サーバー |
■ このページでは 「かばやきサンバ」のつくりかたを説明します。
このページでは、ファイルサーバーに全文検索システムを連携させた「かばやきサンバ」の作り方を説明しています。 Kabayaki はタイムインターメディア社 の商用の全文検索システムです。ここでは同社の提供する Kabayaki の無償版 (Linux 版 )を利用します。かばやきサーバーのしくみや操作方法は説明していません。■ メニュー
この記事は、とにかく起動して使用することを優先して書きました。 古くなったパソコンも Linux が安定して利用できれば、かばやきサーバーをインストールして、ファイルサーバーとして再利用してみてはどうでしょうか?
かばやきサンバの構成図
★Kabayaki について
kabayaki は、全文検索システムとして有名な Namazu ( 高林哲さんが開発 ) を一般ユーザーでも使いやすくしたソフトウェアです。なまずサンバでは、共有ディレクトリ内のフォルダーについて、Kabayaki で全文検索できるように両者を連携させます。
Kabayaki のソフトウェアには、Windows版 とLinux 版が用意されています。Windows版は有償ですが、Linux版には無償版もありますので、今回はこれを利用します。無償版とはいってもコアの基本機 能なので、これだけでも十分に実用性があります。さらに付加機能が付いた有償版が必要になれば、ライセンスを購入して乗換えることもできます。
● セキュリティーは自己責任で適応してください! ●
LANなどの安全なイントラネットでの利用を想定しているので、セキュリティー対策は説明していません。
自分の利用環境にあわせて「セキュリティー」設定をしてご利用ください。
このページの情報は、すべてのパソコンでの動作を保証するもので はありません。
書かれている情報は、1つの使用事例として自己責任で利用してください。
Kabayaki のここがすばらしい!
Windows 98/Me/2000/XP のもつ「ネットワーク共有」機能を利用したファイルサーバーは便利です。
便利なファイルサーバーですが、保管するファイルはしだいにふえて、せっかく作成したファイルも忘れられがちです。そこで、ファイル サーバーに Yahoo や Google のような「キーワード検索機能」をつけることで、忘れてしまったファイルも、キーワードを手がかりに検索・抽出することができます。それも、ファイルサー バー全体のインデックスをあらかじめ自動的に作成するので、検索作業も Google のように簡単にすばやくできるのです。
Kabayaki 自体は、全文検索エンジン Namazu を使いやすくしたソフトウェアです。この Kabayaki をファイルサーバー Samba と連携させることで、「全文検索付きファイルサーバー」のかばやきサーバーを構築します。
Kabayaki の公式サイト: http://www.kabayaki.jp/portal/top/
このページでは、ことばの混乱を避けるために、タイムインターメディア社の配布する全文検索システムとソフトウェアは、「Kabayaki」 のそのままの名前で呼びます。ひらがな名の「かばやき」は、「Kabayaki にファイルサーバーの Samba を組合せたサーバー全体」の名前として説明します。
「かばやき」の基本的なしくみですが、ファイルサーバー、全文検索システム、Webサーバーの3つで構成されます。
ファイルサーバーに保管したファイルは、LANにつながったパソコンの IE (インターネットエクスプローラ)で閲覧できます。
ファイルサーバーに保管されたファイルについて、全文検索エンジンでインデックス ( 索引 ) をあらかじめ作成しておきます。
保管したファイルの文書内の単語は、すべてインデックスに登録されているので、Yahoo や Google のようにキーワード検索できるわけです。この検索機能は、保管するファイル数が多くなるほど、保管する期間が長くなるほどパワーを発揮します。
もちろんかばやきサーバーは利点ばかりではありません。保管ファイルが増加すると、インデックス作成にかかる時間も増加します。また、検索する事前 に、インデックスを作成しておくことが必要なため、サーバーを利用しない夜間に自動作成させます。パワーのない古いパソコンでも利用できますが、ハード ディスクはCPUパワーに見合った容量でご利用ください。
かばやきサーバー構築のロードマップ
このページで説明する「かばやきサーバー構築」のロードマップです。
かばやきサーバーのくわしい使い方については書いてありません。
- Red Hat Linux をインストールする。
- ファイルサーバー Samba のセットアップをする。
- Webサーバー Apache をセットアップして、ファイルサーバーの共有ディレクトリを閲覧可能にする。
- 全文検索エンジン Kabayaki をインストール・セットアップする。
準備するもの
■ サーバーに使うパソコンなど
・ 古いパソコンても安定して動作するセレロン 300MHz 同等かそれ以上の安定したCPUのPCをおすすめします。
・ メモリーは、128MB 以上 ( 256MBを推奨 )。
・ ハードディスクは、最低 5GB 以上
・ ネットワークカード 10BASE-T または 100BASE-TX
・ CD-ROMドライブ ( インストール時にだけ利用します。)
・ フロッピーディスクドライブ ( 起動フロッピーディスク作成で使用します。)
・ フロッピーディスク 1枚
| Red Hat Linux 9 のCD-ROM | ・
Linux 雑誌の付録 CD-ROMを利用する。 ・ FTPサーバーから CD-ROM の ISOイメージをダウンロードして焼く。 |
| Kabayaki 関連のソフトウェア | タイム インターメディア社のWebサイトからダウンロードする。 |
| そのほ かの関連フトウェア | イン
ターネットでフリーで入手できる物をダウンロードする。 |
| CPU |
Intel Celeron 533MHz Socket-370 |
| マザー
ボード |
FreeTech 製 P6F215B |
| ネッ
トワークカード |
マザー
ボード内臓品 ( Realtech RTL-1839C ) |
| ビデ
オカード |
マザー
ボード内臓品 ( |
| メモ リー | SD- RAM 128MB ( PC-133 CL=3 ) |
| ハード
ディスク |
40GB ( Western Digital 製
ATA-100/5400rpm ) |
| CD-
ROMドライブ |
Slim CD-ROM 東芝 |
| フロッ
ピードライブ |
インストール時だけFDDを接続して使用する。 |
| 本体
ケース(専用外付け電源付) |
C-
138 |
ハードウェアの写真など 
![]() |
![]() |
|
|
Freetech
マザーボード P6F215 ほか |
完成した「かばやきサンバ」 |
ケース内部が狭いので、効果的な排熱をするために、HDD と CD-ROM のケーブルはラウンドケーブルを使った。
「かばやきサンバ」サーバーの完成後、CPU交換、CPUファン交換、ハードディスク交換 ・ ・ ・ など、いろいろなチューニングをした。CPU の発熱対策と、冷却ファンの騒音対策がチューニングの目的だった。冷却ファンは、静音ファンに交換した。発熱対策は、ケースをタテ置きするのがもっとも効 果的だった。
Red Hat Linux 9 のインストール
Kabayaki のソフトウェアの Linux 版は、RedHat Linux 7.2/7.3/8.0/9.0 および RedHat Enterprise Linux 3.0 に対応しています。レッドハットリナックス社では、すでに Red Hat Linux 9のサポートを完了していますがこれを利用します。
Kabayaki は Red Hat Linux 9 の後継のFedoraCore 2 には対応していません。
|
Language Selection |
インス
トール時に使用する言語を選択 ( Japanese ) |
| キー ボードの選択 | 自分の
キーボード仕様 (通常は 日本語) |
| マウス
設定 |
2ボタ
ンマウスマウスの場合は「3ボタンエミュレート」も設定する |
| インス
トールの種類 |
「ワー
クステーション」選択 |
| ディス
クパーティションの設定 |
「Disk Druid を使用して手動パーティション設定」 |
| ディス
クの設定 |
/var を共有に使うので、/var
を最大限の容量に設定する 事例 / : 3〜4GBぐらい /var : 残ったHDD領域全部
swap : サーバーのRAM の 1.2〜2倍の容量 |
| ブート
ローダーの設定 |
デフォ
ルト値のままで設定 |
| ネット
ワークの設定 |
固定IPアドレスを設定:192.168.0.100 ネットマスク 255.255.255.0 ホスト名: celeron デフォルトゲートウェイ: 192.168.0.1
ルーターのIPアドレス
DNS : 加入プロバイダー指定のDNSサーバーのIPアドレス |
| セキュ
リティーの設定 |
「ファ
イアーウォールなし」 |
| タイム
ゾーンの設定 |
Asia/Tokyo |
|
Rootパスワードの設定 |
適切なパスワードを設定 |
| パッ
ケージグループの設定 |
ワーク
ステーション 「カスタマイズ」を選び必要なパッケージを追加する ![]() |
| ブート
ディスクの作成 |
作成す
る ( FD1枚 ) |
| グラ
フィックカードの設定 |
使って
いるVGAカードを指定する |
| モニ
ターの設定 |
使って いるモニターカードを指定する |
| Xのカ
スタマイズ |
デフォ
ルト設定 |
![]() |
起動した Linux にログインすると、左の写真の GNOME(グノーム) デスクトップの画面が表示されます。 GNOME は起動するためにメモリーを大量に使用します。メモリーが少ない場合は、GNOME画面が起動するまでに1〜3分ぐらい要することがあります。 |
● マシンのハードウェア認識情報
インストール後に、ネットワークカードやグラフィックカードが間違って認識されて いることがあります。
Linux からハードウェアがどのように認識されているかを知るには、dmesg コマンドを利用します。
Samba のセットアップ
Linux のインストールの終了後、Linux のデスクトップからファイルサーバーの Samba のセットアップを実行します。
Samba サーバーを利用して Linux の特定のディレクトリをLANで共有させます、LANにつながった Windows パソコンから、この共有ディレクトリにアクセスできて、「ファイルの書き込みと読み出し」ができるようにセットアップします。
共 有ディレクトリ
/var/archives/cabinet
アクセス制限
だれでも読み・書き可能
■ Samba の動作確認テスト
Samba サーバーのセットアップ終了後、LANにつながった Windows パソコンから「Sambaの共有フォルダー」を開いてテストしてください。チェック項目は以下の2点です。
Windows のパソコンから 「Samba の共有ディレクトリ」にアクセスする
LANにつながった Windowsパソコンから、「共有ディレクトリ」にファイルの「書き込み」と「読み出し」ができれば成功です。
- 「マイネットワーク」を開いて、「Samba サーバーのアイコン」が見える。
- 「Samba サーバーのアイコン」 -->「共有ディレクトリ」を開き、何かファイルを書き込み(ファイルをドラッグ&ドロップする)できる。
この時点で、一般的なファイルサーバーとして利用することができます。ディレクトリ名については日本語を使うと文字化けすることがあります。ファイルサー バー上のディレクトリ名は、なるべく英数字のディレクトリ名を使ってください。
■ トラブルの時は?
Samba サーバーの GNOME デスクトップから Nautilus を起動して アクセス可能なコンピューターを調べてください。
ノー チラスを使って共有ディレクトリをしらべる
うまく 「Samba サーバーのアイコン」が見えない場合は、設定手順をみなおしてください。
Samba の設定を変更した場合は、Sambaを再起動させてください。
Apache のセットアップ
Sambaサーバーのセットアップが終了後、Webサーバーの Apache をデスクトップから設定します。
Sambaサーバーの「共有ディレクトリ」を、パソコンのブラウザー(IE)で閲覧可能に設定します。
■ 設定ファイル httpd.conf の変更
エディターを使い /etc/httpd/conf/httpd.conf を編集する
156行目 #Listen 12.34.56.78:80
↓
Listen 80
173行目 #ServerName new.host.name:80
↓
ServerName celeron:80
550行目 以下の8行を追加する
### Kabayaki-Samba Directory "cabinet" 2004/06/15 ###
Alias /cabinet "/var/archives/cabinet"
<Directory "/var/archives/cabinet">
Options Indexes MultiViews
AllowOverride None
Order allow,deny
Allow from all
</Directory>
790行目あたりの以下の行の行頭に # をつけてコメントアウトする。
AddDefaultCharset ISO-8859-1
↓
# AddDefaultCharset ISO-8859-1
■ /etc/hosts の変更
エディター を使い /etc/hosts に以下の設定を 1行追加する。
かばやきサーバーの 「IPアドレス」と「ホスト名」( httpd.conf で設定した名前 ) を登録します。
# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1 localhost.localdomain localhost epia
192.168.0.100 celeron
■ Apache の起動とサービス設定
設定ファイル httpd.conf を変更した場合は、Apache を再起動することで設定が反映される。
コンソールから、次のコマンドで Apache を再起動させます。
コマンド実行後にエラーメッセージが出なければ再起動は成功です。
# apachectl restart
■ Apache のテスト
httpd.conf の設定を変更後、Apache を再起動させて次の事項をチェックします。
LANにつながったWindows のパソコンから、「Sambaの共有フォルダー」が閲覧できれば成功です。
- Apache が正常に再移動している。
- ブラウザーで http://192.168.0.100/cabinet/ をアクセスすると「Sambaの共有フォルダー」が閲覧でき る。
■ 「Sambaの共有フォルダー」が見えないときは?
Apache は設定が間違っていると起動できない場合があります。
httpd.conf をチェックして修正をしたら再起動してください。
「Sambaの共有フォルダー」に何も入っていない場合は、正常に起動してもファイル等は表示されません。
次のセクションで Kabayaki をインストールすると、全文検索機能をもった「かばやきサーバー」に変身します。
Kabayaki のセットアップ
Samba と Apache のインストール終了後、全文検索システムの Kabayaki をインストールします。
Kabayaki を利用するには、関連するソフトウェアを必要とします。フリーで使える日本語解析、日本語辞書、全文検索エンジン、スクリプト処理、・ ・ ・ などのソフトウェアを部品として利用するのでインストールします。そのあとで、それらの部品を統括コントロールする Kabayaki をインストールします。
Kabayaki を Webサーバー上のCGIで動かすことで、ファイルサーバーに保管したファイルの全文検索が可能になるわけです。
■ Kabayaki と関連ソフトウェアをタイムインターメディア社のWebサイトからダウンロードする
Kabayaki 公式サイト : http://www.kabayaki.jp/business/top/
GPL版 Kabayaki のページ : http://www.kabayaki.jp/portal/top/
ダウンロードディレクトリ : http://www.kabayaki.jp/pub/gpl/redhat90ja/RPMS/i386/
2004年6月30日に最新バージョン 1.4.0 がリリースされました。ドキュメントの入手先 : http://www.kabayaki.jp/portal/dw/
ダウンロードするのは、RedHat Linux 9用のバイナリーパッケージのすべてです。[プログラムのリスト]
オプションパック sansyo のお試し版は、Kabayaki が無事に稼動できてから自力でインストールしてください。
この sansyo の試用ライセンスは期限付きなので、Kabayaki になれてからインストールした方が安心して試せます。
http://www.kabayaki.jp/business/enq/download.cgi
ドキュメントの「インストール取扱説明書」(PDFファイル)を読ん でインストールを実行してください。
制限条項も読んでおきましょう http://www.kabayaki.jp/business/dw/restrict.html
■ ソフトウェアをインストールする
「インストール取扱説明書」の手順にしたがってソフトウェアをインストールしま す。
ソフトウェアはすべて RPM のバイナリーパッケージです。
インストールを実行して「 conflict ・ ・ ・ already installed ・ ・ ・ 」というメッセージが出たら、「すでに Linux といっしょにそのソフトウェアはインストール済みです。」というメッセージなので、そのソフトウェアはインストールをしないでください。
インストール後に、ブラウザーで「Kabayaki の画面」が閲覧できればおわりです。
かばやきサンバの使い方
Kabayaki の全文検索機能の使い方は、「取扱説明書」に書かれています。
■ かばやきサーバーを利用・設定する場合の注意点
- 制限条項により機能が制限されているので、使用前によく知っておいてください。
- 「ファイルフィルター」で表示されたすべてのファイル形式には対応してない。
- 「インデックス作成」実行後の「完了メッセージ」は、ブラウザー下側の「ステータスバー」に小さく表示されます。
- 「インデックス作成」の実行中は、Sambaサーバーでファイルの書き込みをしないこと。
■ トラブルが起きたら?
かばやきサンバを利用していてトラブルが起きたら、まず最初に Samba か Kabayaki のどらのサーバーに起因する原因か調べます。ファイルサーバーの共有ディレクトリの、ファイルを転送したり読み込むことができない場合は Samba に原因があると考えられます。また、キーワード検索でトラブルがある場合は、Kabayaki に原因があると考えられます。
機能を追加する
kabayaki 製品版(有償版)の機能を評価するために、期間限定のお試し版 sansyo を利用することができます。
ここでは sansyo については説明しないので、希望者はドキュメントを読んで使用してください。
以下のページからダウンロードしてインストールします。
sansyou のダウンロードサイト
sansyo をインストールしましたが、本質的な機能はテストできませんでした。
sansyo をインストールすることで、Kabayaki のインデックス作成時に日本語辞書に特定のキーワードを登録したり、Excel や Word のプロパティーを検索できるようになるそうです。また、「Webスパイダー」機能を利用することで、ローカル(共有ディレクトリ内)の文書だけでなく、イ ンターネット上にあるコンテンツの検索もできるそうです。
Kabayaki
メモ
かばやきサーバーの元ネタは、月刊「リナックスワールド」2003年1月号の特 集記事「Kabayakiを使って社内に検索サイトを作る」です。リナックスワールド編集部で、PDFファイルの「バックナンバー記事」を Kabayaki を使って全文検索システムを構築するという記事内容でした。
タイムインターメディア社の Kabayaki は、全文検索システム namazu.cgi をさらに使いやすくしたソフトウェアです。このページでは kabayaki の一部の機能しか使っていません。有償で使える機能も含めると、さらにいろいろな応用ができます。
■ Web検索機能をテストしたら?
Kabayaki の無償版では、Webスパイダー機能がありません。この機能が利用できると、Yahoo! や Google のようなインターネット上のWebサイトを検索することができます。しかし、特定のサイトの丸ごとコンテンツを取り込むことができれば、そのディレクトリ について「チューニング」を実行し、キーワード検索をすることができました。■ やはり kabayaki は実務系で使いやすい
今回の「かばやきサンバ」のテストは、同時にやっていた「なまずサンバ」のテスト と同一マシンで実行したために、違いがよくわかりました。どちらも検索エンジンには Namazu を利用していますが、開発者の高林さんが研究者のせいでしょうか、研究者にとっての使い勝手のよいソフトウェアになっています。自分も含めて理工系出身者 にとっては、設定作業をエディターですることに何の抵抗がありませんが、実務で利用するものにとっては高いハードルになります。その点では、 Kabayaki は Webインターフェースで設定作業ができるので、利用者にとっては配慮のある製品となっています。
マニュアルについてだけ、「できる・・・シリーズ」や「わかる・・・シリーズ」のテキスト本のような解説があると、もっといい製品になると思いま した。タイムインターメディアさん、よろしくお願いします。 m(_ _)m
■ 安定したサーバー運用をするには?
工事中
もどる