かばやきサンバの使い方

Updated : 2004/07/25     



■ このページでは かばやきサンバの使い方を説明しています
ファイルサーバーの共有ディレクトリに蓄積したファイルについて、検索用インデックスを作成し、キーワードで検索す る手順を説明します。
基本的な検索操作は Yahoo や Google の検索と同じなので、検索用インデックスの作成を注意深く設定・実行してください。
■  メニュー

検索用インデックスを作成する
  1. 「サーバー環境情報」で基本設定を確認する
  2. 「インデックス一覧」で検索用インデックスを新規作成 ( 登録 ) する
  3. 「コンテンツ設定」でディレクトリを関連付ける
  4. 「フィルター設定」でインデックスを作成するファイルのタイプを指定する。
  5. 「チューニング」でインデックス作成を実行する。
  6. 「ログ一覧」でインデックス作成過程をチェックする。
キーワード検索する

● 「チューニン グ」のパラメーターを再設定する

● 「インデックスファイ ル作成」を自動的にタイマー実行させる

● Kabayaki のテーマ画面をえらぶ 




  検索用インデックスを作成する

 キーワード検索をするために、Samba サーバー上の共有ファイルのインデックスファイルを作成させます。Kabayaki にインデックスを作成させる対象範囲のディレクトリを指定します。
インデックスファイル作成では、画像ファイルや実行プログラムなどの明らかに「キーワード検索する必要のないファイル」もあります。とくに画像ファイルは 大容量なために、処理時間がかかってしまいます。そこで、ファイルサイズ、ファイル形式 ( ファイル拡張子による判別 ) のフィルターを設定して、インデックスを作成しない設定ができます。

1、 「サーバー環境情報」で基本設定を確認する

最初に Kabayaki の設定画面をブラウザーで表示させます。

URL: http://[かばやきサンバのIPアドレス]/kabayaki/cgi-bin/admin/rc.cgi

  事例 : http://192/168.0.100/kabayaki/cgi-bin/admin/rc.cgi
最初の画面


2、 「インデックス一覧」で検索用インデックスを新規作成 ( 登録 ) する

  「新規作成」 のボタンをクリックする
1

●「内部名」と「表示名」を設定します。
  この2つは、これから作成する1つのインデックスについての2枚のラベルと考えるとわかりやすいです。
  「内部名」は コンピューター内部処理用のラベルで、半角英数[0-9][a-Z]  の8文字以内で設定します。
  「表示名」は人間が インデックスの判別に使うためのラベルで日本語でも表記できます。(セットになっています。)

2
  設定後に画面下の「保存」ボタンをクリックします。



3、 「コンテンツ設定」でディレクトリを関連付ける

  つぎに「コンテンツ設定」をクリックして、インデックスを作成するディレクトリを指定します。
3
インデックスを作成したいディレクトリのパスを設定して保存します。
Sambaの共有ディレクトリ内にある全ファイルについて、インデックスを作成してキーワード検索したいので、「共有ディレクトリ」のパスを設定して保存 します。
4

 インデックスを作成する対象のディレクトリとして、「共有ディレクトリ」の /var/archives/cabinet を設定しています。
 設定後に画面下の「保存」ボタンをクリックします。

5

「閲覧時のURL」は、検索でヒットした(共有ディレクトリ内の)ファイルを、Samba ではなく Apache で閲覧できるように「共有ディレクトリ」のネットワーク上でのアドレスで指定します。

URL :  http:// [ かばやきサンバの I Pアドレス ]/[ 共有ディレクトリ名 ]

「Sambaの共有ディレクトリ」 /var/archives/cabinet  は、ブラウザーで http://192.168.0.100/cabinet/ をアクセスすれば閲覧でできるように関連付けて設定しています。設定後に画面下の「保存」ボタンをクリックします。

4、 「フィルター設定」でインデックスを作成するファイルのタイプを指定する

インデックス作成をする時の「ファイルタイプの選別基準」を設定します。
 画像やバイナリファイルなどは文字情報が少ないので、除外することで処理時間を短縮できます。

6s
7s
  最初はデフォルト設定 ( すべてのファイル形式を対象にする)で実行してください。
  設定後に画面下の「保存」ボタンをクリックします。

※ 使用方法になれたら、画像ファイル形式 *.jpg、*,bmp、*.gif、*.png、・ ・ ・ などを除外する設定にしてください。
  インデックス作成時間の短縮に効果的です!


5、 「チューニング」でインデックス作成を実行する

9

  「手動実行」ボタンのとなりの □再構築 をチェックする。
  画面下の「保存」ボタンをクリックする。
  「手動実行」ボタンをクリックして実行を開始させる。

▲ デフォルト設定値について ▲

・ インデックス作成時に使用するメモリー量が 5MB に設定されています。
   サーバーに実装しているメモリーの割当てれてる最適値をあとで設定してください。

・ インデックス作成対象のファイルの上限容量は、2MBに設定されています。
   あとで保存してあるファイルの最大容量よりも大きめに設定します。

・ テキストサイズの上限容量が 600KB に設定されています。
   PDFファイルなどでは画像、フォント、テキストを1つのファイルに含んでいるので、
   おおよそテキスト文量をカバーできる容量を設定します。


10

   「インデックス作成にはたくさん時間がかかるので、辛抱強くまってておくれ ・ ・ ・ 。」というメッセージが出る。
「OK」をクリックすると、インデックス作成が開始される。

実際のインデックス作成は、Namazu、chasen などによる日本語単語の分かち書き処理などを Perl スクリプトで実行するので、終了するまでは、共有ファイルの書き込みは禁止するのが安全です。



6、 「ログ一覧」でインデックス作成過程をチェックする

11

  インデックスファイル作成後、「ログ一覧」をクリックしてログを確認します。
  インデックスファイル作成作業中にエラーが発生した場合は、この画面にてエラー原因の手がかりを発見できます。
  また、「フィルター設定」の設定条件により、インデックスファイルが作成されなかったファイルなどもわかります。
  フィルターの適切な設定条件をしらべるには、このログを確認してしらべましょう。




  キーワード検索する

以上の手順で共有ディレクトリ内にあるファイルの「全文検索用インデックス」が作 成できました。


1、 Kabayaki の検索画面から、次のアドレスを指定してキーワード検索画面を表示させる

URL: http://[かばやきサンバのIPアドレス]/kabayaki/

  事例 : http://192/168.0.100/kabayaki/
検索画面

2、検索したいキーワードを入力して「Search」ボタンをクリックする

検索キーワードの入力画面 キーワードを入れてクリック


3、検索結果がランク付けされて表示されるので適当なアドレスをクリックして元 ファイルを開いてみ


検索結果の表示画面 元ファイルのリンクをクリック


検索したキーワードがヒットすれば、上記のように ファイル名、スコア、ファイルの冒頭部分、・ ・ ・ などが列記される。
上記の画面の「ファイルのアドレス」をクリックして、該当するファイルが開いて閲覧できれば、かばやきサンバのキーワード検索が成功したことになります。




   「チューニング」のパラ メーターを再設定する 

 「チューニング」のセクションでは、インデックスファイル作成のメモリー設定が ありました。
これは、キーワード検索対象にならない画像ファイルやバイナリーファイルを除いて、インデックスファイルを作成するのに役立ちます。
デフォルト設定値では、ファイルサイズの上限が 2MByte、テキストファイルサイズの上限が 600KByte に設定されています。

チューニングのパラメーターを設定する

ファイルサイズの上限値 : テキスト文を含むファイルで、最大容量値をもつファイルを少し上まわる容量を設定する。
テキストサイズの上限値 : PDFファイルで、最大容量値をもつファイルと同じ容量を設定する。
使用メモリーサイズの上限値 : サーバーのメモリー(RAM)のうち割り当てできる適切な量を設定する。




  「インデックスファイル作成」を自 動的に定時実行させる  

 インデックスの作成処理は、対象となるファイルが大きくなるほどサーバーにとっ て負荷が大きくなります。
また、インデックス作成処理中は、Sambaの共有ディレクトリのファイルを削除したり、新たに追加するとエラーの原因になります。その解決策として、イ ンデックス作成処理を、通常業務に影響のない夜間などに自動実行させる機能があります。

インデックス作成の自動実行を設定する

 インデックスを作成する周期と実行時刻を設定して「保存ボタン」をクリックします。
時刻は業務に支障のない時間帯を設定します。




  Kabayaki のテーマ画面をえらぶ

 Kabayaki のトップページのテーマ( 表示デザイン ) は4種類用意されていて選ぶことができます。

1、「サーバー環境情報」の設 定画面をひらく

テーマを選んで設定を保存する
 テーマは4種あるので、テーマの登録変更した場合は「保存」ボタンをクリックする。

2、テーマの画面を選ぶ

次の4種類からテーマを選ぶことができます。

@ default
  default


A enterprise
  enterprise

B hobby
  hobby

C namazu
  namazu
    Namazu の場合だけ、キーワード入力画面のテーマは default と同じになる。
 使いやすいテーマを選んで設定してみましょう。