[FESS] ファイルサーバーの全文検索システムを作る方法

その他ウェブアプリ

全文検索システムであるFESSを使用すれば、ファイルサーバーにWebインターフェースの全文検索機能を追加できる。PDFやMSオフィス文書を含む大量のファイルを全文検索できれば、蓄積してきたファイルの資産価値を爆発的に高めることができる。

FESSを使用すれば全文検索システムを簡単に実現できるが、いくつか注意すべきポイントがある。以下にFESS 11.0での作業手順を示す。

(1) FESS管理画面から[ファイルシステム] → [新規作成]をクリック

(2)ファイルクロールの設定画面から名前とパスを指定する。

名前はなんでも好きな名前をつければOK。ファイルパスに検索対象のファイルを集めたフォルダを指定する。

ポイントは、例えばWindowsのC:\mydocフォルダを指定する場合、FESSでは以下のように記述しなければならないことである。

file:/C:/mydoc

ここが第1のポイントである。

ここまで設定してクロールを実行すればローカルファイルの全文検索は既に可能となっている。しかしこの段階で検索を実行すると、ヒットした文書のURLが「file:/C:/mydoc/文書ファイル名」の状態となってしまい、現実的には使い物にならない。URLを「https://…」のような形式に書き換える必要がある。そのために必要なのが以下に示すパスマッピングという手順である。

(3) FESS管理画面から[パスマッピング] → [新規作成]をクリック

(4) 正規表現にローカルファイルのパスを、置換にURLを指定する。

例えば以下のように指定する。

正規表現 file:/C:/mydoc/

置換 https://ドメイン名/mydoc

これは「file:/C:/mydoc/」という検索結果を「https://ドメイン名/mydoc」に書き換えよという指示である。各自のサーバー環境にあわせて上記の文字列は変更すればよい。

なお処理の種類は「表示」とすると、検索結果の出力時にパスの書き換えを実行してくれるようだ。

以上の設定によりファイルサーバーに全文検索機能を盛り込むことができる。

関連

Apache経由でFessにアクセスする

コメント