Hyper Estraier:インデックス管理系コマンド

Hyper Estraierは、主に estcmd というコマンドを使用してインデックスを管理します。
estcmd は非常に多くのオプションがあり、機能も多機能なので、そのうちの代表的なものだけここでは紹介します。

スポンサーリンク

インデックス作成

まず初めにインデックスを作成します。

 % estcmd gather -il ja -sd index_path target_path

index_path はインデックスとなるディレクトリ、target_path は検索対象となるディレクトリです。
-sd はファイルの作成日時と更新日時をインデックスに記録するというオプションで、次回から差分のみ更新する場合に必要となります。

2回目からは以下のようにしてインデックスを更新します。
-cm はインデックス内に存在しないか、更新日時が新しい文書のみを登録するオプションです。
-cl は上書きされた文書が含んでいた語句のインデックスを再構築するオプションです。

 % estcmd gather -cl -il ja -sd -cm index_path target_path

インデックス表示

以下を実行すると、インデックスに登録されている文書のID,uriの一覧を表示することができます。

 % estcmd list index_path

インデックス削除


インデックスから明示的にファイル情報を指定して削除するには以下のようにします。

 % estcmd out -cl index_path expr

expr は、uri、ローカルパス、IDですが、正規表現が使えないので少々不便。
安全面を考えると仕方ないのかも知れませんが。

検索対象となるファイル群からファイルが削除された際には、以下のようにしてインデックスからそのファイル情報を削除します。

 % estcmd purge  -cl index_path

上書きされたファイルや削除されたファイルは、上記の更新や削除を行ってもマークが付けられているだけで実際にはインデックス上に残っています。
以下のようにして、これらを実際に削除してインデックスを最適化します。

 % estcmd optimize   index_path

インデックス修復

インデックス作成中の異常終了等により、インデックスが壊れることがあります。
その時にはダメ元で以下のように修復を試みてみましょう。

 % estcmd repair index_path

コメント

タイトルとURLをコピーしました