Hyper Estraierは、主に estcmd
というコマンドを使用してインデックスを管理します。estcmd
は非常に多くのオプションがあり、機能も多機能なので、そのうちの代表的なものだけここでは紹介します。
インデックス作成
まず初めにインデックスを作成します。
% estcmd gather -il ja -sd index_path target_path
index_path
はインデックスとなるディレクトリ、target_path
は検索対象となるディレクトリです。-sd
はファイルの作成日時と更新日時をインデックスに記録するというオプションで、次回から差分のみ更新する場合に必要となります。
2回目からは以下のようにしてインデックスを更新します。-cm
はインデックス内に存在しないか、更新日時が新しい文書のみを登録するオプションです。-cl
は上書きされた文書が含んでいた語句のインデックスを再構築するオプションです。
% estcmd gather -cl -il ja -sd -cm index_path target_path
インデックス表示
以下を実行すると、インデックスに登録されている文書のID,uriの一覧を表示することができます。
% estcmd list index_path
インデックス削除
インデックスから明示的にファイル情報を指定して削除するには以下のようにします。
% estcmd out -cl index_path expr
expr
は、uri、ローカルパス、IDですが、正規表現が使えないので少々不便。
安全面を考えると仕方ないのかも知れませんが。
検索対象となるファイル群からファイルが削除された際には、以下のようにしてインデックスからそのファイル情報を削除します。
% estcmd purge -cl index_path
上書きされたファイルや削除されたファイルは、上記の更新や削除を行ってもマークが付けられているだけで実際にはインデックス上に残っています。
以下のようにして、これらを実際に削除してインデックスを最適化します。
% estcmd optimize index_path
インデックス修復
インデックス作成中の異常終了等により、インデックスが壊れることがあります。
その時にはダメ元で以下のように修復を試みてみましょう。
% estcmd repair index_path
コメント