debian(etch)上でHyper Estraierのインデックスをクローラーを用いて作るには

マニュアルを引用する際に本家を指すのが本当だと思うのでHyper Estraierのインデックスをクローラで作りなおす。
もちろんgaucheだけじゃなくて応用が効く。




追記 2008/04/13 11:07:52: ぎゃー、このレベルの全文検索ならsite:付でgoogle検索した方がよっぽどはやい orz




以下は作成したときのログ
クローラーの探索深度はmaxdepthでコントロールする。今回はあまり迷惑をかけたくなかったので2で(笑

~/public_html/man$ mkdir gauche
~/public_html/man$ cd gauche
~/public_html/man/gauche$ 
~/public_html/man/gauche$ estwaver init casket
2008-04-13T01:09:19Z    INFO    the root directory created
~/public_html/man/gauche$ mv casket/_conf casket/_conf.orig
~/public_html/man/gauche$ cat casket/_conf.orig | sed 's/seed: .\.0.*$//' | sed 's/seed.*$/seed: 1.0|http:\/\/practical-scheme.net\/gauche\/man\/gauche-refj.html/'| sed 's/maxdepth: 20/maxdepth: 2/' > casket/_conf
~/public_html/man/gauche$ head -3 casket/_conf
# seed: 1.0|http://practical-scheme.net/gauche/man/gauche-refj.html
seed: 1.0|http://practical-scheme.net/gauche/man/gauche-refj.html

~/public_html/man/gauche$ estwaver crawl caske
(中略)
ml/man/gauche$ estcmd search -vs casket/_index "call-with-process-io" 
--------[3D2DCAF72A7DDB17]--------
VERSION 1.0
NODE    local
HIT     2
HINT#1  call-with-process-io    2
TIME    0.002192
DOCNUM  233
WORDNUM 27266
VIEW    SNIPPET

--------[3D2DCAF72A7DDB17]--------
@digest=4d8367384985c45f6f71b71690aae3c2
@id=225
@mdate=Thu, 14 Feb 2008 02:13:28 GMT
@size=57474
@title=Gauche ユーザリファレンス: C. Index - 手続きと構文索引: B – C
@type=text/html
@uri=http://practical-scheme.net/gauche/man/gauche-refj_176.html
content-type=text/html; charset=euc-jp
description=Gauche ユーザリファレンス: C. Index - 手続きと構文索引: B – C
distribution=global
generator=texi2html 1.78
keywords=Gauche ユーザリファレンス: C. Index - 手続きと構文索引: B – C
resource-type=document

[ < ] [ > ] [ << ] [ Up ] [ >> ] [ Top ] [ Contents ] [ Index ] [ ? ] C. Index - 手続きと構文索引

 ports call-with-output-string 6.19.5 文字列ポート 
call-with-process-io    call-with-process-io
 9.16.2 Process ports call-with-string-io 6.19.5 文
(略)
~/public_html/man/gauche$ cp /usr/lib/estraier/estseek.cgi .
~/public_html/man/gauche$ cp /usr/share/hyperestraier/locale/ja/estseek.* .
~/public_html/man/gauche$ mv estseek.cgi index.cgi
~/public_html/man/gauche$ cat estseek.conf | sed 's/indexname: casket/indexname: casket\/_index/' > index.conf

再巡回は

$ estwaver crawl -revisit casket