debian(etch)上でHyper Estraierのインデックスをクローラーを用いて作るには
マニュアルを引用する際に本家を指すのが本当だと思うのでHyper Estraierのインデックスをクローラで作りなおす。
もちろんgaucheだけじゃなくて応用が効く。
追記 2008/04/13 11:07:52: ぎゃー、このレベルの全文検索ならsite:付でgoogle検索した方がよっぽどはやい orz
以下は作成したときのログ
クローラーの探索深度はmaxdepthでコントロールする。今回はあまり迷惑をかけたくなかったので2で(笑
~/public_html/man$ mkdir gauche ~/public_html/man$ cd gauche ~/public_html/man/gauche$ ~/public_html/man/gauche$ estwaver init casket 2008-04-13T01:09:19Z INFO the root directory created ~/public_html/man/gauche$ mv casket/_conf casket/_conf.orig ~/public_html/man/gauche$ cat casket/_conf.orig | sed 's/seed: .\.0.*$//' | sed 's/seed.*$/seed: 1.0|http:\/\/practical-scheme.net\/gauche\/man\/gauche-refj.html/'| sed 's/maxdepth: 20/maxdepth: 2/' > casket/_conf ~/public_html/man/gauche$ head -3 casket/_conf # seed: 1.0|http://practical-scheme.net/gauche/man/gauche-refj.html seed: 1.0|http://practical-scheme.net/gauche/man/gauche-refj.html ~/public_html/man/gauche$ estwaver crawl caske (中略) ml/man/gauche$ estcmd search -vs casket/_index "call-with-process-io" --------[3D2DCAF72A7DDB17]-------- VERSION 1.0 NODE local HIT 2 HINT#1 call-with-process-io 2 TIME 0.002192 DOCNUM 233 WORDNUM 27266 VIEW SNIPPET --------[3D2DCAF72A7DDB17]-------- @digest=4d8367384985c45f6f71b71690aae3c2 @id=225 @mdate=Thu, 14 Feb 2008 02:13:28 GMT @size=57474 @title=Gauche ユーザリファレンス: C. Index - 手続きと構文索引: B – C @type=text/html @uri=http://practical-scheme.net/gauche/man/gauche-refj_176.html content-type=text/html; charset=euc-jp description=Gauche ユーザリファレンス: C. Index - 手続きと構文索引: B – C distribution=global generator=texi2html 1.78 keywords=Gauche ユーザリファレンス: C. Index - 手続きと構文索引: B – C resource-type=document [ < ] [ > ] [ << ] [ Up ] [ >> ] [ Top ] [ Contents ] [ Index ] [ ? ] C. Index - 手続きと構文索引 ports call-with-output-string 6.19.5 文字列ポート call-with-process-io call-with-process-io 9.16.2 Process ports call-with-string-io 6.19.5 文 (略) ~/public_html/man/gauche$ cp /usr/lib/estraier/estseek.cgi . ~/public_html/man/gauche$ cp /usr/share/hyperestraier/locale/ja/estseek.* . ~/public_html/man/gauche$ mv estseek.cgi index.cgi ~/public_html/man/gauche$ cat estseek.conf | sed 's/indexname: casket/indexname: casket\/_index/' > index.conf
再巡回は
$ estwaver crawl -revisit casket