単件検索と多件検索に対するアドレス空間分離

ここで インデックス=DB-コンテンツ であると定義すると

コンテンツとインデックスの維持コスト及び導出コストは明らかに異なる
コンテンツ:最も基本的なデータ単位であり、単件に対するアクセスなので高速で常に速度が一定である必要がある。
インデックス:コンテンツの組み合わせにより表現される、コンテンツを素でかつ連続的に座標軸として表現した際、n個のキーによる検索はn次元ベクトルとして表現できる、n次元ベクトルの要素集合は算出コストが常に変動するものであり、検索式によってそのコストが異なる(例えば、既存のnグラムDBにおけるキラーワード(例えば「の」)での検索コストは以上に高い)ため導出コストがあらかじめ計算できない。

以上の理由により、コンテンツとインデックスは別の名前空間に保持されるべきである。

ここで、コンテンツとインデックスの名前空間を分離する際にホストからも分離することによりそのコストの差異をマシンで表現することが可能となる。

例:
contents.n9d.com : コンテンツ
index.n9d.com :インデックス

こうすることによりネットワーク資源をも配分することが可能となり、たとえインデックスシステムがダウンしたとしてもコンテンツは常に一定の速度でかつ高速に提供し続けることが出来る。