LinkedInが IndexTankをオープンソース化した。これはドキュメント インデックスエンジンでクラウド上で走り、ユーザーはインデックス処理をカスタマイズし、その結果に手を加えることができる。
IndexTank は約1年前にリリースされ、 10月にLinkedInによって買収され 、最近オープンソースになった。IndexTankはクラウドサービスでGoogle Custom Search に似ており、 Amazon Web Services上で走り、webサイトに、訪問者がそのコンテンツを後で検索できるようにインデックス付けできる機能を提供する。IndexTankが言うには、ユーザーはインデックス付けされたもの、その結果をソートする時刻や方法について完全にコントロールできる。ということは、webサイトは自分達の好むドキュメントが検索結果の先頭に来るように、Googleの検索アルゴリズムを頼らずにプロモートできる。
多くのwebサイトと違って、IndexTankはインデックス付けのためにwebページを這い回ることはせず、webサイトがインデックス付けされるデータをインデックスエンジンに送る。その結果、ドキュメントは生きた結果を提供しながら、その生成直後にインデックス付けされる。またこのサービスは無料である。
IndexTankには主に3つのコンポーネントがある。
- Index Engine – このエンジンは単純なテキストのみにインデックス付けできる。 PDF, MS Doc、他のドキュメントタイプは、インデックス付けのためにテキストに変換する必要がある。
- API – RESTfulインターフェースにJava, Python, .NET, Ruby 、PHPクライアントからアクセスできる
- Nebulizer – マルチテナントのフレームワークで、IaaSインフラ上で走るインデックスエンジンをいくつでもホストできる
IndexTankは Zoieと一緒になる。これは Apache Lucene上に構築されたリアルタイム検索エンジンで、2008年に LinkedInからオープンソース化された。
IndexTankの話しでは、1年で何千もの顧客を持つことになり、一番有名なのはRedditであるが、会社はLinkedInに買収された時点では未だ儲かっていない。
IndexTankのソースコードはGitHubで入手できる。Index Engineと APIそしてNebulizerが。