プロジェクト

全般

プロフィール

日本語全文検索の環境づくり » 履歴 » バージョン 1

Masanori Machii, 2011/09/21 15:26

1 1 Masanori Machii
h1. 日本語全文検索の環境づくり
2
3
{{>toc}}
4
5
文書管理プラグイン DMFS(オリジナル版)は,検索エンジンに Xapian を利用しています.そのため,日本語による検索が事実上,不可能になっています.そこで,DMSF が利用している Xapian を Hyper Estraier へ置き換えるのですが,それでも例えば PDF や MS-Office 文書からテキストを抽出する機能もサーバー上へ構築しなければなりません.
6
7
この環境づくりに関する手順はネット上でも探せますが,特にバージョンの相性については,ノウハウが共有できているとは言えない状況です.ここでは Linux に限って,明らかになったノウハウを少しずつ,蓄積しようと思っています.