Project

General

Profile

Actions

日本語全文検索の環境づくり » History » Revision 1

Revision 1/15 | Next »
Masanori Machii, 09/21/2011 03:26 PM


日本語全文検索の環境づくり

文書管理プラグイン DMFS(オリジナル版)は,検索エンジンに Xapian を利用しています.そのため,日本語による検索が事実上,不可能になっています.そこで,DMSF が利用している Xapian を Hyper Estraier へ置き換えるのですが,それでも例えば PDF や MS-Office 文書からテキストを抽出する機能もサーバー上へ構築しなければなりません.

この環境づくりに関する手順はネット上でも探せますが,特にバージョンの相性については,ノウハウが共有できているとは言えない状況です.ここでは Linux に限って,明らかになったノウハウを少しずつ,蓄積しようと思っています.


Updated by Masanori Machii , Updated over 13 years ago
Access count: 54561 :since 2009-10-30

Updated by Masanori Machii over 13 years ago · 15 revisions