Это, по общему признанию, похоже на (но не дубликат) Сравнение полнотекстовой поисковой системы - Lucene, Sphinx, Postgresql, MySQL?, однако то, что я ищу для конкретных, поддерживаемых, рекомендаций из опыта работы с более чем одной из доступных систем (кажется, много: "Я использовал lucene, но не сфинкс" и наоборот).
Настройка: стандартная LAMP (Mysql 5.0, PHP 5).
MySQL: таблицы используют механизм InnoDB для ограничений внешнего ключа
Мы смотрим на индексирование данных, а не на страницы. данные, подлежащие индексированию, могут быть на нескольких языках (utf-8 charset)
Ряд сравнений, с которыми я столкнулся (например, http://blog.evanweaver.com/articles/2008/03/17/rails-search-benchmarks/), либо не полностью применимы (хорек - это люциновый порт но не то же самое, что и Zend_Search_Lucene), или они нажимают свои собственные системы/реализации (не совсем непредвзятые).
Некоторые другие, с которыми я столкнулся (например, http://whatstheplot.com/blog/tag/lucene/ и http://pagetracer.com/2008/02/15/sphinx-and-lucene-search-engines-first-impressions/) дают очень разные результаты для производительности двух систем.
Кроме того, все, кроме игнорирования в большинстве того, что я читал, Xapian. Возможно, это тоже стоит рассмотреть?
Итак... Я надеюсь, что некоторые из вас здесь, на SO, имеют некоторый опыт в этом вопросе и могут помочь с некоторыми рекомендациями или указать мне в правильном направлении.