Как Sphinx хранит пустые поля и как это влияет на производительность?

Я подумываю об использовании запроса sphinx для индексации многих полей (в сотнях), многие из которых будут нулевыми. Мой вопрос в том, насколько большое количество нулевых полей повлияет на производительность?

Эта ситуация возникает не из-за невероятно денормализованных данных, а из-за требований к интерфейсу поиска и тому, что можно искать. По сути, я буду динамически строить конфигурацию индекса в индексированной модели, и в результате я могу получить довольно много пустых полей.

Я предполагаю, что производительность / успех этого зависит от того, что Sphinx делает с нулевыми значениями ... если он просто игнорирует их, тогда со мной все будет в порядке, но если он действительно хранит, что поле имеет нулевое значение в своем индексе, я мог бы иметь проблема.


person Ben Crouse    schedule 07.01.2009    source источник


Ответы (2)


По-видимому, текущая версия Sphinx ограничивает 32 текстовых поля на индекс (неограниченное числовое значение), поэтому мне пришлось бы разделить данные на несколько разных индексов, чтобы достичь этого, если бы все данные не могли быть представлены в числовом виде (что мой не может). Вернуться к доске для рисования!

person Ben Crouse    schedule 07.01.2009
comment
Ограничение Sphinx в 32 текстовых поля на индекс не соответствует действительности. Я без проблем запускаю Sphinx со 150 текстовыми полями на индекс. - person Iaroslav Vorozhko; 15.07.2012

Большое количество пустых полей не сильно повлияет на производительность. Основная проблема со многими пустыми полями в том, что они съедают хороший кусок памяти.

person Iaroslav Vorozhko    schedule 15.07.2012