Я хочу проиндексировать следующее поле:
quick brown fox
Таким образом, поиск точно по всем трем словам, в любом порядке, будет успешным, но поиск только нескольких слов (например, «коричневая лиса») будет пропущен.
Другими словами, я хочу создать индекс / запрос, чтобы верно следующее:
# input for field
quick brown fox
# hits
brown fox quick
fox quick brown
quick brown fox
...
# misses
quick brown
fox
quick brown fox red
...
Похоже, для этого мне пришлось бы создать собственный токенизатор. Токенизатор, который разбивает входной поток на эти перестановки ключевых слов. Я не знаю, с чего начать. Я использую рубин / шину. Это правильная идея? Как мне создать собственный токенизатор?
quick
илиbrown
в запрос. Есть смысл? - person Dane O'Connor   schedule 17.07.2013