Фиды Google Search Appliance (GSA) — непредсказуемое поведение

В нашем проекте есть фид метаданных и URL-адресов и фид контента. Поведение индексирования документов, отправленных с использованием любого канала, совершенно непредсказуемо. Для фида контента документы каждый раз удаляются из индекса через случайный интервал. Для канала метаданных и URL дополнительные метаданные, которые мы добавляем, игнорируются, опять же случайным образом. В последнем случае сами документы остаются в индексе — удаляются только наши пользовательские метаданные. По сути, похоже, что через какое-то время GSA «забывает» каналы. Что может быть причиной этой проблемы, и как мы можем отладить это?

Примечания: 1) По неизбежным причинам наш индекс GSA всегда колеблется в пределах лицензионного ограничения (+/- 1000 документов или около того). Может ли это иметь эффект? Очищаются ли фиды, когда приближается лимит лицензии? Однако в записях канала у нас установлено «lock = true». 2) Эти подаваемые документы не связаны со страницами и, следовательно, (я полагаю) будут иметь низкий рейтинг страницы. Каналы автоматически очищаются, если на них нет ссылок со страниц? 3) Наши последующие шаблоны включают поданные документы. 4) Мы не используем action=delete с одними и теми же документами, поэтому такая возможность исключена. Также для ленты контента мы всегда публикуем все документы. Поэтому они не удаляются через фиды.


person Vasan    schedule 23.12.2014    source источник


Ответы (1)


Когда вы достигнете предела лицензии, GSA начнет удалять документы из индекса, поэтому я бы сказал, что это определенно ваша проблема.

person BigMikeW    schedule 26.12.2014