Ограничение длины прохода для ответа на вопрос AllenNLP

Я новичок в AllenNLP и в настоящее время использую его предварительно обученную модель ответов на вопросы. Интересно, есть ли у него ограничение по длине прохода для обеспечения его производительности? Я знаю, что BERT будет иметь максимальную длину 512 и будет обрезать более длинные отрывки.

Я пробовал более длинные отрывки на AllenNLP, и кажется, что это работает, но я просто хочу подтвердить. Спасибо.


person mattstack    schedule 12.11.2020    source источник


Ответы (1)


Да, эта модель действительно ограничивает длину отрывка (контекст), а также, возможно, вопрос. Вы можете узнать больше о том, как это делается, в документации по API: https://docs.allennlp.org/models/master/models/rc/dataset_readers/transformer_squad/.

Но подведем итог: отрывок будет проанализирован на несколько входных экземпляров путем скольжения по окну из stride токенов, когда отрывок + вопрос содержат более length_limit токенов.

person petew    schedule 12.11.2020
comment
Спасибо за ваш ответ! Могу ли я узнать, может ли AllenNLP отвечать на вопросы с открытым доменом или отвечать на вопросы с несколькими проходами? Интересно, как мне использовать AllenNLP, если в моем отрывке около 10К слов. Спасибо! - person mattstack; 19.11.2020