В настоящее время я работаю над неконтролируемым обучением fastText. Я хотел уточнить кое-что о контекстном окне, представленном в документации fastText.
В описании библиотеки fasttext для python https://github.com/facebookresearch/fastText/tree/master/python для обучения модели fastText есть разные аргументы, один из аргументов,
- ws: размер контекстного окна
Мой входной файл содержит строки с 2-3 токенами.
Eg.,
- Старший администратор базы данных
- Старший программист DotNet
- Администратор сети
- Главный программист (мейнфрейм)
Размер окна по умолчанию 5. Здесь, в приведенном выше примере, у меня есть строки с числом токенов меньше, чем размер окна. Что произойдет, если размер окна больше длины документа?