Введение
Существует множество предварительно обученных моделей, предоставляемых facebook, google или исследовательскими институтами (например, Academic SINICA на Тайване). Учащиеся могут загружать эти предварительно обученные модели, играть с ними и даже проводить исследования в соответствии с Garg el al., (2017).
Загрузка предварительно обученных моделей
английские модели
- Facebook FastText https://fasttext.cc/docs/en/crawl-vectors.html
- Новости Google https://code.google.com/archive/p/word2vec/
- Модель NYTimes предоставлена Garg et al., (2o17) http://stanford.edu/~nkgarg/NYTembeddings/
- https://nlp.stanford.edu/projects/histwords/
китайские модели
- CKIP http://ckip.iis.sinica.edu.tw:8080/license/ всего 1,2 ГБ
- https://github.com/Embedding/Chinese-Word-Vectors
- https://github.com/facebookresearch/fastText/blob/master/docs/crawl-vectors.md
Ссылка
- Гарг, Н., Шибингер, Л., Джурафски, Д., и Зоу, Дж. (2017). Встраивание слов в количественный анализ гендерных и этнических стереотипов за 100 лет, 115(16). https://doi.org/10.1073/pnas.1720347115
- Сюй Х., Сяо Д., Ву Л. и Ван С.-Дж. (2018). Скрытая форма историй выявляет предвзятость к позитиву и гендерную предвзятость. Получено с https://arxiv.org/abs/1811.04599