Публикации по теме 'fasttext'


Извлекательное суммирование с использованием кластеризации K-средних, роли векторов слов и fastText.
В наши дни с обилием цифровых СМИ и бесчисленным количеством новостей очень трудно переварить всю возможную информацию, и из-за этого читатель часто теряет интерес к определенным темам за очень короткий промежуток времени. Следовательно, в наши дни очень важно генерировать краткие резюме или выделять статьи. Резюме имеет 2 разновидности: Извлекающее и Абстрактное резюме. Абстрактные резюме, как правило, представляют собой суть полного текста в совершенно новой форме, а с другой..

Что, если бы ваш компьютер мог читать?
Сегодня мы можем печатать больше, чем говорить, огромное количество текстовых данных генерировалось каждую минуту с цифровой эры. Данные - новое масло (и даже более ценное для тех, кто умеет его смешивать). Однако человеческий мозг не умеет читать большие объемы текста. Наши глаза ограничены с двух сторон, что не позволяет нормальному человеку читать более 200–300 слов в минуту. Согласно Книге рекордов Гиннеса , Мария Тереза ​​Кальдерон может читать более 50 000 слов в минуту: в 166..

Вопросы по теме 'fasttext'

Как распечатать отчет о классификации в FastText?
Я использую FastText и для оценки результатов моей классификации (двоичной классификации), и я хотел бы распечатать оценку соответствия. На самом деле в качестве вывода у меня есть точность и отзыв. Вот мой код: train_file = 'train.csv'...
225 просмотров
schedule 14.09.2021

Учебный набор для автоматической настройки параметров Fasttext
Я использую код автоматической настройки для моделей классификации в библиотеке fasttext, и я не могу найти, обучена ли конечная модель, которую он дает вам, только на обучающем наборе или на обоих обучающих и проверочных наборах. Например, когда,...
32 просмотров
schedule 08.11.2021

Воспроизведение FastText - это 'nan', но точность - это число
Я обучил контролируемую модель в FastText, используя интерфейс Python, и получаю странные результаты по точности и отзыву. Сначала я обучил модель: model = fasttext.train_supervised("train.txt", wordNgrams=3, epoch=100,...
801 просмотров

Понимание get_sentence_vector () и get_word_vector () для fasttext
Я хочу получить вложения пары слов или фраз и вычислить сходство. Я заметил, что сходство остается таким же, когда я переключаюсь между get_sentence_vector () и get_word_vector () для слова. Например, я могу переключить метод при вычислении...
851 просмотров
schedule 18.03.2022

Обертка Python arround fasttext train с настройкой параметров
Я использую Fasttext для классификации токсичных комментариев (конкурс Kaggle). Чтобы обучить мою модель, я запускаю команду fasttext supervised -input model_train.train -output model_tune -autotune-validation model_train.valid...
197 просмотров
schedule 04.04.2022

подобие предобученных предложений fasttext
Я хочу использовать предварительно обученные модели fasttext для вычисления сходства предложения между набором предложений. Может кто-нибудь мне помочь? какой подход лучше? Я вычислил сходство между предложениями, обучив tfidf-модели. напишите...
3635 просмотров

Каков формат ввода fastText и почему моя модель не дает мне значимого аналогичного вывода?
Моя цель - найти сходство между словом и документом. Например, я хочу найти сходство между новым и документом, для простоты скажем Hello World !. Я использовал word2vec от gensim, но проблема в том, что он не находит сходства с невидимым словом....
313 просмотров

Как подготовить данные для word2vec в gensim и fasttext?
Я хочу обучить word2vec и fasttext, чтобы получить векторы для определенного набора данных, который у меня есть. Что моя модель должна использовать в качестве входных данных? Мой файл такой: Customer_4: I want to book a ticket to New York....
451 просмотров

Как заставить 2 версии оболочки Fasttext Python работать вместе?
Некоторое время мы использовали потрясающую библиотеку Facebook Fasttext. Мы получаем доступ к обученным моделям с помощью оболочки python ( https://pypi.org/project/fasttext/ ). Раньше это была сторонняя библиотека, но теперь поддерживается...
236 просмотров
schedule 13.08.2022

Предварительно обученная модель Fasttext возвращает тарабарщину для слов вне словарного запаса
У меня возникла проблема при использовании предварительно обученной модели fasttext.bin (полученной из https://fasttext.cc/docs/en/crawl-vectors.html ). Проверка most_similar на наличие слов в словаре дает разумные ответы. Однако при проверке...
286 просмотров
schedule 01.09.2022

Процесс завершен с кодом выхода -1073740791 (0xC0000409) ошибка pycharm
Я пытаюсь использовать fastText с PyCharm. Всякий раз, когда я запускаю код ниже: import fastText model=fastText.train_unsupervised("data_parsed.txt") model.save_model("model") Процесс завершается с этой ошибкой: Process finished...
17483 просмотров
schedule 16.09.2022

Размер окна FastText
В настоящее время я работаю над неконтролируемым обучением fastText. Я хотел уточнить кое-что о контекстном окне, представленном в документации fastText. В описании библиотеки fasttext для python...
21 просмотров
schedule 29.09.2022

ValueError: встраивание переменной уже существует, оно запрещено. Вы хотели установить reuse=True в VarScope? Первоначально определено
На основе этой ссылки github https://github.com/brightmart/text_classification/tree/master/a03_TextRNN Когда я запускаю train a03_TextRNN с google_news_wor22vec.bin и текстовым файлом с моими документами + ярлыками , у меня есть эти ошибки:...
944 просмотров

Установите fasttext в Windows 10 с помощью Anaconda
Я пытаюсь установить fasttext в anaconda с Windows 10 с помощью команды: pip install fasttext, как описано здесь: https://pypi.org/project/fasttext/ Сообщения об ошибках: ValueError: Unknown MS Compiler version 1900 а также Command...
2698 просмотров
schedule 04.04.2023

Каковы значения по умолчанию для быстрого текста gensim?
Я не могу найти ничего о значениях по умолчанию для параметров для gensim fasttext здесь Или они такие же, как и в оригинальной реализации Fasttext Facebook?
179 просмотров
schedule 11.02.2023

Представление Fasttext для короткой фразы, но не для более длинной фразы, содержащей короткую
Я использую Gensim для загрузки немецких .bin файлов из Fasttext , чтобы получить векторные представления для слов и фраз, не входящих в словарь. Пока все работает нормально, и в целом я достиг хороших результатов. Я знаком с KeyError :'all...
659 просмотров
schedule 18.03.2023

обучение моделей fasttext с контентом, созданным в социальных сетях
В настоящее время я изучаю классификацию текста с помощью Facebook FastText. Я нашел некоторые данные из Kaggle, которые содержат такие символы, как �� или имя пользователя и хэштеги Twitter. Я пытался искать в Интернете, однако нет разъяснений о...
42 просмотров

В чем разница между args wordNgrams, minn и maxn в обучении с учителем fassttext?
Я немного сбит с толку после прочтения «Мешка уловок» для эффективной классификации текста. В чем разница между args wordNgrams , minn и maxn Например, задача классификации текста и внедрение перчаток как предварительно обученных векторов....
160 просмотров

Почему FastText не справляется с поиском фраз из нескольких слов?
Предварительно обученная модель FastText отлично подходит для поиска похожих слов: from pyfasttext import FastText model = FastText('cc.en.300.bin') model.nearest_neighbors('dog', k=2000) [('dogs', 0.8463464975357056), ('puppy',...
221 просмотров
schedule 15.01.2023

Как классифицировать естественные языки, написанные другими формами символов?
Фон Я хотел бы классифицировать все три фразы как китайские, 'zh' используя fastText. ["Ni hao!", '你好!', 'ni hao!'] Однако обученная модель выглядит непригодной для семантической классификации. Есть ли идея сделать одну и ту же...
87 просмотров