Статьи по теме fasttext

Публикации по теме 'fasttext'

Извлекательное суммирование с использованием кластеризации K-средних, роли векторов слов и fastText.

В наши дни с обилием цифровых СМИ и бесчисленным количеством новостей очень трудно переварить всю возможную информацию, и из-за этого читатель часто теряет интерес к определенным темам за очень короткий промежуток времени. Следовательно, в наши дни очень важно генерировать краткие резюме или выделять статьи. Резюме имеет 2 разновидности: Извлекающее и Абстрактное резюме. Абстрактные резюме, как правило, представляют собой суть полного текста в совершенно новой форме, а с другой..

Что, если бы ваш компьютер мог читать?

Сегодня мы можем печатать больше, чем говорить, огромное количество текстовых данных генерировалось каждую минуту с цифровой эры. Данные - новое масло (и даже более ценное для тех, кто умеет его смешивать). Однако человеческий мозг не умеет читать большие объемы текста. Наши глаза ограничены с двух сторон, что не позволяет нормальному человеку читать более 200–300 слов в минуту. Согласно Книге рекордов Гиннеса , Мария Тереза Кальдерон может читать более 50 000 слов в минуту: в 166..

Вопросы по теме 'fasttext'

Как распечатать отчет о классификации в FastText?

Я использую FastText и для оценки результатов моей классификации (двоичной классификации), и я хотел бы распечатать оценку соответствия. На самом деле в качестве вывода у меня есть точность и отзыв. Вот мой код: train_file = 'train.csv'...

225 просмотров

python scikit-learn fasttext

14.09.2021

Учебный набор для автоматической настройки параметров Fasttext

Я использую код автоматической настройки для моделей классификации в библиотеке fasttext, и я не могу найти, обучена ли конечная модель, которую он дает вам, только на обучающем наборе или на обоих обучающих и проверочных наборах. Например, когда,...

32 просмотров

python fasttext

08.11.2021

Воспроизведение FastText - это 'nan', но точность - это число

Я обучил контролируемую модель в FastText, используя интерфейс Python, и получаю странные результаты по точности и отзыву. Сначала я обучил модель: model = fasttext.train_supervised("train.txt", wordNgrams=3, epoch=100,...

801 просмотров

python-3.x nlp fasttext text-classification precision-recall

01.02.2022

Понимание get_sentence_vector () и get_word_vector () для fasttext

Я хочу получить вложения пары слов или фраз и вычислить сходство. Я заметил, что сходство остается таким же, когда я переключаюсь между get_sentence_vector () и get_word_vector () для слова. Например, я могу переключить метод при вычислении...

851 просмотров

nlp fasttext word-embedding

18.03.2022

Обертка Python arround fasttext train с настройкой параметров

Я использую Fasttext для классификации токсичных комментариев (конкурс Kaggle). Чтобы обучить мою модель, я запускаю команду fasttext supervised -input model_train.train -output model_tune -autotune-validation model_train.valid...

197 просмотров

python scikit-learn fasttext

04.04.2022

подобие предобученных предложений fasttext

Я хочу использовать предварительно обученные модели fasttext для вычисления сходства предложения между набором предложений. Может кто-нибудь мне помочь? какой подход лучше? Я вычислил сходство между предложениями, обучив tfidf-модели. напишите...

3635 просмотров

python nlp fasttext sentence-similarity information-retrieval

08.04.2022

Каков формат ввода fastText и почему моя модель не дает мне значимого аналогичного вывода?

Моя цель - найти сходство между словом и документом. Например, я хочу найти сходство между новым и документом, для простоты скажем Hello World !. Я использовал word2vec от gensim, но проблема в том, что он не находит сходства с невидимым словом....

313 просмотров

nlp sentiment-analysis fasttext word2vec sentence-similarity

08.04.2022

Как подготовить данные для word2vec в gensim и fasttext?

Я хочу обучить word2vec и fasttext, чтобы получить векторы для определенного набора данных, который у меня есть. Что моя модель должна использовать в качестве входных данных? Мой файл такой: Customer_4: I want to book a ticket to New York....

451 просмотров

python machine-learning gensim fasttext word2vec

22.04.2022

Как заставить 2 версии оболочки Fasttext Python работать вместе?

Некоторое время мы использовали потрясающую библиотеку Facebook Fasttext. Мы получаем доступ к обученным моделям с помощью оболочки python ( https://pypi.org/project/fasttext/ ). Раньше это была сторонняя библиотека, но теперь поддерживается...

236 просмотров

pip python fasttext

13.08.2022

Предварительно обученная модель Fasttext возвращает тарабарщину для слов вне словарного запаса

У меня возникла проблема при использовании предварительно обученной модели fasttext.bin (полученной из https://fasttext.cc/docs/en/crawl-vectors.html ). Проверка most_similar на наличие слов в словаре дает разумные ответы. Однако при проверке...

286 просмотров

python gensim fasttext

01.09.2022

Процесс завершен с кодом выхода -1073740791 (0xC0000409) ошибка pycharm

Я пытаюсь использовать fastText с PyCharm. Всякий раз, когда я запускаю код ниже: import fastText model=fastText.train_unsupervised("data_parsed.txt") model.save_model("model") Процесс завершается с этой ошибкой: Process finished...

17483 просмотров

python pycharm fasttext

16.09.2022

Размер окна FastText

В настоящее время я работаю над неконтролируемым обучением fastText. Я хотел уточнить кое-что о контекстном окне, представленном в документации fastText. В описании библиотеки fasttext для python...

21 просмотров

fasttext

29.09.2022

ValueError: встраивание переменной уже существует, оно запрещено. Вы хотели установить reuse=True в VarScope? Первоначально определено

На основе этой ссылки github https://github.com/brightmart/text_classification/tree/master/a03_TextRNN Когда я запускаю train a03_TextRNN с google_news_wor22vec.bin и текстовым файлом с моими документами + ярлыками , у меня есть эти ошибки:...

944 просмотров

classification multilabel-classification fasttext text-classification rnn

06.04.2023

Установите fasttext в Windows 10 с помощью Anaconda

Я пытаюсь установить fasttext в anaconda с Windows 10 с помощью команды: pip install fasttext, как описано здесь: https://pypi.org/project/fasttext/ Сообщения об ошибках: ValueError: Unknown MS Compiler version 1900 а также Command...

2698 просмотров

python windows anaconda fasttext

04.04.2023

Каковы значения по умолчанию для быстрого текста gensim?

Я не могу найти ничего о значениях по умолчанию для параметров для gensim fasttext здесь Или они такие же, как и в оригинальной реализации Fasttext Facebook?

179 просмотров

gensim fasttext

11.02.2023

Представление Fasttext для короткой фразы, но не для более длинной фразы, содержащей короткую

Я использую Gensim для загрузки немецких .bin файлов из Fasttext , чтобы получить векторные представления для слов и фраз, не входящих в словарь. Пока все работает нормально, и в целом я достиг хороших результатов. Я знаком с KeyError :'all...

659 просмотров

python nlp gensim fasttext

18.03.2023

обучение моделей fasttext с контентом, созданным в социальных сетях

В настоящее время я изучаю классификацию текста с помощью Facebook FastText. Я нашел некоторые данные из Kaggle, которые содержат такие символы, как �� или имя пользователя и хэштеги Twitter. Я пытался искать в Интернете, однако нет разъяснений о...

42 просмотров

machine-learning nlp fasttext text-classification

27.05.2023

В чем разница между args wordNgrams, minn и maxn в обучении с учителем fassttext?

Я немного сбит с толку после прочтения «Мешка уловок» для эффективной классификации текста. В чем разница между args wordNgrams , minn и maxn Например, задача классификации текста и внедрение перчаток как предварительно обученных векторов....

160 просмотров

fasttext text-classification supervised-learning

13.12.2022

Почему FastText не справляется с поиском фраз из нескольких слов?

Предварительно обученная модель FastText отлично подходит для поиска похожих слов: from pyfasttext import FastText model = FastText('cc.en.300.bin') model.nearest_neighbors('dog', k=2000) [('dogs', 0.8463464975357056), ('puppy',...

221 просмотров

nlp fasttext

15.01.2023

Как классифицировать естественные языки, написанные другими формами символов?

Фон Я хотел бы классифицировать все три фразы как китайские, 'zh' используя fastText. ["Ni hao!", '你好!', 'ni hao!'] Однако обученная модель выглядит непригодной для семантической классификации. Есть ли идея сделать одну и ту же...

87 просмотров

python-3.x python machine-learning nlp fasttext

07.07.2023