Свързани публикации 'nlp'


Използване на AI за внедряване на векторно-базирана технология в тематичното моделиране
Въведение В тази статия ще анализираме 50 хиляди туита, свързани с Covid, които изтрихме от Twitter, използвайки AI, за да извлечем основните теми, спорени от хора по света. За това количество неструктурирани данни ще ни трябват седмици, за да прочетем и класифицираме вашите данни. Тази огромна задача обаче може да се окаже безпроблемна, ако правилно знаем как да използваме най-съвременните НЛП модели. За да изпълним тази задача, ще използваме модели, наречени енкодери , и метод,..

Text Summarizer v2.0
АВТОРИ: NILP PATEL , Shrey Patel , Dhruvansh Prajapati , Samarth Puri ПРЕГЛЕД Генерирането на резюме е задача за обработка на естествен език, която включва създаване на кратко и последователно резюме на по-дълъг текст. Има различни начини за подход към тази задача, вариращи от прости методи, базирани на правила, до по-сложни модели на машинно обучение. В тази публикация в блога ще разгледаме три различни подхода за генериране на обобщения: използване на предварително обучен..

Разкриване на механизма: Разбиране на връзката между думите и НЛП
Въведение Светът на обработката на естествения език (NLP) се разви през последните години, революционизирайки начина, по който хората взаимодействат с технологиите и помежду си. В сърцето на това трансформиращо поле лежи сложният механизъм, който се стреми да разбере връзката между думите, позволявайки на машините да схванат нюансите на човешкия език. Това есе разглежда основните компоненти на механизма, който е в основата на способността ни да разбираме сложната мрежа, която свързва..

Внедряване на TFIDF от нулата.
Какво е tf-idf? Tf-idf е една от най-популярните техники, използвани за обработка на текстови данни. Компютрите не са толкова добри в работата с текстови данни, колкото са добри в работата с числови данни. Tf-idf означава термин честота, обратна на документа. Това е статистическа мярка, използвана за оценка на важността на различни думи в корпус (колекция от документи). Важността, т.е. теглото на tf-idf, е право пропорционална на броя пъти, в които една дума се появява в..

Анализ на настроението върху рецензии на филми
Въведение И така, какво точно е сантимент? Чувството е свързано със значението на дума или поредица от думи и обикновено се свързва с мнение или емоция. А анализ? Е, това е процесът на разглеждане на данни и правене на изводи; в този случай, използвайки машинно обучение, за да научите и предвидите дали рецензията на филма е положителна или отрицателна. Цел: Определяне на полярността на прегледа Като се има предвид преглед, нашата основна цел е да определим дали прегледът е..

Разпознаване на реч и повторна интерпретация на текст за ясен и устойчив на грешки текст
Не реч към текст, а реч към идея към текст Пиша тази статия с разпознаването на реч, интегрирано в Google Документи, наречено Гласово въвеждане и след това преведено на английски. Има някои много интересни функции, нещо като специални команди като преминаване на нов ред, писане на препинателни знаци, отстъп на текст и т.н. За съжаление ми се струва, че повечето от тези функции липсват на езика, на който пиша тази статия (италиански), но се надявам, че в бъдеще ще добавят и тази..

Как да спестите време за четене с помощта на AI
Четенето несъмнено е начин за разширяване на знанията и подобряване на речниковия запас. Много от богатите предприемачи четат стотици книги годишно. Но има проблем, книгите стават все по-големи с годините. В статия от 2016 г., написана от пазителя, озаглавена „ Големият въпрос: стават ли книгите по-дълги? »“, се посочва, че средната книга днес е с 25% по-голяма от преди 15 години. Средната дължина на една книга се е увеличила от 320 страници през 1999 г. на 400 през 2014 г. и този..