Публикации по теме 'tf-idf'
TF-IDF
давайте начнем с tf-idf.
tf-idf означает частоту термина — обратную частоту документа. это мощная техника, позволяющая понять, о чем документ. это используется в области интеллектуального анализа текста и поиска информации.
что такое частота терминов (TF) — измеряет, сколько раз слово встречается в документе. иногда слово может появляться много раз в более длинном документе и мало раз в маленьком документе, поэтому оно делится на длину документа.
TF = количество раз, когда слово..