Я использовал scikit CountVectorizer для преобразования коллекции документы в матрицу количества токенов. Я также использовал его max_features, который учитывает верхние max_features, упорядоченные по частоте терминов в корпусе.
Теперь я хочу проанализировать выбранный мной корпус, особенно я хочу знать частоту токенов в выбранном словаре. Но я не могу найти простого способа сделать это. Так что любезно помогите мне в этом отношении.