У меня есть текстовый файл (.txt), в каждой строке которого есть твит. Каждый твит отделяется новой строкой. Я хочу загрузить файл в WEKA, но он поддерживает только .arff в качестве входных данных. Я намерен сгруппировать твиты, используя некоторые методы кластеризации, так как мне преобразовать текстовый файл в arff.
Вот скриншот данных.