У меня довольно грязный текстовый файл, который мне нужно преобразовать в фрейм данных для использования в качестве справочных данных. Выдержка показана ниже:
Я очистил его как можно лучше, но, короче говоря, я хотел бы разграничить большую часть каждой строки пробелом, а затем фиксированным разграничением последнего столбца. то есть игнорировать пробелы в последнем разделе.
Текстовый файл очищенных данных
Может ли кто-нибудь указать мне в правильном направлении ресурс, который может это сделать? Не уверены, что Pandas справится с этим?
Кенни
P.S. Я нашел несколько отличных ресурсов для очистки нескольких пробелов и замены разрывов строк. Извините, не могу найти оригинальную ссылку, поэтому смотрите прикрепленный файл.
fin = open("Input.txt", "rt")
fout = open("Ouput.txt", "wt")
for line in fin:
fout.write(re.sub(' +', ' ', line).strip() + "\n")
fin.close()
fout.close()