Нам нужно удалить строки из обоих файлов, если значение первого столбца отсутствует в другом файле.
Давайте рассмотрим два файла CSV:
file1.csv:
yrdi_391 111 1.11 1.0 1.1 111.0
yfyrn_9132 222 2.22 2.0 2.2 222.0
kdkfke_392 999 9.99 9.0 9.9 999.0
hfeisk_3 333 3.33 3.0 3.3 333.0
file2.csv:
yrdi_391 444 4.44 4.0 4.4 444.0
yfyrn_9132 555 5.55 5.0 5.5 555.0
hfeisk_3 666 6.66 6.0 6.6 666.0
fhedn_271 888 8.88 8.0 8.8 888.0
Теперь нам нужно удалить всю строку, начинающуюся с kdkfke_392
, из file1.csv
, поскольку ее там нет file2.csv
.
С другой стороны, нам нужно удалить всю строку, начинающуюся с fhedn_271
, поскольку ее нет в file1.csv
.
Ожидаемый результат:
file1.csv:
yrdi_391 111 1.11 1.0 1.1 111.0
yfyrn_9132 222 2.22 2.0 2.2 222.0
hfeisk_3 333 3.33 3.0 3.3 333.0
file2.csv:
yrdi_391 444 4.44 4.0 4.4 444.0
yfyrn_9132 555 5.55 5.0 5.5 555.0
hfeisk_3 666 6.66 6.0 6.6 666.0
На данный момент строки в file1.csv
и file2.csv
не сортируются. При необходимости мы можем сначала выполнить сортировку, а затем применить удаление.
Манипуляции, связанные с Pandas CVS, предпочтительнее, так как в обоих файлах есть заголовки, и мы должны их сохранить.
Новичок в написании скриптов на Python!
Любая помощь будет принята с благодарностью!