Я хочу определить длину отдельных последовательностей в файле multifasta. Я получил этот код биопитона из руководства по био как:
from Bio import SeqIO
import sys
cmdargs = str(sys.argv)
for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):
output_line = '%s\t%i' % \
(seq_record.id, len(seq_record))
print(output_line)
Мой входной файл выглядит так:
>Protein1
MNT
>Protein2
TSMN
>Protein3
TTQRT
И код дает:
Protein1 3
Protein2 4
Protein3 5
Но я хочу рассчитать длину последовательности после добавления длины предыдущих последовательностей. Это было бы так:
Protein1 1-3
Protein2 4-7
Protein3 8-12
Я не знаю, в какой из приведенных выше строк кода мне нужно изменить, чтобы получить этот результат. Буду признателен за любую помощь в этом вопросе, спасибо!!!!