У меня есть файл fasta, и я прочитал файл fasta, используя "read.delim" в R. Соответствующий data.frame выглядит следующим образом:
>tm_sd_1256new_DF=NULL
new_DF$names=as.data.frame(names(fasta_seq))
new_DF$sequences=as.data.frame(fasta_seq)
1
MJAKDHRZTASDJASJDKASJDURUJDFLSDJFSDIFJKSDFKSJDFLJSDLFD
ASDJASDJ
>tm_sd_5672_1_2
AIZZTQBCSKLKDSHDADBCMSJHKQUWIRJHJJKKDLJSGDHASGDZGDHGHAGSDZASDASDVASGASDHGCAHGS
SADASDA[sample.fasta file][1]
>tm_sd_543_1_2
MUZTREQWERNBVXCYMNMVHZTOPOPOEURDASDOPOQWEUZQUIZRZIRIEIWUEWASDHASHDAHSDHAKHHSDHASHDJASHDAHUWIEUROWUOERUOWEUROOWWWW
>tm_sd_212_0_2
MTZTPSPASDASZDATSZGZASDZATSDASDARSDASDASDASDASDZTASZDTAXAYXFASTDRASRZWUEWERZWERZ
Я хотел бы разделить этот data.frame на два столбца: один столбец для имен последовательности, а другой столбец для соответствующих последовательностей.
Я создал data.frame и сохранил имена последовательностей в одном столбце, но когда я попытался сохранить соответствующие последовательности в другом столбце, мне выдали ошибку, в которой говорилось, что у замены 55 строк, а у данных 436 строк.
Следующий код, который я пробовал, дал мне следующую ошибку:
new_DF=NULL
new_DF$names=as.data.frame(names(fasta_seq))
new_DF$sequences=as.data.frame(fasta_seq)
Как я могу добиться этого с помощью R., пожалуйста, помогите мне.