ДНК-цепочка на фрагменты

set.seed(101) 
genome <- paste(sample(c("A", "C", "T", "G"), 1000, replace = TRUE), collapse = "")

Мне нужно создать фрагменты из 50 из приведенной выше последовательности. Я пытался использовать цикл for, но не могу понять. Пожалуйста помоги. Я новичок в программировании на R.

Геном состоит из 20 генов, каждый из которых имеет длину 50 оснований. Первые 50 оснований в геноме соответствуют первому гену, следующие 50 оснований — второму гену и т. д.


person menaka bolaki    schedule 10.03.2015    source источник


Ответы (1)


Ты можешь попробовать

 res1 <- strsplit(genome, '(?<=.{50})', perl=TRUE)[[1]]
 nchar(res1)
 #[1] 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50 50

Или используя stringi

 library(stringi)
 res2 <- stri_extract_all_regex(genome, '.{1,50}')[[1]]
person akrun    schedule 10.03.2015