Вопросы по теме 'fasta'

обработка файлов multiFASTA
Мне было любопытно узнать, есть ли какой-нибудь инструмент биоинформатики, способный обрабатывать файл multiFASTA, предоставляя мне такую ​​информацию, как количество последовательностей, длину, содержание нуклеотидов / аминокислот и т. Д. И,...
2421 просмотров

извлечение последовательностей fasta на основе позиции
Я новичок в Perl. Все еще учусь. Имею файл в формате фаста. Я хотел бы извлечь последовательности, охватывающие определенную позицию. Например, с позиции 200 на 300 >Contig[0001]...
4774 просмотров
schedule 07.10.2021

чтение файла fasta на Python
Я читаю файл FASTA в таком формате: >gi|31563518|ref|NP_852610.1| microtubule-associated proteins 1A/1B light chain 3A isoform b [Homo sapiens]...
976 просмотров
schedule 12.10.2021

Разделение data.frame на 2 столбца
У меня есть файл fasta, и я прочитал файл fasta, используя "read.delim" в R. Соответствующий data.frame выглядит следующим образом: >tm_sd_1256 new_DF=NULL new_DF$names=as.data.frame(names(fasta_seq)) new_DF$sequences=as.data.frame(fasta_seq)...
215 просмотров
schedule 28.11.2021

Попытка разделить фасту на более мелкие части (новичок)
Я биолог с 0 компьютерными навыками, но мне нужен простой скрипт, чтобы разделить массивную последовательность ДНК на меньшие .fasta для поиска BLAST. Я просматривал этот сайт несколько дней, чтобы найти безрезультатный ответ. Я практически...
773 просмотров
schedule 21.11.2021

Как выполнить множественное совпадение и напечатать разное количество строк после каждого шаблона с помощью awk
У меня есть большой файл с тысячами строк, который выглядит так: >ENST00001234.1 ACGTACGTACGG TTACCCAGTACG ATCGCATTCAGC >ENST00002235.4 TTACGCAT TAGGCCAG >ENST00005546.9 TTTATCGC TTAGGGTAT Я хочу использовать grep для определенных...
96 просмотров
schedule 21.09.2021

Как записать список строк в текстовый (FASTA) файл?
В настоящее время я пишу программу, которая принимает множество различных аминокислотных последовательностей (цепочек), расщепляет их ферментом, а затем возвращает полученные пептиды (множество более мелких цепочек). Я написал программу, и она...
49 просмотров
schedule 13.11.2021

Как получить полное название аминокислоты при переводе последовательности в R?
Я хочу перевести первые 15 оснований последовательности, а затем найти из них название последней аминокислоты. У меня есть свой фаст-файл. Файл fasta предназначен для последовательности MTHFR для генома человека. library("Biostrings")...
59 просмотров
schedule 06.11.2021

Python: как вывести заголовок FASTA или цифру индекса хромосомы в зависимости от местоположения?
У меня есть код, который помогает мне перемещать окно размера 5, когда оно движется слева направо. Файл находится в формате fasta с заголовком>, например, хромосома, за которым следует индекс хромосомы. Я хотел бы вывести порядковый номер заголовка...
117 просмотров
schedule 28.02.2022

Как искать и изолировать атрибуты текста в формате FASTA в R
У меня есть файл в формате FASTA, который, по сути, представляет собой специальный текстовый файл, содержащий множество записей, одна из которых выглядит, как показано ниже, которую я присвоил имени «FASTA» в R. Исходный файл был красным и...
994 просмотров
schedule 01.04.2022

Добавить имя файла в заголовки fasta нескольких файлов fasta внутри цикла
У меня есть 10 файлов fasta (каждый файл с 20 последовательностями генов из каждого из 10 образцов). Я хотел бы создать 20 файлов, специфичных для каждого гена, из 10 образцов. Я поступил следующим образом, чтобы извлечь гены с именем файла в...
769 просмотров
schedule 02.04.2022

рассчитать длину последовательности после добавления длины предыдущих последовательностей
Я хочу определить длину отдельных последовательностей в файле multifasta. Я получил этот код биопитона из руководства по био как: from Bio import SeqIO import sys cmdargs = str(sys.argv) for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):...
100 просмотров
schedule 13.04.2022

Выборочное объединение элементов массива в меньшее количество элементов нового массива
У меня возникли проблемы с обработкой массива данных последовательности ДНК в формате .fasta. Что мне особенно хотелось бы сделать, так это взять файл с несколькими тысячами последовательностей и присоединить данные последовательности для каждой...
220 просмотров
schedule 02.06.2022

получить определенную последовательность из файла fasta с помощью Regex
Я хотел бы получить n th последовательность (или предпочтительно n th по m th последовательность) из входного файла fasta, в идеале с unix "один лайнер". Я знаю, что могу прочитать последовательность с помощью Perl (или любого другого языка...
310 просмотров
schedule 29.05.2022

Как заказать несколько файлов выравнивания Fasta
Я уверен, что это легко сделать, но у меня очень ограниченный опыт в биоинформатике. У меня есть много 100 000 файлов FASTA, содержащих выравнивания разных генов одних и тех же 12 видов. Каждый файл выглядит примерно так: >dmel...
417 просмотров

извлекать/разбирать большие мультифасты на выравнивания, используя таблицу (csv, tsv)
Мне часто нужно разбить большой мультифаст на отдельные мультифасты для последующего выравнивания, используя таблицу, сгенерированную из какой-то другой программы/кода. У меня есть большая мультифаста (seq.fa): >sp1_gene1 ATTAC...
250 просмотров

Преобразование плоских файлов GenBank в FASTA
Мне нужно разобрать предварительный плоский файл GenBank. Последовательность еще не опубликована, поэтому я не могу найти ее по присоединению и загрузить файл FASTA. Я новичок в биоинформатике, поэтому может ли кто-нибудь показать мне, где я могу...
2300 просмотров
schedule 30.06.2022

Биостроки ошибки DNAStringSet в R
Я опубликовал это же затруднительное положение на Biostars, но похоже, что трафик там низкий, поэтому я подумал, что могу изложить его здесь. Я пытаюсь импортировать fasta-файл последовательностей в R, используя пакет Bioconductors «Biostrings» и...
1071 просмотров
schedule 29.06.2022

Как присоединиться к определенным элементам в списке
Мой список выглядит так: ['', 'CCCTTTCGCGACTAGCTAATCTGGCATTGTCAATACAGCGACGTTTCCGTTACCCGGGTGCTGACTTCATACTT CGAAGA', 'ACCGGGCCGCGGCTACTGGACCCATATCATGAACCGCAGGTG', '', '', 'AGATAAGCGTATCACG...
1001 просмотров
schedule 07.07.2022

Как читать сразу несколько строк? (сценарий практики)
Я делаю сценарий парсера .fasta. (Я знаю, что для файлов .fasta уже существуют парсеры, но мне нужна практика работы с большими файлами, и я подумал, что это хорошее начало). Цель программы: взять очень большой .fasta файл с несколькими...
108 просмотров
schedule 01.07.2022