Вопросы по теме 'fasta'
обработка файлов multiFASTA
Мне было любопытно узнать, есть ли какой-нибудь инструмент биоинформатики, способный обрабатывать файл multiFASTA, предоставляя мне такую информацию, как количество последовательностей, длину, содержание нуклеотидов / аминокислот и т. Д. И,...
2421 просмотров
schedule
16.10.2021
извлечение последовательностей fasta на основе позиции
Я новичок в Perl. Все еще учусь.
Имею файл в формате фаста. Я хотел бы извлечь последовательности, охватывающие определенную позицию. Например, с позиции 200 на 300
>Contig[0001]...
4774 просмотров
schedule
07.10.2021
чтение файла fasta на Python
Я читаю файл FASTA в таком формате:
>gi|31563518|ref|NP_852610.1| microtubule-associated proteins 1A/1B light chain 3A isoform b [Homo sapiens]...
976 просмотров
schedule
12.10.2021
Разделение data.frame на 2 столбца
У меня есть файл fasta, и я прочитал файл fasta, используя "read.delim" в R. Соответствующий data.frame выглядит следующим образом:
>tm_sd_1256 new_DF=NULL
new_DF$names=as.data.frame(names(fasta_seq))
new_DF$sequences=as.data.frame(fasta_seq)...
215 просмотров
schedule
28.11.2021
Попытка разделить фасту на более мелкие части (новичок)
Я биолог с 0 компьютерными навыками, но мне нужен простой скрипт, чтобы разделить массивную последовательность ДНК на меньшие .fasta для поиска BLAST. Я просматривал этот сайт несколько дней, чтобы найти безрезультатный ответ. Я практически...
773 просмотров
schedule
21.11.2021
Как выполнить множественное совпадение и напечатать разное количество строк после каждого шаблона с помощью awk
У меня есть большой файл с тысячами строк, который выглядит так:
>ENST00001234.1
ACGTACGTACGG
TTACCCAGTACG
ATCGCATTCAGC
>ENST00002235.4
TTACGCAT
TAGGCCAG
>ENST00005546.9
TTTATCGC
TTAGGGTAT
Я хочу использовать grep для определенных...
96 просмотров
schedule
21.09.2021
Как записать список строк в текстовый (FASTA) файл?
В настоящее время я пишу программу, которая принимает множество различных аминокислотных последовательностей (цепочек), расщепляет их ферментом, а затем возвращает полученные пептиды (множество более мелких цепочек).
Я написал программу, и она...
49 просмотров
schedule
13.11.2021
Как получить полное название аминокислоты при переводе последовательности в R?
Я хочу перевести первые 15 оснований последовательности, а затем найти из них название последней аминокислоты. У меня есть свой фаст-файл. Файл fasta предназначен для последовательности MTHFR для генома человека.
library("Biostrings")...
59 просмотров
schedule
06.11.2021
Python: как вывести заголовок FASTA или цифру индекса хромосомы в зависимости от местоположения?
У меня есть код, который помогает мне перемещать окно размера 5, когда оно движется слева направо. Файл находится в формате fasta с заголовком>, например, хромосома, за которым следует индекс хромосомы. Я хотел бы вывести порядковый номер заголовка...
117 просмотров
schedule
28.02.2022
Как искать и изолировать атрибуты текста в формате FASTA в R
У меня есть файл в формате FASTA, который, по сути, представляет собой специальный текстовый файл, содержащий множество записей, одна из которых выглядит, как показано ниже, которую я присвоил имени «FASTA» в R. Исходный файл был красным и...
994 просмотров
schedule
01.04.2022
Добавить имя файла в заголовки fasta нескольких файлов fasta внутри цикла
У меня есть 10 файлов fasta (каждый файл с 20 последовательностями генов из каждого из 10 образцов). Я хотел бы создать 20 файлов, специфичных для каждого гена, из 10 образцов. Я поступил следующим образом, чтобы извлечь гены с именем файла в...
769 просмотров
schedule
02.04.2022
рассчитать длину последовательности после добавления длины предыдущих последовательностей
Я хочу определить длину отдельных последовательностей в файле multifasta. Я получил этот код биопитона из руководства по био как:
from Bio import SeqIO
import sys
cmdargs = str(sys.argv)
for seq_record in SeqIO.parse(str(sys.argv[1]), "fasta"):...
100 просмотров
schedule
13.04.2022
Выборочное объединение элементов массива в меньшее количество элементов нового массива
У меня возникли проблемы с обработкой массива данных последовательности ДНК в формате .fasta. Что мне особенно хотелось бы сделать, так это взять файл с несколькими тысячами последовательностей и присоединить данные последовательности для каждой...
220 просмотров
schedule
02.06.2022
получить определенную последовательность из файла fasta с помощью Regex
Я хотел бы получить n th последовательность (или предпочтительно n th по m th последовательность) из входного файла fasta, в идеале с unix "один лайнер".
Я знаю, что могу прочитать последовательность с помощью Perl (или любого другого языка...
310 просмотров
schedule
29.05.2022
Как заказать несколько файлов выравнивания Fasta
Я уверен, что это легко сделать, но у меня очень ограниченный опыт в биоинформатике.
У меня есть много 100 000 файлов FASTA, содержащих выравнивания разных генов одних и тех же 12 видов. Каждый файл выглядит примерно так:
>dmel...
417 просмотров
schedule
27.05.2022
извлекать/разбирать большие мультифасты на выравнивания, используя таблицу (csv, tsv)
Мне часто нужно разбить большой мультифаст на отдельные мультифасты для последующего выравнивания, используя таблицу, сгенерированную из какой-то другой программы/кода.
У меня есть большая мультифаста (seq.fa):
>sp1_gene1
ATTAC...
250 просмотров
schedule
16.06.2022
Преобразование плоских файлов GenBank в FASTA
Мне нужно разобрать предварительный плоский файл GenBank. Последовательность еще не опубликована, поэтому я не могу найти ее по присоединению и загрузить файл FASTA. Я новичок в биоинформатике, поэтому может ли кто-нибудь показать мне, где я могу...
2300 просмотров
schedule
30.06.2022
Биостроки ошибки DNAStringSet в R
Я опубликовал это же затруднительное положение на Biostars, но похоже, что трафик там низкий, поэтому я подумал, что могу изложить его здесь.
Я пытаюсь импортировать fasta-файл последовательностей в R, используя пакет Bioconductors «Biostrings» и...
1071 просмотров
schedule
29.06.2022
Как присоединиться к определенным элементам в списке
Мой список выглядит так:
['', 'CCCTTTCGCGACTAGCTAATCTGGCATTGTCAATACAGCGACGTTTCCGTTACCCGGGTGCTGACTTCATACTT
CGAAGA', 'ACCGGGCCGCGGCTACTGGACCCATATCATGAACCGCAGGTG', '', '', 'AGATAAGCGTATCACG...
1001 просмотров
schedule
07.07.2022
Как читать сразу несколько строк? (сценарий практики)
Я делаю сценарий парсера .fasta. (Я знаю, что для файлов .fasta уже существуют парсеры, но мне нужна практика работы с большими файлами, и я подумал, что это хорошее начало).
Цель программы: взять очень большой .fasta файл с несколькими...
108 просмотров
schedule
01.07.2022