Вопросы по теме 'dna-sequence'
Итерации по списку, где мне нужно получить данные из первого элемента для использования в последнем элементе
Это продолжение предыдущего вопроса, который я задал: Обработка подсписка переменного размера в большом списке .
Мне удалось использовать itertools для извлечения групп фрагментов ДНК, но теперь я столкнулся с другой проблемой.
Мне нужно...
103 просмотров
schedule
26.10.2021
Извлечение нескольких последовательностей из файла fasta размером 7 ГБ с использованием идентификаторов из отдельного текстового файла
После нескольких часов поиска на этом веб-сайте и пробования множества разных вещей, которые не работали, я решил опубликовать свой вопрос. В настоящее время у меня есть текстовый файл (id.txt), который содержит около 100 строк следующих IDS в этой...
369 просмотров
schedule
18.10.2021
Как использовать as.DNAbin {ape} с последовательностями ДНК, хранящимися во фрейме данных?
У меня есть фреймворк с названиями локусов в одном столбце и последовательностями ДНК в другом. Я пытаюсь использовать as.DNAbin{ape} или что-то подобное для создания объекта ДНКбин.
Вот несколько примеров данных:
х
Если я попробую...
6123 просмотров
schedule
20.03.2022
Однозначная хеш-функция для строки длиной 76 символов
Вот моя проблема (я программирую на C):
У меня есть несколько огромных текстовых файлов, содержащих последовательности ДНК (каждый файл имеет примерно 65 миллионов строк и размер около 4 ~ 5 ГБ). В этих файлах много дубликатов (пока не знаю,...
654 просмотров
schedule
19.05.2022
Показать только оценку выравнивания ДНК в биопитоне
У меня есть данные о последовательности ДНК. Например,
X="ACGGGT"
Y="ACGGT"
Я хочу знать оценку выравнивания, поэтому я использовал функцию парного 2 биопитона. Например,
from Bio import pairwise2
from Bio.pairwise2 import...
840 просмотров
schedule
15.05.2022
Использование grep для поиска файлов последовательности ДНК
Я пытаюсь использовать grep Unix для поиска определенных последовательностей в файлах. Файлы обычно очень большие (~ 1 ГБ) с буквами «A», «T», «C» и «G». Эти файлы также занимают много-много строк, каждая из которых представляет собой слово из 60...
2327 просмотров
schedule
02.06.2022
Как заказать несколько файлов выравнивания Fasta
Я уверен, что это легко сделать, но у меня очень ограниченный опыт в биоинформатике.
У меня есть много 100 000 файлов FASTA, содержащих выравнивания разных генов одних и тех же 12 видов. Каждый файл выглядит примерно так:
>dmel...
417 просмотров
schedule
27.05.2022
schedule
29.05.2022
Генерация случайных последовательностей ДНК
Я пытаюсь генерировать случайные последовательности ДНК в питоне, используя случайные числа и случайные строки. Но я получаю только одну строку в качестве вывода. Например: если я даю ДНК длиной 5 (строка (5)), я должен получить вывод «CTGAT»....
10058 просмотров
schedule
16.06.2022
Как присоединиться к определенным элементам в списке
Мой список выглядит так:
['', 'CCCTTTCGCGACTAGCTAATCTGGCATTGTCAATACAGCGACGTTTCCGTTACCCGGGTGCTGACTTCATACTT
CGAAGA', 'ACCGGGCCGCGGCTACTGGACCCATATCATGAACCGCAGGTG', '', '', 'AGATAAGCGTATCACG...
1001 просмотров
schedule
07.07.2022
Нужен скрипт или программное обеспечение для удаления непарных чтений из парных конечных чтений.
Я хочу использовать AMOScmp для анализа парных конечных данных Illumina. AMOScmp требует такое же количество парных файлов для создания файла .afg. Исходные файлы fq являются парными. После того, как я пропустил файлы fq по отдельности через...
1213 просмотров
schedule
17.07.2022
ДНК-цепочка на фрагменты
set.seed(101)
genome <- paste(sample(c("A", "C", "T", "G"), 1000, replace = TRUE), collapse = "")
Мне нужно создать фрагменты из 50 из приведенной выше последовательности. Я пытался использовать цикл for, но не могу понять. Пожалуйста...
70 просмотров
schedule
16.07.2022
Вычисление расстояния редактирования последовательности ДНК питона
Итак, мне дали задание согласовать наименьшую стоимость между двумя последовательностями ДНК. Один из неудачных входов:
CGCAATTCTGAAGCGCTGGGGAAGACGGGT & TATCCCATCGAACGCCTATTCTAGGAT
Правильное выравнивание стоит 24, но я получаю...
1106 просмотров
schedule
22.07.2022
Считайте файл fasta в матрицу или вектор для функции MolecularEntropy в R
Я новичок в R, поэтому, пожалуйста, извините мой очень простой вопрос. Я хочу использовать функцию MolecularEntropy: https://www.rdocumentation.org/packages/HDMD/versions/1.2/topics/MolecularEntropy
Я пытался использовать разные функции быстрого...
400 просмотров
schedule
26.07.2022
Как найти последовательность, которая не может дать никаких результатов по Blast, но дает по FASTA?
Мне нужно найти последовательность ДНК или белка (запрос), которая не может дать никаких результатов с помощью Blast. В то же время это должно дать результат, когда я помещаю его в инструмент FASTA.
Что я могу искать?
63 просмотров
schedule
19.09.2022
Поиск строки с учетом одного несоответствия в любом месте строки
Я работаю с последовательностями ДНК длиной 25 (см. Примеры ниже). У меня есть список из 230 000, и мне нужно искать каждую последовательность во всем геноме (паразит toxoplasma gondii). Я не уверен, насколько велик геном, но он намного длиннее 230...
23910 просмотров
schedule
31.12.2022
R- Как построить правильные круговые диаграммы в сетях гаплотипов haploNet {pegas} {ape} {adegenet}
При использовании пакета haploNet для создания графиков в сети гаплотипов я использовал для этого скрипт, доступный в Интернете. Однако я думаю, что что-то не так. Скрипт доступен в виде примера Woodmouse. Код, который я использовал:
x <-...
1948 просмотров
schedule
18.12.2022
Python: печатайте молекулярную массу для однозначных последовательностей ДНК, пропуская неоднозначные последовательности.
Мне нужно написать функцию, которая принимает имя файла (файл fasta) в качестве аргумента, считывает последовательности и для каждой однозначной последовательности печатает идентификатор последовательности и ее молекулярный вес. Файлы fasta содержат...
672 просмотров
schedule
27.10.2022
Python-скрипт, который должен переводить 1000 последовательностей ДНК в белки с помощью 1152 различных кодонов, не работает.
Сейчас работаю над проектом по биоинформатике для дипломной работы. Я написал Python-скрипт, который должен переводить список строк из 1000 ДНК-последовательностей в белки по 1152 различным codontables (генетическим кодам). Эти кодонтаблицы...
105 просмотров
schedule
31.07.2023
Создание хэша массивов последовательностей ДНК, Perl
У меня есть хеш с именем %id2seq , который содержит строки последовательностей ДНК, на которые ссылается ключ $id . Я хочу иметь возможность манипулировать последовательностями ДНК, используя позицию в строке в качестве ссылки. Например, если бы...
133 просмотров
schedule
06.04.2023