Вопросы по теме 'dna-sequence'

Итерации по списку, где мне нужно получить данные из первого элемента для использования в последнем элементе
Это продолжение предыдущего вопроса, который я задал: Обработка подсписка переменного размера в большом списке . Мне удалось использовать itertools для извлечения групп фрагментов ДНК, но теперь я столкнулся с другой проблемой. Мне нужно...
103 просмотров
schedule 26.10.2021

Извлечение нескольких последовательностей из файла fasta размером 7 ГБ с использованием идентификаторов из отдельного текстового файла
После нескольких часов поиска на этом веб-сайте и пробования множества разных вещей, которые не работали, я решил опубликовать свой вопрос. В настоящее время у меня есть текстовый файл (id.txt), который содержит около 100 строк следующих IDS в этой...
369 просмотров

Как использовать as.DNAbin {ape} с последовательностями ДНК, хранящимися во фрейме данных?
У меня есть фреймворк с названиями локусов в одном столбце и последовательностями ДНК в другом. Я пытаюсь использовать as.DNAbin{ape} или что-то подобное для создания объекта ДНКбин. Вот несколько примеров данных: х Если я попробую...
6123 просмотров
schedule 20.03.2022

Однозначная хеш-функция для строки длиной 76 символов
Вот моя проблема (я программирую на C): У меня есть несколько огромных текстовых файлов, содержащих последовательности ДНК (каждый файл имеет примерно 65 миллионов строк и размер около 4 ~ 5 ГБ). В этих файлах много дубликатов (пока не знаю,...
654 просмотров
schedule 19.05.2022

Показать только оценку выравнивания ДНК в биопитоне
У меня есть данные о последовательности ДНК. Например, X="ACGGGT" Y="ACGGT" Я хочу знать оценку выравнивания, поэтому я использовал функцию парного 2 биопитона. Например, from Bio import pairwise2 from Bio.pairwise2 import...
840 просмотров

Использование grep для поиска файлов последовательности ДНК
Я пытаюсь использовать grep Unix для поиска определенных последовательностей в файлах. Файлы обычно очень большие (~ 1 ГБ) с буквами «A», «T», «C» и «G». Эти файлы также занимают много-много строк, каждая из которых представляет собой слово из 60...
2327 просмотров
schedule 02.06.2022

Как заказать несколько файлов выравнивания Fasta
Я уверен, что это легко сделать, но у меня очень ограниченный опыт в биоинформатике. У меня есть много 100 000 файлов FASTA, содержащих выравнивания разных генов одних и тех же 12 видов. Каждый файл выглядит примерно так: >dmel...
417 просмотров

Сплайсинг РНК Python
У меня есть последовательность генов –...
1056 просмотров
schedule 29.05.2022

Генерация случайных последовательностей ДНК
Я пытаюсь генерировать случайные последовательности ДНК в питоне, используя случайные числа и случайные строки. Но я получаю только одну строку в качестве вывода. Например: если я даю ДНК длиной 5 (строка (5)), я должен получить вывод «CTGAT»....
10058 просмотров
schedule 16.06.2022

Как присоединиться к определенным элементам в списке
Мой список выглядит так: ['', 'CCCTTTCGCGACTAGCTAATCTGGCATTGTCAATACAGCGACGTTTCCGTTACCCGGGTGCTGACTTCATACTT CGAAGA', 'ACCGGGCCGCGGCTACTGGACCCATATCATGAACCGCAGGTG', '', '', 'AGATAAGCGTATCACG...
1001 просмотров
schedule 07.07.2022

Нужен скрипт или программное обеспечение для удаления непарных чтений из парных конечных чтений.
Я хочу использовать AMOScmp для анализа парных конечных данных Illumina. AMOScmp требует такое же количество парных файлов для создания файла .afg. Исходные файлы fq являются парными. После того, как я пропустил файлы fq по отдельности через...
1213 просмотров
schedule 17.07.2022

ДНК-цепочка на фрагменты
set.seed(101) genome <- paste(sample(c("A", "C", "T", "G"), 1000, replace = TRUE), collapse = "") Мне нужно создать фрагменты из 50 из приведенной выше последовательности. Я пытался использовать цикл for, но не могу понять. Пожалуйста...
70 просмотров
schedule 16.07.2022

Вычисление расстояния редактирования последовательности ДНК питона
Итак, мне дали задание согласовать наименьшую стоимость между двумя последовательностями ДНК. Один из неудачных входов: CGCAATTCTGAAGCGCTGGGGAAGACGGGT & TATCCCATCGAACGCCTATTCTAGGAT Правильное выравнивание стоит 24, но я получаю...
1106 просмотров

Считайте файл fasta в матрицу или вектор для функции MolecularEntropy в R
Я новичок в R, поэтому, пожалуйста, извините мой очень простой вопрос. Я хочу использовать функцию MolecularEntropy: https://www.rdocumentation.org/packages/HDMD/versions/1.2/topics/MolecularEntropy Я пытался использовать разные функции быстрого...
400 просмотров

Как найти последовательность, которая не может дать никаких результатов по Blast, но дает по FASTA?
Мне нужно найти последовательность ДНК или белка (запрос), которая не может дать никаких результатов с помощью Blast. В то же время это должно дать результат, когда я помещаю его в инструмент FASTA. Что я могу искать?
63 просмотров

Поиск строки с учетом одного несоответствия в любом месте строки
Я работаю с последовательностями ДНК длиной 25 (см. Примеры ниже). У меня есть список из 230 000, и мне нужно искать каждую последовательность во всем геноме (паразит toxoplasma gondii). Я не уверен, насколько велик геном, но он намного длиннее 230...
23910 просмотров

R- Как построить правильные круговые диаграммы в сетях гаплотипов haploNet {pegas} {ape} {adegenet}
При использовании пакета haploNet для создания графиков в сети гаплотипов я использовал для этого скрипт, доступный в Интернете. Однако я думаю, что что-то не так. Скрипт доступен в виде примера Woodmouse. Код, который я использовал: x <-...
1948 просмотров
schedule 18.12.2022

Python: печатайте молекулярную массу для однозначных последовательностей ДНК, пропуская неоднозначные последовательности.
Мне нужно написать функцию, которая принимает имя файла (файл fasta) в качестве аргумента, считывает последовательности и для каждой однозначной последовательности печатает идентификатор последовательности и ее молекулярный вес. Файлы fasta содержат...
672 просмотров
schedule 27.10.2022

Python-скрипт, который должен переводить 1000 последовательностей ДНК в белки с помощью 1152 различных кодонов, не работает.
Сейчас работаю над проектом по биоинформатике для дипломной работы. Я написал Python-скрипт, который должен переводить список строк из 1000 ДНК-последовательностей в белки по 1152 различным codontables (генетическим кодам). Эти кодонтаблицы...
105 просмотров

Создание хэша массивов последовательностей ДНК, Perl
У меня есть хеш с именем %id2seq , который содержит строки последовательностей ДНК, на которые ссылается ключ $id . Я хочу иметь возможность манипулировать последовательностями ДНК, используя позицию в строке в качестве ссылки. Например, если бы...
133 просмотров
schedule 06.04.2023