Публикации по теме 'computer-architecture'


Lapidary: создание более красивых симуляций gem5
Многие люди знают, насколько мощным является Мичиганский университет, когда дело доходит до исследований компьютерной архитектуры . Тогда для меня не было сюрпризом, когда первый проект, над которым я начал работать, когда я поступил на первый год моей докторской диссертации, был полностью в лагере компьютерной архитектуры. Чтобы не вдаваться в подробности (поскольку основополагающая работа еще не опубликована), я начал помогать в проекте, который был направлен на переработку некоторых..

Введение
Фон Планировщик — это компонент (аппаратный или программный), решающий, какую задачу выбрать и запустить. С точки зрения операционной системы (ОС) это программный компонент, который решает, какую задачу выбрать и запустить. На следующем рисунке показано, как планировщик выбирает различные задачи для выполнения на ЦП. Обратите внимание, что каждый процессор следует своему порядку выбора задач, а размещение и миграция задач (от одного процессора к другому) зависит от загрузки процессоров...

Резюме «Themis: честное и эффективное планирование кластера графических процессоров»
Введение Кластеры графических процессоров являются основной инфраструктурой для облегчения выполнения распределенных учебных нагрузок M машинного обучения ( ML ). Однако когда несколько таких рабочих нагрузок выполняются в общем кластере, возникает значительный конфликт. Это соперничество приводит к снижению использования и эффективности базового оборудования. Авторы Themis [ 1 ] отмечают, что доступные механизмы планирования кластеров не подходят для уникальных характеристик учебных..

Скрытая память: знайте свою память (и кеши!)
Оперативная память (RAM) Блок памяти обозначается как оперативное запоминающее устройство (RAM), если к любому месту можно получить доступ в течение некоторого фиксированного количества времени, которое не зависит от адреса местоположения. Статическая память с произвольным доступом (SRAM) Статическая память с произвольным доступом ( статическая RAM или SRAM ) - это тип полупроводниковой памяти, в которой используется бистабильная схема фиксации (flip -flop) »для хранения..

Обработка графов: системы
Мотивация и дизайн SIGMOD14: Навигация по лабиринту фреймворков графической аналитики с использованием массивных наборов графических данных сделать CPU/Muti-node/в памяти Проблема: параллелизм (в основном межузловой) связь: интеллектуальный раздел или перекрытие с вычислением баланс нагрузки: умный раздел или динамическое воровство работы VLDB12: Distributed GraphLab: платформа для машинного обучения и интеллектуального анализа данных в облаке сделать OSDI12: PowerGraph:..

Компьютерная архитектура — ISA и Microarch
*Это памятка, которую я взял на курсе Архитектура компьютеров в cousera. Разница между архитектурой (ISA) и микроархитектурой В лекции «архитектура» объясняется как уровень абстракции, предоставляемый программному обеспечению, и это Архитектура набора инструкций (ISA) . Это не что-то вроде того, сколько чипов нужно встроить или как вы делаете схему. Это то, как теоретически работает компьютер, когда он разработан определенным образом. Когда вы думаете, сколько процессоров..

Вопросы по теме 'computer-architecture'

Определение пакетного режима
Я читал об организации компьютера, и в главе «Память» упоминается, что «SDRAMS имеет несколько режимов работы, например, могут быть указаны пакетные режимы разной длины». Может кто-нибудь уточнить, что такое пакетный режим? Основная причина, по...
5851 просмотров

Как я могу перехватить проходы компилятора
Я хочу сделать компилятор для новой архитектуры. Я не уверен, насколько это большая задача. Насколько мне известно, инструменты типа Flex / Bison могут выполнять несколько этапов компиляции бесплатно. Моя цель - перехватить этап генерации кода...
154 просмотров

Вектор сброса Intel
Возможный дубликат: Код инициализации программного обеспечения по адресу 0xFFFFFFF0H Когда система загружается (Intel), вектор сброса находится по адресу 0xFFFFFFF0 (на 16 байт меньше 4G) (как указано в ссылке выше). Этот адрес содержит FAR...
1850 просмотров

Максимальное ускорение конвейерного процессора
Расчет максимального ускорения однократного ЦП, преобразованного в 5-ступенчатый конвейерный ЦП. Один цикл имеет время 800ps Конвейерные этапы разделены регистрами, которые занимают время 40 пс. На данный момент у меня есть: 800 / (40...
1980 просмотров
schedule 23.10.2021

Понимание того, как работает реестр EIP (RIP)?
Я новичок в компьютерной архитектуре и низкоуровневых вещах, которые происходят на уровне процессора / памяти. Я начну с этого. То, что я делал с компьютерами, почти всегда было на высоком уровне программирования. C ++, Java и др. При этом я...
13126 просмотров

Ошибка Apple LLVM 6.0 после изменения архитектуры
Я работал над возрождением более старого проекта с открытым исходным кодом, и когда я обновил архитектуру с $(ARCHS_STANDARD_32_BIT) до $(ARCHS_STANDARD) , Xcode выдал мне очень длинную ошибку с заголовком Apple LLVM 6.0 Error , который...
171 просмотров

Функция для вычисления значения внутри цикла генерации Verilog
Я пытаюсь создать параметризованную схему для этапа умножения BCD Wallace Tree Multiplier, который я реализовал в Orcad. Проблема, с которой я столкнулся, заключается в том, что мне нужно вычислить позиции битов, в которых будут находиться каждые две...
1617 просмотров

FreeRTOS: Как измерить время переключения контекста?
Я хочу измерить накладные расходы на время переключения контекста. Вот моя идея: Есть две задачи: задачаA праздный Я создаю задачу, как показано ниже: void calculate_ct(void *pvParameters) { int i = 0; for(; i < 100;...
3492 просмотров

Могут ли интерпретируемые языки использовать слоты задержки?
При работе с конвейерной архитектурой для выполнения инструкций одним из способов избежать опасностей является использование слотов задержки или правила, запрещающего определенным инструкциям доступ к значениям, вычисленным в строках над ними....
63 просмотров

Размер соседних данных, которые современный компьютер кэширует в пользу локальности
У меня есть непрерывная память из 1024 буферов, размер каждого буфера составляет 2 КБ. Я использую связанный список для ведения учета доступных буферов (здесь буфер можно рассматривать как используемый производителем и потребителем). После...
58 просмотров

Выполнение инструкции
Я читаю книгу о введении в компьютерную архитектуру. Есть отрывок из текста, который гласит: «Инструкции RISC обычно занимают один такт». Затем в качестве иллюстрации показан следующий фрагмент Verilog: always @(positiveclockedge clk ) begin...
104 просмотров
schedule 30.03.2022

Какое общее ускорение?
Это не домашнее задание. Я изучаю MOOC по компьютерной архитектуре в свободное время. Есть проблема, которую я не могу понять, и, возможно, кто-нибудь сможет мне помочь. Вот: Операции с памятью в настоящее время занимают 30% времени выполнения....
302 просмотров
schedule 07.04.2022

Все действительные числа, которые имеют более одного представления в IEEE-754 одинарной точности.
вопрос в следующем: Запишите все действительные числа, которые имеют более 1 представления в IEEE-754 одинарной точности. Теперь, учитывая, что +0 и -0 различны, существуют ли числа, обладающие этим свойством?
108 просмотров
schedule 26.04.2022

Все ли инструкции MIPS выполняются за 5 циклов?
Поскольку в архитектуре MIPS используются некоторые инструкции, для успешного завершения которых не требуются все 5 циклов, например, для инструкции сохранения не требуется использовать 5-й этап. Так инструкция тоже проходит этап или пропускает этап?
173 просмотров
schedule 23.04.2022

Что делает архитектуру ЦП X-битной?
Предупреждение. Я не уверен, к чему относятся вопросы такого типа. Если знаете более подходящее место, киньте ссылку. Предыстория: Представьте, что вы услышали такое предложение: "этот компьютер/процессор имеет X-битную архитектуру". Теперь,...
1181 просмотров

Как рассчитать время выполнения (ускорение)
Я застрял, пытаясь рассчитать ускорение. Итак, заданный вопрос был: Вопрос 1 Если 50 % программы улучшены в 2 раза, а остальные 50 % улучшены в 4 раза, то каково общее ускорение за счет улучшений? Подсказки: Учтите, что время выполнения...
17144 просмотров
schedule 08.06.2022

Как правильно писать код C / C ++, когда нулевой указатель не все биты равны нулю
Как сказано в FAQ по comp.lang.c , существуют архитектуры, в которых нулевой указатель не все биты нулевые. Итак, вопрос в том, что на самом деле проверяет следующую конструкцию: void* p = get_some_pointer(); if (!p) return; Сравниваю...
5492 просмотров
schedule 13.06.2022

Программный стек для конкретного компьютера
Я работаю над проектом, и моя команда отвечает за программный стек конкретного оборудования. У меня в руках только набор инструкций процессора, и мне нужно разработать с его помощью полный программный стек. Нужно ли мне что-то еще, кроме набора...
104 просмотров

Можно ли исключить округление промежуточных результатов при арифметической операции над несколькими операндами FP?
Есть ли возможность выполнять арифметические операции с несколькими операндами с плавающей запятой без округления промежуточных результатов и только с округлением конечного результата, и существуют ли в настоящее время какие-либо архитектуры, делающие...
154 просмотров

битовая емкость данных и размер служебных битов?
Я немного застрял, потому что не могу найти ничего, что покрывает часть кеша «данные», все, что я гуглил, на 99,9% связано с адресацией кеша. Вопрос, который мне задали, сформулирован так Contrast the difference between "data bit" capacity and...
2718 просмотров