Публикации по теме 'parallel-computing'


3 простых и неинвазивных способа мгновенно повысить производительность вашего кода Python
Небольшое руководство для людей, которые хотят более быстрый код, но не хотят углубляться в оптимизацию низкого уровня. Я часто вижу, что люди недостаточно используют стандартную библиотеку Python. Хотя это излишне раздувает код и затрудняет обслуживание, это также может привести к неэффективному и медленному коду . Поэтому в этой статье я хочу затронуть последний пункт и показать вам несколько вещей, которые позволяют писать более быстрый код. После очень простых оптимизаций,..

Как обучать нейронные сети параллельно с Keras и Apache Spark
Github Ссылка на проект Как специалист по анализу данных, вы наверняка сталкивались с дискуссиями о кулерах, в которых отбрасывались слова «Apache Spark», за которыми обычно следовали другие, такие как «вычислительные кластеры», «JVM»… а иногда «вы пытались перезапустить ядро ​​снова? '. Вы знаете, это просто стандартный отраслевой жаргон. В идеале у вас может быть хотя бы представление о том, что Spark как-то связан с масштабированием ваших проектов в области науки о данных. Или..

Dask: простая обработка больших наборов данных.
Вместо pd давайте использовать dd! Введение Dask — это библиотека с открытым исходным кодом для параллельных вычислений на Python, которая становится все более популярной в области науки о данных. Dask предназначен для работы с большими наборами данных, которые слишком велики для размещения в памяти, и позволяет специалистам по данным легко масштабировать свои рабочие процессы для работы с распределенными вычислительными ресурсами. В этой статье мы рассмотрим использование Dask в..

Векторизация против распараллеливания: ускорение работы кода
ВРЕМЯ . Является ли это элементом природы или выдуманной концепцией? Поистине удивительно, как мы пытаемся это воспринять и осмыслить. Мы как род человеческий ценим время больше всего на свете, даже деньги, в конце концов, потерянные деньги можно снова заработать, но потерянное время ушло навсегда. Время и прилив никого не ждут. Со временем, имеющим такую ​​высокую ценность, логически следует его сохранение. Главное, чтобы время не было потеряно. До сих пор мы лишь смутно..

Краткая история параллельного программирования
Первые попытки одновременного выполнения задач на компьютере относятся к 1961 году. Именно тогда Том Килберн и Дэвид Ховарт смоделировали параллельное выполнение нескольких программ на компьютере Atlas. Этот метод программирования на основе прерываний стал известен как мультипрограммирование. Сначала техника не опиралась на прочную теоретическую основу. Выполнение параллельных задач было относительно неконтролируемым. По мере того как многопрограммные операционные системы продолжали..

О распределенной науке о данных
Что я думаю о различных распределенных фреймворках в науке о данных В первый раз, когда я взглянул на набор данных, содержащий более миллиарда строк данных, я подумал, что мой COUNT (*) неверен. Не было. Это не избавило меня от необходимости анализировать данные. У бизнеса были данные (очевидно, много), бизнесу требовалось понимание этих данных, и бизнес не знал, как их получить. Итак, я проглотил комок в горле (это была моя первая настоящая работа в области науки о данных) и..

Анализ временных рядов цен на акции с помощью массивов Fortran, часть 2
СТАТЬЯ Анализ временных рядов цен на акции с помощью массивов Fortran, часть 2 Из Современного Фортрана Милана Курчича ________________________________________________________________________________ Получите скидку 37% на Современный Фортран . Просто введите код fcccurcic в поле скидки при оформлении заказа на manning.com . _______________________________________________________________________ В этой части статьи мы углубимся в явное распределение и нарезку массивов..