Соединение с данными — параллельное извлечение JDBC завершается с ошибкой OutOfMemoryError

Я пытаюсь запустить несколько экстрактов JDBC параллельно, но это не удается: java.lang.OutOfMemoryError: Java heap space.

Как работает использование памяти Data Connection и как решить эту проблему?

palantir-foundry foundry-data-connection

Andrew St P 22.09.2020 источник

Ответы (1)

arrow_upward
0
arrow_downward

Использование памяти агентом подключения данных здесь фактически зависит главным образом от значения параметра fetchSize. Согласно документации по драйверу JDBC для Oracle< /а>, fetchSize:

Дает драйверу JDBC подсказку о количестве строк, которые должны быть извлечены из базы данных, когда для этого объекта ResultSet требуется больше строк.

Таким образом, использование памяти агентом должно быть примерно таким:

number of JDBC extracts running in parallel x fetchSize x size of each row

К сожалению, значение fetchSize по умолчанию сильно различается в разных драйверах JDBC. Например, в некоторых версиях драйвера Hive JDBC для него установлено значение 50, в то время как в других, более новых версиях значение по умолчанию равно 1000. Драйверы Oracle JDBC по умолчанию имеют значение 10. По умолчанию Postgres попытается получить весь ResultSet сразу.

Таким образом, Data Connection позволяет настроить значение fetchSize. Это настраивается как для каждого источника, так и для каждого извлечения.

Помимо ошибок OOM, настройка fetchSize может значительно повысить производительность в общем. Однако универсального решения не существует, и вам придется поэкспериментировать, чтобы определить наилучшее значение параметра для ваших экстрактов. Обычно он лежит где-то в диапазоне 500–5000.

Adil B 22.09.2020

Вопросы по теме

eventReactive с 2 кнопками действий на 2 вкладках
Добавить результат в TestCaseSource
три столбца в одну дату
Как открыть URL-адрес в WebView через .js в создателе кокосов
Highchart GMT и смещение в один час
проблема с отключением дат в datepicker
Получить описание текущего шага, вызываемого из файла BDD
журнал данных ракетки - журнал данных с отрицанием?
Не удается проиндексировать массив int RavenDB
Как использовать команду Scaffold-DbContext в VS Code
Взрывающийся градиент тензорного потока
Итерация по столбцу фрейма данных pandas и оценка с помощью оператора if и передача значений столбца в пустой список/словарь
Заполнить таблицу данных; Неверный ответ JSON
Получить точное время для удаленного сервера
Сбор элементов в массиве JSON
Динамический компонент круговой диаграммы D3 в Angular
Данные о пользовательских событиях в Firebase Events
Laravel 5.2 - проблема с веб-сервисами
Как повернуть трехмерный график в Matplotlib вокруг любой оси
Представление класса базы данных Java SQL