Плагин ввода Logstash JDBC: перенос данных из mysql в счетчике пакетов

У меня есть таблица данных 20 ГБ с 50 миллионами строк. Необходимо перейти на ElasticSearch с помощью подключаемого модуля ввода logstash jdbc. Я испробовал всю базовую реализацию, но мне нужна помощь в переносе данных в пакетном режиме, т.е. только 10 000 строк за раз. Я не уверен, как и где указать это количество и как его обновить при следующем запуске logstash. Пожалуйста, помогите мне решить эту проблему

Вот что у меня есть:

input {
    jdbc {
        jdbc_driver_library => "mysql-connector-java-5.1.12-bin.jar"
        jdbc_driver_class => "com.mysql.jdbc.Driver"
        jdbc_connection_string => "jdbc:mysql://localhost/db"
        jdbc_validate_connection => true
        jdbc_user => "root"
        jdbc_password => "root"
        clean_run => true
        record_last_run => true
        use_column_value => true
        jdbc_paging_enabled => true
        jdbc_page_size => 5
        tracking_column => id
        statement => "select * from employee"
    }
}

Заранее спасибо.

mysql logstash logstash-jdbc

Chitra 13.05.2016 источник

comment

Это помогает? elastic.co/guide/en/logstash/ текущий / - Val 13.05.2016

comment

Спасибо, Вэл, не могли бы вы привести мне пример того, как это реализовать. - Chitra 16.05.2016

comment

В блоге есть отличное сообщение, в котором приводится пример от А до Я: elastic.co/ блог / logstash-jdbc-input-plugin - Val 16.05.2016

comment

Да, я просмотрел этот блог, но он не удовлетворяет моим требованиям. Я могу ограничить запрос выборкой 10 000 записей за раз, но как он узнает, что в следующий раз будет извлечено 10 000 записей, начиная с 10 001. Итак, это некоторый параметр, который необходимо передать плагину, но не знаю, как передать этот параметр извне. пример: statement = ›select * from employee, где id›: sql_last_value limit 10 принимает только 10 записей в первый раз и сохраняет идентификатор 10-й строки в последней записи запуска. Но в следующий раз, когда я запускаю его, он снова выбирает те же строки, но не 11-20-е строки. - Chitra 16.05.2016

comment

Вы можете установить jdbc_paging_enabled в true, чтобы достичь того, что вам нужно. - Val 16.05.2016

comment

Вэл, это то, что я ввел {jdbc {jdbc_driver_library = ›mysql-connector-java-5.1.12-bin.jar jdbc_driver_class =› com.mysql.jdbc.Driver jdbc_connection_string = jdbc: mysql: // localbhostc / dbc: mysql: // localbhost = ›True jdbc_user =› root jdbc_password = ›root clean_run =› true record_last_run = ›true use_column_value =› true jdbc_paging_enabled = ›true jdbc_page_size =› 5 tracking_column = id statement = ›select * from employee} i} можно указать, где могло пойти не так. Это большая помощь с вашей стороны, спасибо - Chitra 16.05.2016

comment

Пожалуйста, обновите свой вопрос вместо того, чтобы добавлять код в комментарии. Это более разборчиво. - Val 16.05.2016

Ответы (1)

arrow_upward
5
arrow_downward

Вам необходимо установить jdbc_paging_enabled в значение true, чтобы разбиение на страницы работало.

Но вам также необходимо убедиться, что для clean_run установлено значение false, иначе разбивка на страницы не будет работать.

Val 16.05.2016

comment

Большое спасибо за ваше руководство, я смог добиться того, чего хотел. - Chitra; 17.05.2016

comment

Замечательно, рад, что помог! - Val; 17.05.2016

comment

@Val Как ведет себя разбиение на страницы, если используется агрегат?, То есть если он просто вырезает страницу с определенным идентификатором, а на следующей странице остается какой-то идентичный идентификатор, агрегат будет очищен, и данные будут потеряны или добавлены к существующему один? - Max; 17.07.2020

comment

@Max, пожалуйста, создайте новый вопрос с точным указанием ваших потребностей - Val; 17.07.2020

comment

@Val Вот похожий вопрос без ответа, поэтому я не хотел дублировать вопрос. :) - Max; 17.07.2020

Вопросы по теме

eventReactive с 2 кнопками действий на 2 вкладках
Добавить результат в TestCaseSource
три столбца в одну дату
Как открыть URL-адрес в WebView через .js в создателе кокосов
Highchart GMT и смещение в один час
проблема с отключением дат в datepicker
Получить описание текущего шага, вызываемого из файла BDD
журнал данных ракетки - журнал данных с отрицанием?
Не удается проиндексировать массив int RavenDB
Как использовать команду Scaffold-DbContext в VS Code
Взрывающийся градиент тензорного потока
Итерация по столбцу фрейма данных pandas и оценка с помощью оператора if и передача значений столбца в пустой список/словарь
Заполнить таблицу данных; Неверный ответ JSON
Получить точное время для удаленного сервера
Сбор элементов в массиве JSON
Динамический компонент круговой диаграммы D3 в Angular
Данные о пользовательских событиях в Firebase Events
Laravel 5.2 - проблема с веб-сервисами
Как повернуть трехмерный график в Matplotlib вокруг любой оси
Представление класса базы данных Java SQL