Файл журнала dncp_block_verification увеличивает размер в HDFS

Мы используем Cloudera CDH 5.3. Я столкнулся с проблемой, когда размер "/dfs/dn/current/Bp-12345-IpAddress-123456789/dncp-block-verification.log.curr" и "dncp-vlock-verification.log.prev" продолжает увеличиваться до ТБ в течение нескольких часов. Я читал в некоторых блогах, и они упоминают, что это ошибка HDFS. Временное решение этой проблемы — остановить службы узла данных и удалить эти файлы. Но мы заметили, что файл журнала увеличивается в размере на любом из узлов данных (даже на том же узле после его удаления). Таким образом, он требует постоянного наблюдения.

У кого-нибудь есть постоянное решение этой проблемы?


person Devidas    schedule 09.07.2015    source источник


Ответы (1)


Одним из решений, хотя и несколько радикальным, является полное отключение сканера блоков путем установки в конфигурации HDFS DataNode ключа с dfs.datanode.scan.period.hours по 0 (по умолчанию 504 в часах). Негативным эффектом этого является то, что ваши DN могут не обнаруживать поврежденные блочные файлы автоматически (и вместо этого им придется ждать, пока будущий клиент, читающий блоки, обнаружит их); это не имеет большого значения, если ваша средняя репликация составляет 3, но вы можете рассматривать это изменение как краткосрочное, пока не обновитесь до версии, которая устраняет проблему.

Обратите внимание, что эта проблема не возникнет при обновлении до последней версии CDH 5.4.x или более поздней версии, которая включает HDFS-7430 переписать изменения и связанные с ними исправления ошибок. Эти изменения покончили с использованием такого локального файла, тем самым устранив проблему.

person Harsh J    schedule 05.09.2015