svnadmin дамп только текста, без двоичных файлов

Можно отфильтровать дамп SVN, сгенерированный svndamin dump, чтобы он не включал закодированные двоичные данные, только текстовые дельты и данные?

Я хочу иметь дамп существующих больших репозиториев SVN, но только кода. Меня не интересуют хранимые двоичные файлы. Однако двоичные файлы сделают файл дампа излишне большим. Как я могу сгенерировать дамп и исключить двоичный контент?

Пытался и потерпел неудачу, уже:

  1. Обработка svn log различий нецелесообразна. Это большой и старый репозиторий, и получение различий только на короткий период времени занимает много времени и часто застревает.
  2. Двоичные файлы разбросаны повсюду и не хранятся по одному известному пути, поэтому я не могу использовать svndumpfilter для их исключения - если нет способа использовать этот фильтр с регулярными выражениями, например *.jar.

person Little Bobby Tables    schedule 20.12.2012    source источник


Ответы (2)


svndumpfilter является частью любой установки Subversion.

svndumpfilter exclude - Отфильтровать узлы с заданными префиксами из потока дампа.

Начиная с Subversion 1.7, svndumpfilter может опционально обрабатывать PATH_PREFIX не просто как явные подстроки, но вместо этого как шаблоны файлов.

$ svndumpfilter exclude --pattern "*.OLD" < dumpfile > filtered-dumpfile
Excluding prefix patterns:
   '/*.OLD'
person Lazy Badger    schedule 21.12.2012
comment
Вы случайно не знаете, принимает ли svndumpfilter шаблоны или, например *.jar|*.pdf? - person Little Bobby Tables; 23.12.2012
comment
@LittleBobbyTables - нет, только один шаблон. Но вы можете использовать более одного exclude в одной команде - person Lazy Badger; 23.12.2012