Возможно ли в Python записать одну и ту же папку Parquet из разных процессов?
Я использую fastparquet
.
Кажется, это работает, но мне интересно, как это возможно, чтобы файл _metadata
не имел конфликтов, если два процесса записывают в него одно и то же.
Также, чтобы заставить его работать, мне пришлось использовать ignore_divisions=True
, что не идеально, чтобы получить высокую производительность позже, когда вы читаете файл Parquet, верно?