Я только начинаю работать с Holoviews. Мои вопросы касаются настройки гистограмм, но я также поделюсь полным примером, так как он может быть полезен для других новичков, поскольку документация для Holoviews очень тщательная, но может быть подавляющей.
У меня есть ряд временных рядов в текстовых файлах, загруженных как Pandas DataFrames, где:
каждый файл предназначен для определенного местоположения в каждом месте было собрано около 10 временных рядов, каждый из которых имеет около 15000 точек. Я создаю небольшой интерактивный инструмент, в котором можно использовать селектор для выбора местоположения / DataFrame, а затем другой селектор, чтобы выбрать 3 из 10 временных рядов, которые будут построены вместе.
Моя цель - разрешить связанное масштабирование (как по оси x, так и по оси y). Вопросы и код будут сосредоточены на этом аспекте инструмента. К сожалению, я не могу поделиться фактическими данными, которые использую, поскольку они являются собственностью, но я создал 3 случайных прогулки с конкретными диапазонами данных, которые согласуются с фактическими данными.
## preliminaries ##
import pandas as pd
import numpy as np
import holoviews as hv
from holoviews.util.transform import dim
from holoviews.selection import link_selections
from holoviews import opts
from holoviews.operation.datashader import shade, rasterize
import hvplot.pandas
hv.extension('bokeh', width=100)
## create random walks (one location) ##
data_df = pd.DataFrame()
npoints=15000
np.random.seed(71)
x = np.arange(npoints)
y1 = 1300+2.5*np.random.randn(npoints).cumsum()
y2 = 1500+2*np.random.randn(npoints).cumsum()
y3 = 3+np.random.randn(npoints).cumsum()
data_df.loc[:,'x'] = x
data_df.loc[:,'rand1'] = y1
data_df.loc[:,'rand2'] = y2
data_df.loc[:,'rand3'] = y3
Этот первый блок предназначен только для построения данных и демонстрации того, как по замыслу один из случайных блужданий имеет диапазон, отличный от двух других:
data_df.hvplot(x='x',y=['rand1','rand2','rand3'],value_label='y',width=800,height=400)
В результате, хотя подзаголовки hvplot работают из коробки (для связывания), диапазоны различаются, поэтому масштабирования здесь нет:
data_df.hvplot(x='x',y=['rand1','rand2','rand3'],
value_label='y',subplots=True,width=800,height=200).cols(1)
Итак, моей первой попыткой было адаптировать пример точек на основе Python из Связанной чистки в документации. :
colors = hv.Cycle('Category10').values
dims = ['rand1', 'rand2', 'rand3']
layout = hv.Layout([
hv.Points(data_df, dim).opts(color=c)
for c, dim in zip(colors, [['x', d] for d in dims])
])
link_selections(layout).opts(opts.Points(width=1200, height=300)).cols(1)
Это уже потрясающий результат за 20 минут усилий!
Однако мне бы очень хотелось построить кривую, а не точки, а также увидеть гистограмму, поэтому я адаптировал синтаксис понимания для работы с Curve (после прочтения страниц документации Применение настроек и Составление элементов):
colors = hv.Cycle('Category10').values
dims = ['rand1', 'rand2', 'rand3']
layout = hv.Layout([hv.Curve(data_df,'x',dim).opts(height=300,width=1200,
color=c).hist(dim) for c,
dim in zip(colors,[d for d in dims])])
link_selections(layout).cols(1)
Это почти именно то, что я хочу. Но я все еще борюсь с разными уровнями синтаксиса opts
. Вопрос 1: с учетом последнего блока кода, как мне сделать так, чтобы гистограмма разделяла цвет с кривыми?
Теперь предположим, что я хочу rasterize
графики (хотя я не думаю, что это еще необходимо с 15 000 точек, как в этом случае), я попытался адаптировать первый пример с помощью Points
:
cmaps = ['Blues', 'Greens', 'Reds']
dims = ['rand1', 'rand2', 'rand3']
layout = hv.Layout([
shade(rasterize(hv.Points(data_df, dims),
cmap=c)).opts(width=1200, height = 400).hist(dims[1])
for c, dims in zip(cmaps, [['x', d] for d in dims])
])
link_selections(layout).cols(1)
Это неплохое начало, но я снова борюсь с параметрами / настройками.
Вопрос 2: в приведенном выше блоке cod, как мне передать цветовые карты (они не работают, как сейчас), и как сделать, чтобы гистограмма отражала значения данных, как в предыдущем случае (а также иметь право палитра)?
Спасибо!