Dask .loc только первый результат (iloc[0])

Образец кадра данных Dask:

import pandas as pd
import dask
import dask.dataframe as dd

df = pd.DataFrame({'col_1': [1,2,3,4,5,6,7], 'col_2': list('abcdefg')}, 
                  index=pd.Index([0,0,1,2,3,4,5]))
df = dd.from_pandas(df, npartitions=2)

Теперь я хотел бы получить только первый (на основе индекса) результат - например, в pandas:

df.loc[df.col_1 >3].iloc[0]
   col_1 col_2
2      4     d

Я знаю, что в dask нет позиционного индексирования строк с использованием iloc, но интересно, можно ли ограничить запрос одним результатом, как в SQL?


person gies0r    schedule 25.11.2020    source источник


Ответы (1)


Понял, но не уверен в эффективности здесь:

tmp = df.loc[df.col_1 >3] 
tmp.loc[tmp.index == tmp.index.min().compute()].compute() 
person gies0r    schedule 25.11.2020