Мой набор данных представляет собой матрицу смежности, сравнимую с информацией о покупателях. Пример набора данных игрушек:
p = {'A': [0,1,0,1], 'B': [1,1,1,1], 'C': [0,0,1,1], 'D': [1,1,1,0]}
df = pd.DataFrame(data=p)
df
Теперь меня интересует частый набор элементов, поэтому я использовал apriori fim:
from mlxtend.frequent_patterns import apriori
frequent_itemsets = apriori(df, min_support=0.1, use_colnames=True)
frequent_itemsets
Теперь мы видим, что набор элементов (D, B) встречается в 75% набора данных. Но меня действительно интересует, в каких строках встречается этот набор элементов, поскольку в индексе есть некоторая информация (какой клиент купил эти элементы).
Вкратце, мне любопытно, как я могу отфильтровать свой набор данных, чтобы увидеть, какие строки соответствуют определенному набору элементов. Есть ли такая функция в этом пакете / библиотеке. Чтобы я мог отфильтровать этот набор элементов (D, B) в строках 0,1 и 2?