Как выбрать столбцы данных из DataFrame

Я получаю результаты опроса от Lime Survey через его API (удаленный контроль):

И мне удалось поместить его в DataFrame. Но это всего лишь 1 столбец в строке:

Данные выглядят так.

Что я хочу сделать, так это получить средние данные по вопросам и категориям. В приведенном ниже примере q10[wor1], q10[wor2], . . ., q10[wor7] дают 7 вопросов, входящих в категорию q10.

Как сначала выбрать все данные для wor1, wor2, ..., wor7 отдельно, чтобы я мог вести статистику по каждому из этих отдельных вопросов.

Тогда как мне выбрать все данные для q10*, чтобы я мог делать статистику для всей группы?

Даже не пытаясь отделить категорию от вопроса, я не смог выбрать все данные «q10[wor1]».

Brad Rhoads 14.02.2018 источник

comment

Пожалуйста, не размещайте изображения кода. Вместо этого предоставьте минимальный, полный, поддающийся проверке пример. - Alex 15.02.2018

comment

Я понял, что могу запросить CSV вместо JSON у Lime Survey. Стало намного проще. - Brad Rhoads 17.02.2018

Ответы (1)

arrow_upward
1
arrow_downward

Проверьте jq — https://stedolan.github.io/jq/

Вы можете передать свой df ['responses'] json в jq, извлечь необходимое поле и создать его как отдельный столбец df.

И тогда вы можете получить среднее значение столбцов из df.

Vignesh Sethuraman 14.02.2018

comment

Это похоже на возможное решение. Но я бы предпочел чистое решение для Python. - Brad Rhoads; 15.02.2018

comment

Вы можете использовать то же самое, используя встроенную библиотеку json в Python. Поскольку ваши данные заключены в индекс, вам, возможно, придется перебрать все ключи, чтобы извлечь необходимые поля. См. здесь для ссылки - json ищет ключ в python">stackoverflow.com/questions/26954716/ библиотека jQ поможет вам сократить количество дополнительных строк кода и будет прямолинейной. - Vignesh Sethuraman; 15.02.2018

Как выбрать столбцы данных из DataFrame

Ответы (1)

Вопросы по теме