Табло — расчет и представление эпидемиологической заболеваемости и заболеваемости на 10 000

Я пытаюсь рассчитать заболеваемость (ежедневно), совокупную заболеваемость (за длительный период времени), показатель заболеваемости/10 000 (ежедневно) и совокупный показатель заболеваемости/10 000 (за длительный период времени) инфекционного заболевания. Это для всех США, переменного количества штатов (далее именуемых «i») и переменного количества округов в этих указанных штатах (далее именуемых «j»). («Заболеваемость» — это количество случаев за определенный период времени — в данном случае за день.)

Данные представлены в таблице со столбцами «Дата», «Заболеваемость», «Совокупная заболеваемость», «Заболеваемость/10 000», «Совокупная заболеваемость/10 000». Население для каждого штата и округа берется из справочной таблицы Бюро переписи населения, организованной по «Штату», «Округу», «Населению» (выполняется программно с помощью JOIN для «Штата» и «Округа»).

Для заданного показателя (скажем, уровня заболеваемости/10 000) вычисление равно ('Incidence'/'Population') * 10,000.

Выполнение частоты и кумулятивной частоты в Tableau очень просто — с использованием строк СУММ («Случайность») против столбцов «Дата» и строк СУММ («Совокупная частота») против столбцов «Дата».

Выполнение показателей «Коэффициент заболеваемости/1000» и «Совокупный коэффициент заболеваемости/10 000» не так очевиден. Для США SUM('Cumulative Incidence') всегда имеет тенденцию к росту, как и ожидалось; SUM('Совокупный показатель заболеваемости/10 000' возрастает до определенной степени, а затем выравнивается, колеблясь со взлетами и падениями; а SUM('Население') растет асимптотически, пока не достигнет «почти» общего населения США. Что я Думаю, я вижу, что измеряемая заболеваемость началась с небольшой территории и продолжала расти, пока почти (но не все штаты и округа были вовлечены (есть редкие не вовлеченные округа, но все штаты). Я предполагаю, что SUM('Население') на самом деле является Σij от 'Населения' по i = штату и j = округу в любой данный день, а Σij от 'Суммарного коэффициента заболеваемости/10 000' в данный день. Чем это не является, так это Σij от «Население» по i = штату и j = округу за все дни (также известное как константа), которое доступно из справочной таблицы и не зависит от даты.

Есть предположения? (Я уверен, что есть простой ответ, но новичок в этом). Использование Tableau Desktop 2020.1.3

Заранее спасибо.


person qudrcps    schedule 05.05.2020    source источник


Ответы (2)


Похоже, вам может понадобиться совокупное вычисляемое поле или вычисляемое поле уровня детализации (LOD).

Попробуйте включить в вычисление функции агрегирования, такие как SUM([Incidence]) / SUM([Population]) Этот расчет сначала вычисляет суммы, а затем делит их в конце вместо того, чтобы вычислять отношение для каждой записи, а затем суммировать отношения. Это часто необходимо при работе с коэффициентами.

Более того, я ожидаю, что ваши значения Population не меняются каждый день, поэтому, если вы просто агрегируете их с помощью Sum(), как указано выше, вы увеличите знаменатель. В этом случае вам нужно сначала вычислить население на другом уровне детализации, используя расчет LOD. Пример формулы в этом случае будет выглядеть примерно так

SUM([Incidence]) / { FIXED [State], [County] : MAX([Population])}

Трудно сказать правильную формулу, которую можно рекомендовать, без некоторых примеров данных, но, вероятно, она похожа на приведенную выше.

person Alex Blakemore    schedule 06.05.2020

Алекс - Большое спасибо!!!!

Ты помог мне пройти 90% пути. Ваша формула выдала ошибку, жалуясь, что SUM([Incidence] является агрегированным, а {FIXED [State], [County] : MAX([Population])} нет. Это исправление должно было превратить это в MAX({FIXED [State], [County] : MAX([Population])}), которое является агрегированным (не имело значения, используется ли кто-то MAX(), MIN() или AVG(), поскольку вы предложили MAX([Population] в первую очередь, я использовал это). Учитывая, что цифры невелики, в данном случае я решил умножить на 10 000, чтобы получить показатель заболеваемости на 10 000 человек (в эпидемиологии принято сравнивать заболеваемость среди различных групп населения, чтобы «нормализовать» относительный риск). В итоге формула стала такой:

(SUM([Incidence]) * 10000) / MAX({FIXED [State], [County] : MAX([Population])})

Это соответствует табличным данным, рассчитанным как ([Incidence] * 10000) / [Population] для каждого штата и округа.

person qudrcps    schedule 11.05.2020