Tidycensus — ACS на один год для всех округов штата

Довольно простая проблема, я думаю, но не уверен в правильном решении. Провел некоторое исследование по этому вопросу и думаю, что где-то видел решение, но не могу вспомнить, где... во всяком случае,

Хотите получить DP03, годовые данные acs для всех округов Огайо, 2019 год. Однако приведенный ниже код дает доступ только к 39 из 88 округов Огайо. Как я могу получить доступ к остальным округам?

Я предполагаю, что данные собираются только для округов с населением более 60 000 человек.

library(tidycensus)
library(tidyverse)


acs_2019 <- load_variables(2019, dataset = "acs1/profile")

DP03 <- acs_2019 %>% 
  filter(str_detect(name, pattern = "^DP03")) %>% 
  pull(name, label)

Ohio_county <- 
  get_acs(geography = "county",
          year = 2019,
          state = "OH",
          survey = "acs1",
          variables = DP03,
          output = "wide")

В результате получается такая таблица...

Ohio_county
# A tibble: 39 x 550
   GEOID NAME  `Estimate!!EMPL~ `Estimate!!EMPL~ `Estimate!!EMPL~ `Estimate!!EMPL~ `Estimate!!EMPL~
   <chr> <chr>            <dbl>            <dbl>            <dbl>            <dbl>            <dbl>
 1 39057 Gree~           138295              815           138295               NA            87465
 2 39043 Erie~            61316              516            61316               NA            38013
 3 39153 Summ~           442279             1273           442279               NA           286777
 4 39029 Colu~            83317              634            83317               NA            48375
 5 39099 Maho~           188298              687           188298               NA           113806
 6 39145 Scio~            60956              588            60956               NA            29928
 7 39003 Alle~            81560              377            81560               NA            49316
 8 39023 Clar~           108730              549           108730               NA            64874
 9 39093 Lora~           250606              896           250606               NA           150136
10 39113 Mont~           428140              954           428140               NA           267189

Я почти уверен, что где-то видел решение, но не могу вспомнить, где.

Любая помощь будет оценена по достоинству, поскольку это позволит офису легче извлекать данные переписи, а не пробираться через сайт Бюро переписи населения США. Удачи и спасибо!


person James Crumpler    schedule 02.12.2020    source источник
comment
Похоже, данные, к которым вы пытаетесь получить доступ, доступны не для всех округов Огайо. Я получаю это сообщение, когда запускаю ваш код: The one-year ACS provides data for geographies with populations of 65,000 and greater. Итак, я не думаю, что это как-то связано с разницей между данными, доступными через API, и просмотром сайта.   -  person qdread    schedule 02.12.2020
comment
Коллега уже получил всю информацию... Я предполагаю, что она была получена с помощью ACS1. Это, безусловно, все данные, относящиеся к переменным DP03. Это заставляет меня думать, что он существует, хотя было упомянуто, что используемая методология была немного сложной.   -  person James Crumpler    schedule 02.12.2020
comment
Я предполагаю, что вы имеете в виду дополнительный документ ACS. таблицы, содержащие данные с пороговым значением 20 000, а не 65 000. В tidycensus вы можете увидеть доступные переменные, вызвав load_variables(2019, dataset = 'acsse')   -  person qdread    schedule 02.12.2020
comment
Хорошо, перепроверил с коллегой. В рамках анализа была вызвана комбинация функций и таблиц, таких как население (которое я проверил с помощью функции get_estimates, некоторые данные доступа для населения менее 65 тыс., а некоторые из серии S0101?). В целом, кажется, мой вопрос был гораздо более узким. чем фактически выполненный анализ. Думаю, ваша первоначальная оценка была правильной. Хотя в каком наборе данных есть таблицы S0101?   -  person James Crumpler    schedule 02.12.2020
comment
S0101 является индивидуальным уровнем, поэтому это данные acs1/subject.   -  person qdread    schedule 02.12.2020


Ответы (1)


Мой коллега, который уже получил данные, не уточнил, получены ли данные DP03 из опроса ACS за 1 год или из опроса ACS за 5 лет. Как оказалось, это было из 5-летнего опроса ACS, который включает все округа Огайо, а не только округа с населением более 65 000 человек. Следуйте комментариям выше для описания того, как был определен этот ответ.

Код для всех округов здесь

library(tidycensus)
library(tidyverse)

acs_2018 <- load_variables(2018, dataset = "acs5/profile")


DP03 <- acs_2019 %>% 
  filter(str_detect(name, pattern = "^DP03")) %>% 
  pull(name)

Ohio_county <- 
  get_acs(geography = "county",
          year = 2018,
          state = "OH",
          survey = "acs5",
          variables = DP03,
          output = "wide")
person James Crumpler    schedule 03.12.2020