Использование API для расчета расстояния между двумя аэропортами (два столбца) в R?

Мне было интересно, есть ли способ сравнить расстояния до аэропорта (коды IATA). Есть несколько скриптов, но они не используют R. Поэтому я попробовал это с помощью API:

developer.aero

Пример данных:

library(curl) # for curl post

departure <- c("DRS","TXL","STR","DUS","LEJ","FKB","LNZ")
arrival <- c("FKB","HER","BOJ","FUE","PMI","AYT","FUE")
flyID <- c(1,2,3,4,5,6,7)
df <- data.frame(departure,arrival,flyID)  

     departure arrival flyID
1       DRS     FKB     1
2       TXL     HER     2
3       STR     BOJ     3
4       DUS     FUE     4
5       LEJ     PMI     5
6       FKB     AYT     6
7       LNZ     FUE     7

api<- curl_fetch_memory("https://airport.api.aero/airport/distance/DRS/FUE?user_key=d805e84363494ca03b9b52d5a505c4d1")

cat(rawToChar(api$content))

callback({"processingDurationMillis":0,"authorisedAPI":true,"success":true,"airline":null,"errorMessage":null,"distance":"3,416.1","units":"km"})

где DRS соответствует аэропорту вылета и FUE прибытия.

Поэтому я решил перебрать df и вставить в URL. Однако это кажется каким-то сложным для R - новичка.

df$distance<- list(length = nrow(df))
for (i in 1:nrow(df)){
  url <- paste0("https://airport.api.aero/airport/distance/", i, "FUE   ?user_key=d805e84363494ca03b9b52d5a505c4d1")
  myData[[i]] <- read.table(url, header=T,sep="|")
}

Желаемый результат:

departure arrival flyID    distance
1       DRS     FKB     1    1000
2       TXL     HER     2    499
3       STR     BOJ     3    300
4       DUS     FUE     4    200
5       LEJ     PMI     5    586
6       FKB     AYT     6   10292
7       LNZ     FUE     7   3939

person Michaer Macher    schedule 01.06.2016    source источник
comment
Получаете ли вы расстояния при запуске read.table, и у вас возникает вопрос, как сохранить их в data.frame? Или вы получаете только геокоординаты аэропортов и ваш вопрос о том, как преобразовать их в расстояния? Или ваш вопрос касается привязки кодов ИАТА к геокоординатам?   -  person Qaswed    schedule 01.06.2016
comment
Если бы был какой-либо положительный ответ на запрос о разъяснении, он бы не присоединился к предложению closevote, но с ошибкой, выдаваемой вторым разделом кода, действительно неясно, что спрашивают.   -  person IRTFM    schedule 02.06.2016


Ответы (3)


Вот еще один способ с пакетом httr:

library(httr)

callAPI <- function(from, to) {
  res <- GET("https://airport.api.aero",
             path = paste0("airport/distance/", from, "/", to),
             query = list(user_key = "d805e84363494ca03b9b52d5a505c4d1"))
  stop_for_status(res)
  return(content(res, encoding = "UTF-8"))
}


test <- callAPI("DRS", "FKB")
# test
test$distance
# [1] "484.6"

for (i in 1:nrow(df)) {
  from = df[i, "departure"]
  to = df[i, "arrival"]
  df[i, "distance"] <- callAPI(from, to)$distance
}

#   departure arrival flyID distance
# 1       DRS     FKB     1    484.6
# 2       TXL     HER     2  2,131.8
# 3       STR     BOJ     3  1,575.0
# 4       DUS     FUE     4  3,066.3
# 5       LEJ     PMI     5  1,512.4
# 6       FKB     AYT     6  2,264.2
# 7       LNZ     FUE     7  3,258.0

Если вы хотите получить полные результаты, вы можете использовать:

all_results <- mapply(function(x,y) { callAPI(x,y) }, df$departure, df$arrival)
cbind(df, t(all_results))
#   departure arrival flyID processingDurationMillis authorisedAPI success airline errorMessage distance units
# 1       DRS     FKB     1                        0          TRUE    TRUE    NULL         NULL    484.6    km
# 2       TXL     HER     2                        0          TRUE    TRUE    NULL         NULL  2,131.8    km
# 3       STR     BOJ     3                        0          TRUE    TRUE    NULL         NULL  1,575.0    km
# 4       DUS     FUE     4                        0          TRUE    TRUE    NULL         NULL  3,066.3    km
# 5       LEJ     PMI     5                        0          TRUE    TRUE    NULL         NULL  1,512.4    km
# 6       FKB     AYT     6                        0          TRUE    TRUE    NULL         NULL  2,264.2    km
# 7       LNZ     FUE     7                        1          TRUE    TRUE    NULL         NULL  3,258.0    km
person JasonAizkalns    schedule 01.06.2016
comment
Могу ли я попросить вас еще одну информацию о том, как настроить цикл for, если расстояние между aiports равно NULL. Я полагаю, цикл остановится. Еще раз спасибо! - person Michaer Macher; 02.06.2016
comment
@MichaerMacher Я бы посоветовал задать это как новый вопрос. Кроме того, вы, вероятно, могли бы изменить две последние строки цикла for на: distance <- ifelse(is.null(callAPI(from, to)$distance), NA, callAPI(from, to)$distance) и df[i, "distance"] <- distance. Таким образом, вы вернете NA для расследования. - person JasonAizkalns; 02.06.2016

Вы можете сделать это без API, просто используя координаты аэропортов, которые находятся в свободном доступе в базе данных здесь https://raw.githubusercontent.com/jpatokal/openflights/master/data/airports.dat

## Import airport data
airports <- read.csv("https://raw.githubusercontent.com/jpatokal/openflights/master/data/airports.dat", header = F)

library(geosphere)
## Calculate matrix of differences in km
distance.matrix <- distm(x = airports[,c("V8", "V7")],  y = airports[,c("V8", "V7")])/1000
## This may take a while, and will generate a matrix 8107 by 8107, about 0.5gb in size.

## Rename dimensions to airport codes
rownames(distance.matrix) <- airports$V5
colnames(distance.matrix) <- airports$V5

## Example: km between Gatwick and Heathrow
distance.matrix["LGW", "LHR"]
[1] 41.24091
person Michael Veale    schedule 01.06.2016

Как насчет следующего цикла по вашим вызовам API?

df$distance <- 0

for (i in nrow(df)){
  drs <- df[i,]$departure
  fue <- df[i,]$arrival
  url <- paste0("https://airport.api.aero/airport/distance/", drs, "/", fue, "?user_key=4e816a2bf391f8379df1c42d2762069e")
  api <- curl_fetch_memory(url)
  text <- rawToChar(api$content)
  distance <- as.numeric(gsub(',','',substr(text,regexpr('distance',text)+11,regexpr('units',text)-4)))
  df[1,]$distance <- distance
}

df
person Dendrobates    schedule 01.06.2016