Логистическая функция для регрессионного кригинга

Я хотел бы выполнить регрессионный кригинг (РК) для бинарного присутствия-отсутствия и данных сетки хоста в качестве постоянного предиктора. Я использовал логистическую функцию для оценки взаимосвязи между бинарным результатом и предиктором, однако я думаю, что она не соответствует предположениям РК? Предикторная переменная не является значимой в модели. Есть ли альтернатива, как к этому подойти?

Данные для кода: https://drive.google.com/folderview?id=0B7-8DA0HVZqDYk1BcFFwSkZCcjQ&usp=sharing

presabs <- read.csv("Pres_Abs.csv",header=T, 
                             colClasses = c("integer","numeric","numeric", 
                                            "integer"))

coordinates(presabs) <- c("Long","Lat")   # creates SpatialPointsDataFrame

host <- read.asciigrid("host.asc.txt")  # reads ArcInfo Ascii raster map 

host.ov <- overlay(host, presabs)  # create grid-points overlay
presabs$host.asc.txt <- host.ov$host.asc.txt  #copy host values
presabs$host.asc.txt <- log(host.ov$host.asc.txt)

glm(formula = Pres ~ host.asc.txt, family = binomial, data = presabs)
summary(glm.presabs)

Weighted Residuals:
    Min      1Q  Median      3Q     Max 
-0.3786 -0.3762 -0.3708 -0.3497  3.3137 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  -1.942428   0.320104  -6.068 1.38e-08 ***
host.asc.txt -0.001453   0.003034  -0.479    0.633    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.007 on 127 degrees of freedom
Multiple R-squared:  1.317e-05, Adjusted R-squared:  -0.007861 
F-statistic: 0.001673 on 1 and 127 DF,  p-value: 0.9674

Затем, когда дело доходит до фактического кригинга, я построил этот код из учебника, но, похоже, фактические остатки от glm не передаются в функцию krige. Можно ли улучшить в gstat?

library(gstat)

# Set bin width for the variogram and max distance:
Bin <- 0.09
MaxDist <- 1
BinNo <- MaxDist/Bin

# Calculate and plot the variogram
surpts.var <- variogram(Pres~1, presabs, cutoff=MaxDist, width = Bin)
plot(surpts.var)

# Insert parameter values for the variogram model
psill = 0.05921
distance = 63.7/111
nugget = 0.06233 # constant

# Fit and plot variogram model:
null.vgm <- vgm(psill,"Sph",distance,nugget) # initial parameters
vgm_Pres_r <- fit.variogram(surpts.var, model=null.vgm, fit.ranges=TRUE, 
                            fit.method=1)
plot(surpts.var,vgm_Pres_r)

# Run RK using universal kriging:
presabs_uk <- krige(Pres~host.asc.txt, locations=presabs, 
                         newdata=host, model=vgm_Pres_r)

person mihoo    schedule 02.04.2015    source источник
comment
Есть несколько проблем с первым скриптом: то вы забыли library(sp), то данные точки не приходят в удобном формате на ваш гугл диск, то presabs$host.asc.txt <- log(host.ov$host.asc.txt) не соответствует выводу glm внизу, то вы вроде вызываете summary.lm на объект glm вместо соответствующего summary, то glm.presabs отсутствует. Похоже, вы копируете и вставляете команды, не проверяя их согласованность и воспроизводимость.   -  person Edzer Pebesma    schedule 27.04.2015


Ответы (1)


krige упоминает, что это

[using universal kriging]

Это означает, что он подходит для линейной модели, но не для обобщенной линейной модели. Он использует вариограмму, которую вы подогнали к необработанным данным, а не к остаткам. Остаточная вариограмма была бы получена

surpts.var <- variogram(Pres~host.asc.txt, presabs, cutoff=MaxDist, width = Bin)

но почти идентично, поскольку ваша переменная и карта сетки почти не коррелированы:

> cor(presabs$Pres,presabs$host.asc.txt)
[1] -0.04281038

поэтому неудивительно, что вы не узнаете карту сетки в универсальных прогнозах кригинга: они почти (линейно) независимы.

person Edzer Pebesma    schedule 27.04.2015