Я хотел бы измерить сходство последовательностей Хэмминга, в котором затраты на замещение основаны не на скорости замещения в наблюдаемых последовательностях, а на пространственной автокорреляции в пределах изучаемой области различных состояний (состояния, таким образом, связаны не с ДНК, а с чем-то другим). ).
Я разделил свою область исследования на ячейки сетки одинакового размера (например, 1000 м) и измерил, как часто одно и то же «состояние» наблюдается в соседней ячейке (Rook-case). Следовательно, весовая матрица показывает, что переход из состояния A
в A
(для перемещения в пределах тех же состояний) имеет гораздо более высокую вероятность, чем переход из A
в B
или из B
в C
или из A
в C
. Это уже указывает на то, что состояния имеют высокую пространственную автокорреляцию.
Проблема в том, что если вы хотите измерить сходство последовательностей, матрица замещения должна быть 0
по диагонали. Поэтому мне было интересно, есть ли какое-то преобразование для перехода от «матрицы автокорреляции» к матрице замещения со значениями 0
по диагонали. С помощью этого мы хотели бы учесть пространственную автокорреляцию в изучаемой области в нашей мере сходства последовательностей. Для анализа я использую пакет TraMineR
.
Пример матрицы в R для последовательностей, состоящих из четырех состояний (A,B,C,D): Пример последовательности: AAAAAABBBBCCCCCCCCCCCCDDDDDDDDDDDDDDDDDDDDDDDAAAAAAAAA
Матрица автокорреляции:
A = c(17.50,3.00,1.00,0.05)
B = c(3.00,10.00,2.00,1.00)
C = c(1.00,2.00,30.00,3.00)
D = c(0.05,1.00,3.00,20.00)
subm = rbind(A,B,C,D)
colnames(subm) = c("A","B","C","D")
как преобразовать эту матрицу в матрицу подстановки?