Стоимость замены траминера

У меня логическая проблема с матрицей переходных затрат. Я работаю над несходством последовательностей с помощью пакета R Traminer.

Я пытаюсь привести простой пример (очень простой, но надеюсь, что он поможет мне объяснить мою проблему):

Есть три последовательности, и я хочу вычислить матрицу несходства. Алфавит: H (здоров), I (болен дома), IH (болен в больнице), D (умер).

Я наблюдаю за 3 субъектами в течение 5 наблюдений. Это последовательности:

H – H – I – D – D 
H – I – I – I – D 
I – I – H – IH – IH 

Матрица стоимости замены представляет собой таблицу 4x4 (состояние x состояние). Он должен быть симметричным? Это моя логическая проблема: хотя можно «перейти» из состояний H, I или IH в состояние Died, обратное нелогично.

Могу ли я использовать несимметричную матрицу стоимости замещения в TraMineR?

Если в моей базе данных стоимость замены (рассчитанная, например, с sm = "TRATE") из состояния «I» в «D» ниже (0,5), чем стоимость замены из состояния «I» в «IH» (0,6), OM алгоритм заменит «I» на «D» вместо «HI».


person Giampiero    schedule 18.02.2015    source источник


Ответы (2)


мне кажется, что вы ищете нестандартную матрицу затрат. Не обязательно использовать метод TRATE или CONSTANT.

Чтобы создать настраиваемую матрицу, вам просто нужно сделать что-то вроде этого:

myscm <- matrix(c(0,1,2, 
                  1,0,2, 
                  2,2,0), nrow=3, ncol=3) 
dist.om <- seqdist(my.seq, method="OM", sm=myscm)

где myscm - ваша настраиваемая матрица

Это взято из http://lists.r-forge.r-project.org/pipermail/traminer-users/2011-July/000075.html

Я считаю, что у вас есть два варианта:

1) Создайте обоснование для всех переходов и полную настраиваемую матрицу

2) Получите матрицу перехода, которую вы уже сгенерировали (используя seqsubm(your.seq, method = "TRATE")), и измените только несовместимые значения. Это то, что я сделал в своем последнем анализе.

Но имейте в виду мысль, высказанную Гилбертом в асимметричной матрице попарных расстояний

person Pedro Braz    schedule 20.02.2015
comment
Спасибо, Педро Браз! Обоснование очень сложно, потому что я не могу упорядочить / ранжировать (то есть рейтинг релевантности или уровень важности) состояний (как в исследовании Холлисте 2009 года). Я попытался исправить свою матрицу перехода, установив максимальное значение для ячеек между двумя ячейками, которые не имеют реальной возможности существовать (например, переход от умершего к больному в больнице). Но я изучаю сравнительный обзор показателей несходства последовательностей (Studer & Richard, 2014). Я сомневаюсь, что эта (произвольная) процедура не будет выполнять неравенство треугольника. - person Giampiero; 20.02.2015
comment
Вы действительно можете определить нестандартную несимметричную матрицу. Однако что делать с такой матрицей? Функция seqdist от TraMineR ожидает симметричную матрицу стоимости замены для OM. В противном случае вы получите непредсказуемые, а значит, и ненадежные результаты. - person Gilbert; 20.02.2015

Темпы перехода (предполагаемые вероятности перехода) не следует путать с затратами замещения. Затраты на замену должны отражать различия между штатами.

Матрица скоростей перехода (возвращаемая seqtrate) НЕ симметрична.

Затраты на замену, используемые для вычисления расстояний, таких как оптимальное расстояние согласования, должны быть симметричными. В противном случае результатом не будет матрица расстояний, и ввод такой несимметричной матрицы, например, в процедуру кластеризации приведет к неожиданным результатам.

Получение стоимости замещения из коэффициентов перехода - это лишь одна из нескольких возможностей определения затрат замещения. Если принять за $ p (i | j) $ вероятность перехода от $ j $ к $ i $, то она заключается в определении стоимости замены как

$c(i,j) = 2 - p(i|j) - p(j|i)$

person Gilbert    schedule 18.02.2015
comment
Спасибо, Гилберт! Вы очень мне помогли. Поскольку моя работа носит иллюстративный характер, я буду использовать меру, в которой используются эти параметры (например, метод = TRATE), и другой метод измерения длины (LCS), а затем сравню результаты. - person Giampiero; 19.02.2015