Переменные затраты на отступы для последовательностей неравной длины

Я провожу анализ последовательности в TraMineR, используя алгоритм оптимального соответствия. К сожалению, мои последовательности имеют неравную длину из-за цензуры справа. Минимальная длина моих последовательностей - 5, максимальная - 11. Вариации длины не имеют значения из-за различий между последовательностями, которые меня интересуют. Поэтому я хочу удержать влияние неравной длины на общие различия между последовательностями как как можно меньше.

Я прочитал возможное решение этой проблемы у Стовела и Болана (2004 (1)), которые используют переменные затраты на отступ в зависимости от того, имеют ли последовательности равную длину. Таким образом, для последовательностей равной длины они используют фиксированные затраты indel, а для неравной длины они используют уменьшенную стоимость, которая составляет «примерно четверть фиксированных затрат».

У меня могут быть следующие вопросы: В целом, как следует кодировать пропуски в TraMineR? Как пустые элементы или я должен включить отсутствующее состояние в алфавит? Есть ли в TraMineR возможность применять переменные независимые затраты, как это было предложено Стовелом и Боланом? Если да, то как это можно сделать?


(1) Стовел, Кэтрин и Марк Болан. 2004. "Жилые траектории: использование оптимального выравнивания для выявления структуры жилой мобильности". Социологические методы и исследования 32 (4): 559-598.


person elisabet112    schedule 23.09.2013    source источник


Ответы (1)


В настоящее время невозможно использовать переменные затраты на отступ (в зависимости от того, имеют ли последовательности одинаковую длину). Я довольно скептически отношусь к этому методу, потому что, если я хорошо его понимаю, определение меры расстояния изменяется в соответствии с задействованными последовательностями (поскольку изменяются затраты на отступ). По этой причине неравенство треугольника не соблюдается. С концептуальной точки зрения я считаю, что мы всегда должны использовать одни и те же критерии сравнения и, следовательно, одно и то же определение расстояния.

person Matthias Studer    schedule 25.09.2013
comment
Что означает несоблюдение неравенства треугольника? Почему это проблема? - person histelheim; 28.10.2013