Я провожу анализ последовательности в TraMineR, используя алгоритм оптимального соответствия. К сожалению, мои последовательности имеют неравную длину из-за цензуры справа. Минимальная длина моих последовательностей - 5, максимальная - 11. Вариации длины не имеют значения из-за различий между последовательностями, которые меня интересуют. Поэтому я хочу удержать влияние неравной длины на общие различия между последовательностями как как можно меньше.
Я прочитал возможное решение этой проблемы у Стовела и Болана (2004 (1)), которые используют переменные затраты на отступ в зависимости от того, имеют ли последовательности равную длину. Таким образом, для последовательностей равной длины они используют фиксированные затраты indel, а для неравной длины они используют уменьшенную стоимость, которая составляет «примерно четверть фиксированных затрат».
У меня могут быть следующие вопросы: В целом, как следует кодировать пропуски в TraMineR? Как пустые элементы или я должен включить отсутствующее состояние в алфавит? Есть ли в TraMineR возможность применять переменные независимые затраты, как это было предложено Стовелом и Боланом? Если да, то как это можно сделать?
(1) Стовел, Кэтрин и Марк Болан. 2004. "Жилые траектории: использование оптимального выравнивания для выявления структуры жилой мобильности". Социологические методы и исследования 32 (4): 559-598.