Как я могу получить "рейтинг" звукового сходства для строки, написанной на одном языке, с другой строкой на другом языке: то есть алгоритм, который определит это
«Дэвид Леттерман» и «דוד לטרמן strong>» - это строки, которые звучат одинаково.
-О, да, кстати, это на иврите, как вы уже догадались: «Дэвид Леттерман», и это звучит / произносится почти так же, как на английском языке ..
Единственный исходный материал, который у меня есть, - это строки в юникоде на соответствующих языках. То есть у меня нет фонем или фонетических транскрипций / переводов строк.
Я уже реализовал кое-что вроде настройки реализации Soundex, которая работает так себе. Это путь?