Ближайший существующий вопрос, который я нашел, это this или это
Я хотел бы написать функцию или класс, который принимает строку, а затем на основе любых критериев, которые могут быть запрограммированы в нее, будет возвращать вероятность того, что это настоящее человеческое имя. На данный момент я ожидаю, что он будет сильно смещен в сторону английских или европейских имен или английских транслитераций других имен. (например, "bob", "bob smith" и "smith" должны возвращать значение 1.0, а "sfgoisxdzzg" должно возвращать что-то вроде .001 или даже .0000001)
Кто-нибудь знает, это уже делается/делается? (даже если на другом языке) Моей первой мыслью было, что мне придется сделать какой-то скрипт машинного обучения. Моя проблема с этим заключается в моем полном незнании какой-либо теории машинного обучения.
Итак, вторая часть моего вопроса такова: является ли машинное обучение жизнеспособным вариантом решения этой проблемы? Если да, то с каких ресурсов мне следует начать, чтобы узнать, как это сделать? ЕСЛИ нет, можете ли вы указать мне правильное направление?