Я пытаюсь очистить некоторые странные символы юникода после разбора HTML, но все еще не конвертирую эти юникоды.
Оригинальный текст:
raw = 'If further information is needed, don´t hesitate to contact us. Kind regards, José Ramirez.'
После кодирования и декодирования:
text = str(raw.encode().decode('unicode_escape'))
Текущий выход:
'If further information is needed, donÃ\x82´t hesitate to contact us. Kind regards, JosÃ\x83© Ramirez'
Желаемый результат:
'If further information is needed, don´t hesitate to contact us. Kind regards, José Ramirez'