Я загрузил набор данных сообщений facebook, и он был отформатирован следующим образом:
f\u00c3\u00b8rste student
Это должно быть første student
, но я не могу его правильно расшифровать.
Я пытался:
str = 'f\u00c3\u00b8rste student'
print(str)
# 'første student'
str = 'f\u00c3\u00b8rste student'
print(str.encode('utf-8'))
# b'f\xc3\x83\xc2\xb8rste student'
Но это не сработало.
# -*- coding: utf-8 -*-
поверх своего скрипта Python. - person Rafael   schedule 04.12.2018# -*- coding: utf-8 -*-
указывает только кодировку файла исходного кода. - person quant   schedule 04.12.2018\xC3\xb8
тоже. Ответ очевиден. - person quant   schedule 04.12.2018