Я ищу таблицу, содержащую символы ASCII и одинаковые символы UTF8. Я знаю, что это также зависит от шрифта, если они выглядят одинаково, но для начала достаточно чего-то общего.
>>> # PY3 code:
>>> a='H' # ascii
>>> b='Н' # utf8
>>> a==b
False
>>> ' '.join(format(ord(x), 'b') for x in a)
'1001000'
>>> ' '.join(format(ord(x), 'b') for x in b)
'10000011101'
>>> a='P' # ascii
>>> b='Ρ' # utf8
>>> a==b
False
>>> ' '.join(format(ord(x), 'b') for x in a)
'1010000'
>>> ' '.join(format(ord(x), 'b') for x in b)
'1110100001'
for x in a
перебирает кодовые точки Unicode, а не кодовые единицы UTF-8. (==
сравнивает последовательности единиц кода UTF-8.) - person Tom Blodget   schedule 22.10.2017