readxl добавляет символ нулевой длины в конец столбца

Я читаю файл excel, используя пакет readxl, а точнее функцию read_excel() этого пакета.

Строки в одном из моих столбцов содержат символ «$» в конце. Когда я проверяю длину строк в этом столбце, число, сообщаемое nchar(), на единицу больше, чем длина, которую я вижу визуально (8 вместо 7).

Это не относится к остальным столбцам в моем файле Excel, которые не содержат специального символа «$» в конце.

  • Я попытался явно отформатировать этот столбец как «Текст» в Excel, но это не помогло.
  • Я также пытался использовать параметр trim_ws = TRUE функции, но снова безуспешно.

Вот строки, которые я прочитал вместе с результатами nchar:

введите здесь описание изображения

Любая помощь приветствуется.


person stratar    schedule 29.01.2019    source источник
comment
Вам нужно будет поделиться представлением одной из тех строк, которые мы можем проверить сами. Мы мало что можем сделать, просто глядя на снимки экрана. dput() выход был бы полезен.   -  person joran    schedule 29.01.2019
comment
Честно говоря, не уверен, что делает dput. Я не могу поделиться файлом, так как это запрещено (я работаю здесь по корпоративным правилам, а не дома). По сути, он анализирует строку M1USE1$‹U+200B›, а не просто M1USE1$.   -  person stratar    schedule 29.01.2019
comment
Таким образом, в вашем файле есть скрытые символы нулевой длины, о которых R добросовестно сообщает вам. Простое удаление u200b в r привело меня к этому.   -  person joran    schedule 29.01.2019
comment
А dput экспортирует объект R в такой форме, в которой его может легко реконструировать кто-нибудь, пытающийся помочь вам в R, сохраняя при этом любые особенности рассматриваемых данных.   -  person Mako212    schedule 29.01.2019