У меня есть список предложений. Я хочу добавить к ним отступы; но когда я использую keras pad_sequence следующим образом:
from keras.preprocessing.sequence import pad_sequences
s = [["this", "is", "a", "book"], ["this", "is", "not"]]
g = pad_sequences(s, dtype='str', maxlen=10, value='_PAD_')
результат:
array([['_', '_', '_', '_', '_', '_', 't', 'i', 'a', 'b'],
['_', '_', '_', '_', '_', '_', '_', 't', 'i', 'n']], dtype='<U1')
Почему он не работает должным образом?
Я хочу использовать этот результат в качестве входных данных для встраивания ELMO, и мне нужны строковые предложения, а не целочисленное кодирование.