Разделить расшифровку на расшифровки для разных спикеров

Например, у меня есть стенограмма с разными спикерами (new.txt):

spk_0: Default transcript, containing many sentences. Such as this. 
spk_1: Blablabla
spk_2: Blablablaba fjdslf

Я хочу создать из этой стенограммы разные строки, которые содержат только текст, произнесенный говорящим, например:

new_spk_0 = "Default transcript, containing many sentences. Such as this."
new_spk_1 = "Blablabla"

Как я мог это сделать?

python string transcription

Boris Winter 13.10.2020 источник

comment

Это постановка проблемы. Что вы пробовали? Пожалуйста, продемонстрируйте с кодом. - sophros 13.10.2020

Ответы (1)

arrow_upward
0
arrow_downward

Исправлено это с помощью метода, представленного в: -a-lis">Чтение только слов определенного говорящего и добавление этих слов в список

Здесь совпадение с регулярным выражением в начале предложения используется для обозначения преобладания разных говорящих, а затем разбивается на несколько пар ключ-значение в словаре.

Boris Winter 13.10.2020

Разделить расшифровку на расшифровки для разных спикеров

Ответы (1)

Вопросы по теме