Разделить расшифровку на расшифровки для разных спикеров

Например, у меня есть стенограмма с разными спикерами (new.txt):

spk_0: Default transcript, containing many sentences. Such as this. 
spk_1: Blablabla
spk_2: Blablablaba fjdslf 

Я хочу создать из этой стенограммы разные строки, которые содержат только текст, произнесенный говорящим, например:

new_spk_0 = "Default transcript, containing many sentences. Such as this."
new_spk_1 = "Blablabla"

Как я мог это сделать?


person Boris Winter    schedule 13.10.2020    source источник
comment
Это постановка проблемы. Что вы пробовали? Пожалуйста, продемонстрируйте с кодом.   -  person sophros    schedule 13.10.2020


Ответы (1)


Исправлено это с помощью метода, представленного в: -a-lis">Чтение только слов определенного говорящего и добавление этих слов в список

Здесь совпадение с регулярным выражением в начале предложения используется для обозначения преобладания разных говорящих, а затем разбивается на несколько пар ключ-значение в словаре.

person Boris Winter    schedule 13.10.2020