Извлечение текста из видео с помощью AWS Rekognition

Одна из целей моего проекта - обнаруживать текст в потоковом видео с помощью AWS Rekognition.

Я пытался найти документацию AWS. Похоже, что AWS позволяет разработчику извлекать текст только из сохраненных изображений.

См. Эту документацию AWS - обнаружение текста в изображении В документации AWS есть следующий код для обнаружения текста в изображении. Этот код в основном имеет detect_text API, который принимает сохраненное изображение из S3 в качестве входных данных и выводит обнаруженный текст из изображения.

У меня вопрос: есть ли способ извлечь текст из потокового видео с помощью AWs Rekognition? ИЛИ Могу ли я сказать, что в настоящее время невозможно извлечь текст из потокового видео с помощью AWS Rekognition?

Сообщите мне о любых методах решения этой задачи.

import boto3

if __name__ == "__main__":

    bucket='bucket'
    photo='text.png'

    client=boto3.client('rekognition')


    response=client.detect_text(Image={'S3Object':{'Bucket':bucket,'Name':photo}})

    textDetections=response['TextDetections']
    print ('Detected text')
    for text in textDetections:
            print ('Detected text:' + text['DetectedText'])
            print ('Confidence: ' + "{:.2f}".format(text['Confidence']) + "%")
            print ('Id: {}'.format(text['Id']))
            if 'ParentId' in text:
                print ('Parent Id: {}'.format(text['ParentId']))
            print ('Type:' + text['Type'])
            print

person Pankesh    schedule 04.08.2019    source источник


Ответы (1)


обнаружение текста доступно только для изображений JPG и PNG. Одно из решений - извлечь кадры из видео, а затем передать их в Rekognition для обработки.

Вот полный пример, в котором это достигается с помощью комбинации Kinesis, Lambda и Rekognition: https://github.com/aws-samples/amazon-rekognition-video-analyzer

person Julien Simon    schedule 04.08.2019