Я только что получил в руки дамп данных Stackoverflow, и я разочарован, увидев это поле Body сообщений находится в HTML, а не в Markdown. Я подозреваю, что в исходной базе данных есть Markdown, потому что это то, что я увижу, если попытаюсь отредактировать ответ.
Я хочу восстановить Markdown из большого набора ответов. Я буду обрабатывать сотни записей в пакетном режиме, используя инструменты командной строки или какую-то библиотеку Lua или C, поэтому интерактивный инструмент, такой как wmd Markdown Editor не подходит. Могут ли люди сказать, какие инструменты доступны для восстановления Markdown из дампа данных Stackoverflow?
(Связанный вопрос, не дубликат: Конвертировать HTML обратно в Markdown в пределах wmd.)