Как я могу конвертировать конкретную веб-страницу в markdown или asciidoc с помощью pandoc?
Я хочу преобразовать документацию спецификации java в легко редактируемые форматы(markdown или asciidoc) и загрузить GitHub Gist и настроить(добавив свой код) и заметки.) Я хочу обратиться в что-то вроде этого
Я использую инструмент под названием pandoc, который позволяет нам конвертировать HTML в markdown.
Что я уже пробовал:
Техника 1
Я попытался преобразовать всю таблицу компонентов спецификации java на index.html
pandoc -f html -t markdown -o test2.md https://docs.oracle.com/javase/specs/jls/se10/html/index.html
У меня есть это:условие_2.МД (Я не загружал сюда, потому что файл содержимого слишком длинный)
Проблема: этот файл markdown не содержит содержимого документации спецификации java. Я ожидал, что получу markdown toc(таблица компонентов) и содержимое документации спецификации java в файле markdown следующим образом`
Техника 2(лучше, чем техника 1)
2-)я скачал все HTML-файлы TOC с HTTrack и пытаюсь конвертировать все файлы отдельно.
pandoc -f html-native_divs-native_spans -i jls-1.html -t markdown -o test2.md
Я получил следующий файл markdown который не перенаправляет таблицу компонентов:test3.МД
Как я могу исправить это и правильно преобразовать спецификацию java?