PDF → Markdown
Конвертация PDF в Markdown, JSON или HTML онлайн. Извлекайте структурированный текст с заголовками, таблицами и списками для работы с AI и LLM.
- 1Файлы
- 2Параметры
- 3Выполнение
- 4Результат
1. Файлы
Исходный файл
Допустимые форматы: .pdf2. Параметры
3. Выполнение
Прикрепите файл, чтобы продолжить
Как это работает
- 1Загрузите PDF, который нужно превратить в структурированный текст.
- 2Выберите формат: Markdown (.md), JSON с координатами или HTML.
- 3Запустите конвертацию и скачайте результат для RAG, GPT или базы знаний.
Частые вопросы
- Какой формат выбрать для RAG?
- Markdown: разбейте результат на чанки по заголовкам второго уровня (##) — это стандартный сплиттер LangChain и LlamaIndex.
- Зачем нужен JSON с bounding boxes?
- Он хранит координаты элементов на странице — для ответов с точными цитатами-ссылками.
- Как быть со сканами?
- Сначала запустите OCR, тогда распознанный текст будет правильно размечен.
Подробнее в статье: Как конвертировать PDF в Markdown для работы с AI и LLM →