PDF in Markdown

Über PDF in Markdown

PDF zu Markdown serialisiert ein PDF in eine einzige eigenständige .md-Datei – Tabellen werden zu GFM-Pipe-Tabellen, Listen behalten ihre Marker und Verschachtelung, Hyperlinks überleben als `[Text](url)`, Bilder werden als base64-Data-URIs eingebettet, sodass das Markdown überall gerendert wird, ohne dass ein separater Asset-Ordner nötig ist. Großartig, um einen PDF-Bericht in einem GitHub-README zu veröffentlichen, in einen Static-Site-Generator einzuspeisen oder durch eine Markdown-fähige Notiz-App zu schleusen.

Jedes Wort der Extraktion geschieht in Ihrem Browser über dieselbe semantische Pipeline, die unseren PDF-zu-Word-Konverter antreibt. Es wird nichts hochgeladen. Die Ausgabe ist deterministisch – dasselbe PDF erzeugt immer dasselbe Markdown, Zeichen für Zeichen.

Fette und kursive Passagen innerhalb von Absätzen bleiben erhalten (`**fett**`, `*kursiv*`, `***beides***`). Bildunterschriften und herausgehobene Zitate werden als Blockzitate gerendert, da GFM keinen eigenen Stil für Bildunterschriften kennt. Die erste Zeile des Dokuments verwendet `#` als H1, und Titel- und Autor-Metadaten des PDFs (falls vorhanden) werden der Ausgabe vorangestellt.

So funktioniert es

Legen Sie Ihr PDF abZiehen Sie ein PDF in die Zone oder suchen Sie danach. Bis zu 100 MB. Lokal.
Die Konvertierung läuft in Ihrem BrowserDas Modul analysiert die Struktur, fügt weiche Trennstriche zusammen, erkennt Tabellen und verbindet seitenübergreifende Fortsetzungen – dieselbe Maschinerie, die der Word-Konverter nutzt. Am Ende wird GFM-Markdown ausgegeben.
Laden Sie die .md herunterEine eigenständige Datei mit eingebetteten Bildern. Fügen Sie sie in einen beliebigen Markdown-Editor, Renderer oder eine Dokumentationsplattform ein.

Wann PDF in Markdown verwenden

Einen PDF-Bericht als GitHub-README veröffentlichen

GitHub rendert Markdown nativ. Konvertieren Sie Ihr PDF einmal, committen Sie die .md, fertig – kein gehosteter PDF-Viewer nötig.

Ein technisches PDF in eine Dokumentations-Site einspeisen

Jekyll, Hugo, Docusaurus, MkDocs – alle nehmen Markdown entgegen. Sparen Sie sich den manuellen „Einfügen und neu formatieren"-Schritt.

Ein altes PDF-Handbuch in Obsidian, Logseq oder Bear bearbeiten

Markdown-native Notiz-Apps können keine PDFs lesen. Der Konverter schließt die Lücke und bewahrt die Struktur.

Häufige Fragen

Warum sind die Bilder inline (Data-URIs) und nicht in separaten Dateien?

Für eigenständige Ausgabe. Eine einzige .md-Datei funktioniert ohne einen assets/-Ordner, ist leichter zu mailen oder zu committen und wird überall gerendert – auch in Umgebungen, die relative Pfade nicht auflösen. Wenn Sie separate Bilddateien brauchen, extrahieren Sie sie später aus den Data-URIs.

Werden Tabellen gut behandelt?

Ja. Das Modul führt eine ausrichtungs- und linienbasierte Tabellenerkennung durch und gibt dann GFM-Pipe-Tabellen aus (| Spalte1 | Spalte2 |). Verbundene Zellen werden im Quell-PDF über rowspan/colspan respektiert (auch wenn GFM selbst keine echten verbundenen Zellen unterstützt – der Inhalt kommt dennoch durch).

Bleibt die Reihenfolge des Inhalts erhalten?

Die Lesereihenfolge ja – Zonen werden zuerst zerlegt, sodass ein zweispaltiger Artikel eine Spalte nach der anderen fließt. Wiederkehrende Kopf- und Fußzeilen werden entfernt (nicht Teil des Inhalts). Seitengrenzen werden nicht als explizite Umbrüche erhalten; der Inhalt fließt fortlaufend.

Über PDF in Markdown

So funktioniert es

Wann PDF in Markdown verwenden

Häufige Fragen

Ähnliche Tools