Über PDF in Markdown
PDF zu Markdown serialisiert ein PDF in eine einzige eigenständige .md-Datei – Tabellen werden zu GFM-Pipe-Tabellen, Listen behalten ihre Marker und Verschachtelung, Hyperlinks überleben als `[Text](url)`, Bilder werden als base64-Data-URIs eingebettet, sodass das Markdown überall gerendert wird, ohne dass ein separater Asset-Ordner nötig ist. Großartig, um einen PDF-Bericht in einem GitHub-README zu veröffentlichen, in einen Static-Site-Generator einzuspeisen oder durch eine Markdown-fähige Notiz-App zu schleusen.
Jedes Wort der Extraktion geschieht in Ihrem Browser über dieselbe semantische Pipeline, die unseren PDF-zu-Word-Konverter antreibt. Es wird nichts hochgeladen. Die Ausgabe ist deterministisch – dasselbe PDF erzeugt immer dasselbe Markdown, Zeichen für Zeichen.
Fette und kursive Passagen innerhalb von Absätzen bleiben erhalten (`**fett**`, `*kursiv*`, `***beides***`). Bildunterschriften und herausgehobene Zitate werden als Blockzitate gerendert, da GFM keinen eigenen Stil für Bildunterschriften kennt. Die erste Zeile des Dokuments verwendet `#` als H1, und Titel- und Autor-Metadaten des PDFs (falls vorhanden) werden der Ausgabe vorangestellt.
So funktioniert es
- Legen Sie Ihr PDF abZiehen Sie ein PDF in die Zone oder suchen Sie danach. Bis zu 100 MB. Lokal.
- Die Konvertierung läuft in Ihrem BrowserDas Modul analysiert die Struktur, fügt weiche Trennstriche zusammen, erkennt Tabellen und verbindet seitenübergreifende Fortsetzungen – dieselbe Maschinerie, die der Word-Konverter nutzt. Am Ende wird GFM-Markdown ausgegeben.
- Laden Sie die .md herunterEine eigenständige Datei mit eingebetteten Bildern. Fügen Sie sie in einen beliebigen Markdown-Editor, Renderer oder eine Dokumentationsplattform ein.