Offline · PDF (pdf.js + Tesseract OCR) & DOCX (mammoth.js)NO SERVER · NO CDN
⚠ Hinweis: file://-Protokoll erkannt.
Web-Worker (OCR & PDF) können je nach Browser im file://-Modus blockiert werden.
Starte einen lokalen HTTP-Server für zuverlässige Funktion: python3 -m http.server 8080
→
http://localhost:8080/index.html
📄
PDFs & DOCX hier ablegen
oder Dateien auswählen (auch mehrere)
OCR-Einstellungen (nur PDF)
OCR wird nur als Fallback genutzt (<50 Zeichen/Seite per
pdf.js erkannt → Seite gilt als Scan).
DOCX-Dateien werden direkt per mammoth.js konvertiert – kein OCR erforderlich.
Dateien
Keine Dateien – PDFs oben ablegen.
Status-Log
Markdown-Vorschau
Tokens vorher: –Tokens nachher: –Zeichen: –
Batch-Download (alle fertigen Dateien)
Für Telli aufteilen
Datenschutz & Nutzungsbedingungen
Datenschutz
Dieses Tool läuft vollständig lokal im Browser. Es werden keine Daten an externe Server übertragen.
Hochgeladene PDF-Dateien verlassen zu keinem Zeitpunkt dein Gerät.
Es werden keine Cookies gesetzt, keine Tracking-Skripte geladen und keine Nutzungsdaten erhoben.
Alle Bibliotheken (pdf.js, Tesseract.js, Sprachdaten) sind lokal im libs/-Ordner gespeichert – keine CDN-Verbindung beim Betrieb.
Der Betreiber hat keinen Einblick in verarbeitete Dokumente oder erzeugte Texte.
Nutzungsbedingungen
Die Nutzung des Tools ist kostenlos und ohne Registrierung möglich.
Der Quellcode steht unter der Lizenz CC BY-SA 4.0: Namensnennung und Weitergabe unter gleichen Bedingungen erforderlich.
Das Tool wird ohne Gewährleistung bereitgestellt. Für Richtigkeit, Vollständigkeit oder Eignung für einen bestimmten Zweck wird keine Garantie übernommen.
Die Verarbeitung urheberrechtlich geschützter PDFs liegt in der Verantwortung der Nutzenden.