Diese Dienstleistung ist vorübergehend nicht verfügbar
Ich werde Daten aus PDFs mit Python in Excel extrahieren
Niederlande
Python-Automatisierung, Web Scraping, Bots
Über diesen Service
Hast du eine Menge PDFs mit Daten in Tabellen? Rechnungen, Berichte, Formulare, Kontoauszüge. Ich bringe alles in eine saubere Excel-Datei.
Ich nutze pdfplumber und tabula für die Tabellenerfassung, dazu eigene Parsing-Logik für knifflige Layouts. Tabellen, die sich über mehrere Seiten erstrecken, inkonsistente Spaltenbreiten, zusammengeführte Zellen. Damit habe ich Erfahrung. Wenn deine PDFs gescannte Bilder statt Text sind, kann ich auch OCR verwenden.
Du schickst die PDFs, sagst mir, welche Felder du brauchst, und ich kümmere mich um den Rest. Zuerst mache ich einen Testlauf mit 2-3 Dateien, damit du das Ergebnis prüfen kannst, bevor ich die ganze Charge bearbeite.
Tools: Python, pdfplumber, tabula, openpyxl, Pandas, OCR (Tesseract)
