Lupuz.de: Artikel-Portal / Magazin

Zurück   Postpla.net - die Forum Community > PC, Internet und Technik > Coder's Area

AWK und PDF Grabber

Anzeigen:

Thema geschlossen
 
Themen-Optionen Thema durchsuchen
zh.lojKx0
Alt 21.11.2005, 20:47   #1
Standard AWK und PDF Grabber

Kann mir hier jemand sagen wie ich komfortabel eine pdf-datei mit awk(c-ähnliche sprache) auslese?
Das einzige Problem dabei ist das die pdf komisch aussehen kann das heisst zum Beispiel 2 Spalten von denen ich nur die Infos aus der linken benötige.
Mit PDF Grabber kommt zwar ein schön formatierter Fließtext raus, aber halt Zeilenweise. Und manchmal klemmt der zwischen 2 Zeichen die eigentlich zusammengehören noch ein Leerzeichen.
Mir ist bewusst das pdf-Dateien auch mit Koordinaten arbeiten (d.h. Text im "Quelltext" der pdf steht ganz woanders als in der pdf dann selbst).
Kennt jemand ein besseres pdf-tool?
 
 
Nach oben
evilboy
Alt 02.01.2006, 22:53   #2
Standard

Es bringt dir vielleicht nicht viel, aber du kannst vielleicht die PDF-Auslesefunktionen z.B. in eine DLL auslagern, die du mit einer anderen Programmiersprache schreibst.

Wegen den Leerzeichen: Das ist normal, schau dir mal die Google Cache-Versionen von PDFs an, da PDFs ja aus Druckerbefehlen (PostScript) hergestellt werden.
 
 
Nach oben
Sidolin
Alt 02.01.2006, 23:01   #3
Standard

Such mal nach pdf2txt, das macht das für dich, und zwar ganz akzeptabel. Den Output kannst du ja dann weiterpipen...
 
 
Nach oben
Ähnliche Themen, die dich vielleicht interessieren
Thema Autor Forum Antworten Letzter Beitrag
[Suche] Guter und kostenloser PDF Creator Squdus Betriebssysteme und Software 5 22.02.2008 00:44
PDF Formulare erstellen Calli Betriebssysteme und Software 5 12.12.2007 22:52
Anzeigen:
Thema geschlossen

Lesezeichen

Themen-Optionen Thema durchsuchen
Thema durchsuchen:

Erweiterte Suche



Alle Zeitangaben in WEZ +2. Es ist jetzt 04:57 Uhr.


Lupuz.de - wir können auch anders!
©1998 - 2008, Lupuz:Information-Network
Powered by vBulletin Version 3.7.1 (Deutsch), Jelsoft Enterprises Ltd.
Grüne Links?

SEO by vBSEO 3.2.0 ©2008, Crawlability, Inc.