Das Tatwerkzeug: Internet Explorer plus Python (Software)

Martin Vogel ⌂ @, Dortmund / Bochum, Mon, 18.07.2011, 16:13 (vor 4659 Tagen) @ NicO

In meinem Fall geht es um eine Art katalogisierte Daten, verteilt auf mehrere (ca. 400-500) Seiten und Unterseiten bei denen es (mir) zu aufwändig wäre sie alle einzeln aufzurufen um sie anschließend zum Druck los zu schicken.

[image]Nun, es gibt ja einen Browser, der bevorzugt von Internetausdruckern verwendet wird und nicht nur prima zur unkomplizierten Installation von Betriebssystemerweiterungen geeignet ist, sondern auch eine ungewöhnliche, speziell auf seine besondere Klientel zugeschnittene Funktion zum Massenausdruck von allen Webseiten besitzt, die von einer anderen Seite aus verlinkt sind: Der Microsoft Internet Explorer. Dort ist lediglich beim Drucken ein Häkchen vor „Alle durch Links verbundenen Dokumente drucken“ im Reiter „Optionen“ zu setzen.

Um eine geeignete Indexseite mit allen Links zu bekommen, kann man wiederum wget bemühen oder, wenn die Seiten nach einem bestimmten Schema aufgebaut sind, die Indexseite mit einer kleinen Programmschleife erzeugen lassen.

Für letzteres eignet sich Python hervorragend. Angenommen, die Website besteht aus URLs nach dem Schema „http://www.example.com/katalog?Seite=500“ mit dem Parameter „Seite“ im Bereich von 100 bis 500, so könnte eine lokale Datei "Katalog-Index.html" mit ein paar Zeilen Python schnell zusammengestellt werden.

[image]
[image] ZIP-Datei mit Python-Quelltext

--
Dipl.-Ing. Martin Vogel
Leiter des Bauforums

Bücher:
CAD mit BricsCAD
Bauinformatik mit Python


gesamter Thread:

 RSS-Feed dieser Diskussion

powered by my little forum