Bash Script für Automatisierung

Mitglied: Kai-aus-der-Kiste

Kai-aus-der-Kiste (Level 1) - Jetzt verbinden

07.03.2021 um 15:46 Uhr, 567 Aufrufe, 5 Kommentare

Kurz zum Problem, und der Aufgabenstellung, oder Lösungswunsch.
Ich verwende als Umsteiger von Windows auf Linux seit einigen Monaten die Distribution Linux Mint jetzt in der aktuellen Version 20.1 Cinnamon. Da unter Linux nicht mehr die Software von Adobe für die Betrachtung und Bearbeitung von PDF Dokumenten genutzt werden kann, stoße ich mit dem vorhandenen Xreader an meine Grenzen.
Da ich oder wir fast ausschließlich mit umfangreichen PDF Dokumenten arbeiten ( > 300 Seiten ) und diese auch eine Vielzahl von Weblinks in der Darstellungsweise [„angezeigter Text“;“Webadresse“] enthält, wird die Arbeit damit sehr mühsam. Ich kann zwar auf dieses Wort klicken und erhalte im Kontextmenü die Auswahl, entweder den Link einzeln zu öffnen, oder die Linkadresse in die Zwischenablage zu kopieren. Damit kann ich zwar ein TXT Datei erstellen, in der alle Links nacheinander aufgelistet sind. Das ist aber sehr mühsam und aufwendig. Gibt es nun eine Möglichkeit via eines Scripts, diese Links aus der PDF Datei zu extrahieren, diese in einer Datei zwischenzuspeichern, und wie ich schon herausgefunden habe, nur diese eine Web-Seite mit WGET zu downloaden, und auch wieder als PDF abzulegen.

Meine Überlegung dazu: -ein Script
<code>
-extrahiere_PDF Dateiname.pdf linkliste.txt-
-prüfe linkliste.txt- #wenn der Host nicht erreichbar ist, was ab und an mal vorkommt, soll dieser Eintrag aus der Liste entfernt werden
- for ANFANG bis ENDE in linkliste.txt do
-----Download der Seite mit WGET mit allen enthaltenen Bild-Elementen, aber ohne weiterführende LINKS, und Mediendarstellungen ( keine GIFs, keine Audiostreams, keine Videodarstellungen, keine JAVA Applets )
-----Wandle die gedownloadete Webseite in ein PDF Dokument um
-Lösche alle Downloads die mit WGET gemacht worden.
<code>

Bitte keine Diskussion warum ich überhaupt auf Linux umgestiegen bin. Das hatte mehrere Gründe, die sowohl in der Update- und Treiberpolitik von Microsoft zu finden sind, wie auch der Tatsache, dass ich nicht aller paar Jahre neue Hardware kaufen möchte, nur weil die Anforderungen ( speziell Hardware ) für flüssiges Arbeiten unter Windows 10 immer weiter und schneller steigen. Zudem habe ich in Erfahrung gebracht, dass auch das Rasbian OS für ein Raspberry PI den selben Systemunterbau wie Linux Mint hat. Wenn dieser Script auf meinem Laptop läuft, würde ich den Script auf ein RASPI installieren wollen. Dieses kann dann Zeit-unkritisch diese Aufgabe im Hintergrund übernehmen, falls es dafür ausreichend leistungsfähig ist. Zur Zeit habe ich schon ein PI 3B+ als lokales NAS im Einsatz.
Mitglied: NordicMike
08.03.2021 um 09:15 Uhr
Ja, das geht alles mit der Shell. Das wirst du nicht fertig finden, du musst dich Schritt für Schritt in jeden Zwischenpunkt einarbeiten. Die Windows Updates sind noch harmlos dagegen.
Bitte warten ..
Mitglied: pvps1at
LÖSUNG 08.03.2021 um 13:46 Uhr
ausgemachter Blödsinn, sorry.

erster Link einer google suche:
https://stackoverflow.com/questions/31436357/how-to-extract-all-links-fr ...
Bitte warten ..
Mitglied: NordicMike
08.03.2021 um 13:48 Uhr
Was ist Blödsinn?
Bitte warten ..
Mitglied: pvps1at
LÖSUNG 08.03.2021 um 13:50 Uhr
der zweite link von google liefert gleich nochmals mehrer Lösungen die copy/paste übernommen werden können.

https://unix.stackexchange.com/questions/531870/bash-get-links-from-pdf
Bitte warten ..
Mitglied: Kai-aus-der-Kiste
08.03.2021 um 19:07 Uhr
Moin @pvps1at

Danke erst einmal für deine Links. Ich werde das mal Schritt für Schritt durch und ausprobieren. Aber ich habe noch eine anderes Projekt parallel laufen, was mir jetzt wichtiger erscheint. Danke erst einmal !

Kai
Bitte warten ..
Heiß diskutierte Inhalte
Netzwerke
Was passiert wenn ich zeitgleich PoE und Strom vom Netzteil an einen Access Point (Mikrotik) lege?
kartoffelesserVor 1 TagFrageNetzwerke3 Kommentare

Hallo Experten und Admins Ich habe einen Mikrotik wAP ac (RB-WAPG-5HACD2HND) an einem Laptopwagen im Einsatz. Leider ist die vorhandene Stromversorgung für den AP ...

Windows Server
Infrastruktur für Firma
brainwashVor 17 StundenFrageWindows Server7 Kommentare

Hallo zusammen, kurze Erklärung zu meinem Problem Wir sind eine kleine Firma mit zwei Standorten im Bereich Brandschutz. Zur Zeit nutzen wir für unsere ...

Netzwerkprotokolle
Proxy Zugang von Extern
gelöst Jannik2018Vor 1 TagFrageNetzwerkprotokolle17 Kommentare

Hallo zusammen, ich habe mir einen Squid Proxy auf einer Linux VM aufgesetzt und möchte das man aus allen netzen drauf zugreifen kann allerdings ...

Windows Server
Windows 10 VM auf Server 2019 Essentials
jhuedderVor 1 TagFrageWindows Server10 Kommentare

Hallo, einer meiner Kunden möchte aus Kostengründen einen Windows Server 2019 (direkt auf einer physikalischen Maschine installiert) erwerben und dort für einen Außendienstler mit ...

Server-Hardware
Verkaufe RX300 S7 Server von Fuijutsu
HolzBrettVor 18 StundenAllgemeinServer-Hardware9 Kommentare

Hi, Ich wohne in Aachen und habe die Server von der Firma umsonst erhalten. Ich habe sie bereits überprüft (es geht alles). Ich möchte ...

Windows Server
Veeam Endpoint Backup FREE zur Sicherung eines DCs
gelöst takvorianVor 1 TagFrageWindows Server7 Kommentare

Hallo zusammen, ich habe hier bei mir 1 Hypervisor mit 4 VMs (darunter 1 DC) welche ich mittels backupAssist alle wegsichere. Klappt soweit auch ...

LAN, WAN, Wireless
WLan-unterstütztes Telefonieren iOS, Unifi
VisuciusVor 1 TagFrageLAN, WAN, Wireless8 Kommentare

Hallo. Ich bins (wieder) ;-) Guten Morgen, ich beobachte seit einer Umstellung ein "komisches Verhalten" und kann mir das gerade nicht erklären. Und vielleicht ...

LAN, WAN, Wireless
Heimnetzwerk mit VLAN - getrennter Internetzugang
gelöst anyibkVor 1 TagFrageLAN, WAN, Wireless5 Kommentare

Hallo liebe Community! Ich bastle seit einiger Zeit an einem recht besonderen Heimnetzwerkproblem. Wir haben einen neuen Glasfaseranschluss ins Haus (3 Parteien) bekommen und ...