criticalmass
Goto Top

Artikel-Backup-Skript zu bestimmten Internet-Themen (PDF)

Hallo zusammen,

wie aufwendig ist es, ein Skript zu programmieren, welches Nachrichten-Portale zu bestimmten Themen durchsucht und diese Artikel dann automatisch als PDF-Datei mit Ordnerstruktur speichert.
Muss man zusätzlich einen kleinen Heim-Server aufsetzen, der das Skript dann 24/7 ausführt oder gäbe es andere Alternativen?
Danke im Voraus.

Grüße!
criticalmass

Content-Key: 792305545

Url: https://administrator.de/contentid/792305545

Printed on: April 19, 2024 at 23:04 o'clock

Member: maretz
maretz Jun 24, 2021 at 13:28:19 (UTC)
Goto Top
ist recht einfach - wenn man annimmt das die Artikel die du suchst bereits in xml oder json vorliegen und ein flag besitzen "this is relevant" mit 0 (egal) oder 1 (will ich). Wenn man dazu dann annimmt das du sogar zugriff auf die Datenbanken dahinter hast und dort das Flag auslesen kannst ist es vermutlich sogar ne einfache SQL-Abfrage....

Alternativ müsste dir klar sein das die Infos bei weitem nichs aussagen - und die Antworten können bis hin zu Programmen aus dem Bereich der KI gehen (z.B. wenn du auch Tippfehler berücksichtigen willst oder z.B. querverweise zu anderen Artikeln wenn die x-mal in div. anderen Artikeln referenziert werden).

Also: Is von "einfach" bis hin zu "maximal-komplex", vermutlich liegt deine Lösung irgendwo dazwischen...
Member: criticalmass
criticalmass Jun 24, 2021 at 15:04:43 (UTC)
Goto Top
Also konkret z.B. Suchbegriffe wie "Astra Zeneca" oder "Paul Ehrlich Institut" auf den Portalen wie Spiegel, Welt, faz, taz, ZDF etc.

Klar möchte ich dann möglichst wenig Querverweise. Ansonsten könnte sich vermutlich schnell eine große Datenmenge ansammeln?

Opera hat ja z.B. die "als PDF speichern" Funktion. Also könnte man auch dort eine "Erweiterung" selber schreiben? Selber bekomme ich das definitiv nicht hin face-wink