
13369
31.01.2012
Artikel aus dem Internet archivieren
Hallo!
Wer kennt es nicht? Man findet liest einen interessanten Artikel im Internet, erinnert sich ewig später wieder daran, kann ihn aber nicht mehr finden. Oder der Artikel ist nicht mehr im Netz. Ich habe über Google Reader viele Blogs abonniert und kennzeichne die besonders lesenswerten Artikel immer mit einem Stern oder Tag, so dass ich sie wiederfinden kann. Jetzt möchte ich diese Artikel gerne aber auch offline archivieren können.
Im Idealfall würde das so aussehen: Durch ein Newsfeed werden Artikel mit einem bestimmten Tag oder Markierte Artikel ausgelesen (stellt der Google Reader zur Verfügung) und in einer Datenbank (Felder: Autor, Text, Datum etc, was das Feed eben so hergibt) abgespeichert. Vorher wird geprüft, ob der entsprechende Artikel schon vorhanden ist. Evtl. muss man dann von Hand noch ein bisschen nachbessern, denn manche Artikel erscheinen nicht vollständig im Feed ("weiterlesen"-Link) oder manche Felder bleiben leer. Die abgespeicherten Artikel können noch mit Tags versehen werden. Hervorragend wäre es natürlich, wenn automatisch bestimmte Wörter, die öfter vorkommen und eine bestimmte Länge haben, in einen Index aufgenommen werden. Dann soll es natürlich eine Suche geben, nach Stichwörtern oder Tags. Vielleicht einen Index, der mir die Tags auflistet. Und die Artikel sollen in einem gut lesbaren Format angezeigt werden.
Das Ganze soll entweder auf meinem Localhost laufen oder in einem Programm auf meinem PC, also meine Sammlung soll nicht für die Öffentlichkeit zugänglich sein, sondern lediglich für mich selbst.
Bevor ich nun anfange, mir dazu etwas entsprechendes in PHP zu scripten, wollte ich mal fragen, ob jemand von Euch vielleicht schon so ein Programm oder Script etwas kennt oder ob Ihr mir ein paar Tipps geben könnt, so dass ich das mit einfachen Mitteln aus verschiedenen Tools zusammenbasteln kann.
Danke!
Gruß Markus
Wer kennt es nicht? Man findet liest einen interessanten Artikel im Internet, erinnert sich ewig später wieder daran, kann ihn aber nicht mehr finden. Oder der Artikel ist nicht mehr im Netz. Ich habe über Google Reader viele Blogs abonniert und kennzeichne die besonders lesenswerten Artikel immer mit einem Stern oder Tag, so dass ich sie wiederfinden kann. Jetzt möchte ich diese Artikel gerne aber auch offline archivieren können.
Im Idealfall würde das so aussehen: Durch ein Newsfeed werden Artikel mit einem bestimmten Tag oder Markierte Artikel ausgelesen (stellt der Google Reader zur Verfügung) und in einer Datenbank (Felder: Autor, Text, Datum etc, was das Feed eben so hergibt) abgespeichert. Vorher wird geprüft, ob der entsprechende Artikel schon vorhanden ist. Evtl. muss man dann von Hand noch ein bisschen nachbessern, denn manche Artikel erscheinen nicht vollständig im Feed ("weiterlesen"-Link) oder manche Felder bleiben leer. Die abgespeicherten Artikel können noch mit Tags versehen werden. Hervorragend wäre es natürlich, wenn automatisch bestimmte Wörter, die öfter vorkommen und eine bestimmte Länge haben, in einen Index aufgenommen werden. Dann soll es natürlich eine Suche geben, nach Stichwörtern oder Tags. Vielleicht einen Index, der mir die Tags auflistet. Und die Artikel sollen in einem gut lesbaren Format angezeigt werden.
Das Ganze soll entweder auf meinem Localhost laufen oder in einem Programm auf meinem PC, also meine Sammlung soll nicht für die Öffentlichkeit zugänglich sein, sondern lediglich für mich selbst.
Bevor ich nun anfange, mir dazu etwas entsprechendes in PHP zu scripten, wollte ich mal fragen, ob jemand von Euch vielleicht schon so ein Programm oder Script etwas kennt oder ob Ihr mir ein paar Tipps geben könnt, so dass ich das mit einfachen Mitteln aus verschiedenen Tools zusammenbasteln kann.
Danke!
Gruß Markus
Bitte markiere auch die Kommentare, die zur Lösung des Beitrags beigetragen haben
Content-ID: 179828
Url: https://administrator.de/forum/artikel-aus-dem-internet-archivieren-179828.html
Ausgedruckt am: 21.04.2025 um 16:04 Uhr
3 Kommentare
Neuester Kommentar