closed
Goto Top

Relativen und absoluten Link identifizieren und modifizieren

Hallo,

ich vermute, dass mein Problem kein aus der Welt gegriffenes Problem ist, allerdings konnte ich bislang keine (zufriedenstellende) lösung finden:

Ich parse derzeit Webseiten und erhalte Links aus beispielsweise dem a tag von HTML. Die Frage ist nun, wie identifiziere ich ob es sich bei dem Link um einen relativen oder um einen absoluten Link handelt?

In weiterer Folge müssen relative Pfade zu absoluten Pfaden umgewandelt werden. Aufgrund der Tatsache, dass ich nicht genau weiß, wie viele Ordner (und welche) an den Anfang des relativen Pfades gestellt werden müssen, halte ich dieses Problem für wenig trivial.

Ich hoffe, dass ihr eine Lösung parat habt und mir in dieser Beziehung helfend zur Seite stehen könntet.

Vielen Dank

Content-Key: 138389

Url: https://administrator.de/contentid/138389

Printed on: April 19, 2024 at 17:04 o'clock

Member: Closed
Closed Mar 16, 2010 at 15:14:19 (UTC)
Goto Top
Problem konnte schon gelöst werden. Dieser Parser http://htmlparser.sourceforge.net/ gibt mir immer die absoluten Links retour.

Besten Dank trotzdem