shneider: base

Beitrag lesen

Hallo,

mein Webcrawler ist auf eine Seite gestossen, bei der er Probleme hatte, die URLs zu filtern.

Auf dieser Website ist als base "http://power-radach.de/page" angegeben, die URLs selbst sind im Dokument z.b. so ausgezeichnet:

href="/page/leistungen.html"

Nun frage ich mich, ist das korrekt? Müsste dann nicht nicht die absolute URL eigentlich "http://power-radach.de/page/page/leistungen.html" heissen?

Bitte keine sonstigen Kommentare zu der Seite, schon alleine aus Respekt vor den Leuten. Ich habe damit auch sonst nichts zu tun. Mir ist das nur aufgefallen.