Hallo,
mein Webcrawler ist auf eine Seite gestossen, bei der er Probleme hatte, die URLs zu filtern.
Auf dieser Website ist als base "http://power-radach.de/page" angegeben, die URLs selbst sind im Dokument z.b. so ausgezeichnet:
href="/page/leistungen.html"
Nun frage ich mich, ist das korrekt? Müsste dann nicht nicht die absolute URL eigentlich "http://power-radach.de/page/page/leistungen.html" heissen?
Bitte keine sonstigen Kommentare zu der Seite, schon alleine aus Respekt vor den Leuten. Ich habe damit auch sonst nichts zu tun. Mir ist das nur aufgefallen.