H. aus G.: link parsen

Beitrag lesen

Hallo Community,

ich bin gerdade dabei ein Windowsprogramm im Stil von WebDown zu programmieren. Ich hätte da noch ein paar Fragen zum auswerten von Links die im html Code eingebettet sind.

Vorab eine kurze Erklärung wie weit ich schon bin mit der Auswertung, hier ein Beispiellink:

http://user:password@www.homepage.de:80/verz1/../verz%202/index.html#headline1

Sähe der Link so aus, ist meine Auswertung bis zum "#headline1" fertig.

Meine Frage hier: Welche Zeichen hinter "index.html" kann ich erwarten? Bekannt ist mir "#" für eine Textmarke und "?" um eine Parameterübergabe an, z.B. ein cgi-Script einzuleiten. Welche Zeichen habe ich nun noch nicht berücksichtigt und für was sind sie dann gut?

Gilt für die Parameterübergabe die gleiche Konvention bezüglich nicht erlaubter Zeichen wie bei der URL? Also "LEERZEICHEN" wird zu "%20"?

Ich hoffe, hier kann jemand helfen, danke schon mal vorab.

Gruß Hans