Julius: Wiki „Konventionen für Dateinamen“, Überarbeitung notwendig

Beitrag lesen

problematische Seite

Hallo Matthias,

ich habe den Artikel mal auf meinen Zettel genommen. Er ist zu oberflächlich und teilweise vermutlich sogar falsch. Rolf b hat ja in diesem Thread auch schon Verbindliches beigetragen.

Vielen Dank für Deine Bereitschaft. Der Artikel war irgendwann mal Teil einer Serie zur Einführung in HTML, welche Zeichen man verwenden darf und was man sonst noch beachten sollte.

Das spiegelt sich auch darin wieder, dass nicht zwischen Konventionen zu URLs und Dateipfaden unterschieden wird. – Als der Text geschrieben wurde, waren die Seiten in der Regel als Dateien im Document-Root eines Webservers abgelegt und der Webserver „übersetzte“ dann die URL aufs Dateisystem und lieferte dann die passende Datei aus. Heute wird das in der Regel durch ein CMS wie MediaWiki, WordPress oder etwas selbst Geschriebenes erledigt und denen sind Dateinamenskonventionen herzlich egal, sofern sie die Inhalte aus einer Datenbank holen.

Hier wäre heute imho eine Trennung in '''Einführungsabsatz''' mit grundlegenden Sachen wie Namenskonventionen und Dateiendung .html und und in '''weiterführende Kapitel''' mit mehr Informationen für Profis angebracht.

Genau.
So würde ich es machen: Folgendes in Bezug auf Dateinamen thematisieren und dann für weitere Informationen auf Wikipedia verlinken:

  • Alle ASCII-Zeichen ohne < > ? " : | \ / * gehen immer, prinzipiell zwar auch alle Unicode-Zeichen, aber bei einem internationalen Publikum sollte man über einen Verzicht darauf nachdenken, weil nicht alle beispielsweise ein ß auf der Tastatur haben (Schweizer auch nicht!) bzw. das Zeichen überhaupt erkennen können
  • Großschreibung sollte man meiden oder zumindest Groß- und Kleinschreibung konsistent handhaben, was aber letztlich komplizierter ist, als einfach alles klein zu schreiben. Verbessert Interoperabilität zwischen Windows und Unix
  • Unter Windows sind außerdem folgende Dateinamen verboten: CON, PRN, AUX, NUL COM1, COM2, COM3, COM4, COM5, COM6, COM7, COM8, COM9 LPT1, LPT2, LPT3, LPT4, LPT5, LPT6, LPT7, LPT8, LPT9 – eine Datei namens NUL.txt kann also unter Windows nicht existieren, sollte daher auch unter anderen Systemen vermieden werden, um die Interoperabilität zu erhöhen.
  • Dateiendungen sind im Prinzip Schall und Rauch, helfen aber dem Websserver, den passenden Content-Type zu senden. Für HTML also .htm oder .html verwenden.
  • Dateinamen bzw. Pfade habe eine bestimmte Maximallänge, die meist bei 255 Bytes (bei Verwendung von Nicht-ASCII entsprechend weniger Zeichen möglich) oder Zeichen liegt - so lange Dateinamen vergibt man in der Praxis nicht, die Limitierung der Länge sollte aber bekannt sein.
  • Auf die Eigenschaften von URLs eingehen, bzw. auf einen passenden Artikel verlinken und ggf. erklären, dass URLs nicht zwangsläufig vom Weberver in Dateien aufgelöst werden, sondern die Inhalte auch aus einer Datenbank kommen können:
    • internationalisierte Domains (IDN) via Punycode
    • Prozent-Kodierung für reservierte Zeichen, Unicode-Zeichen müssen im Allgemeinen nicht kodiert werden – Systeme, die kein Unicode beherrschen, sind ausgestorben
    • Für optimale Kompatibilität max. 255 Zeichen, längere scheinen aber auch kein Problem zu sein, müsste man noch mal im dazugehörigen RFC nachsehen

In der Kürze liegt die Würze und das Rad neu erfinden müssen wir auch nicht...

Gruß
Julius

--
Verallgemeinerungen sind immer schlecht!