Pascal Reckmann: Tools zur Analyse von Hypertextstrukuren?

Beitrag lesen

In der Beispielgrafik sind aber nur 32 Seiten aufgezeichnet (habs gerade mal durchgezählt <s>). Selfhtml 7.0 hat aber 740 HTML-Dateien.

Ja, wenig ist das nicht...

Deine Testgrafik hat nur 17 zusätzliche Links. Macht pro Seite 0,53 Links, die aus der Verzeichnisstruktur ausbrechen. Selfhtml 7.0 hat keine Verzeichnisstruktur, alles ist in einem Verzeichnis, und jede Datei hat mindestens mal einen Verweis, der nicht innerhalb der gedachten Baumstruktur dieser Dokumentation liegt, sondern quer.

Du erhälst also einen Baum, der schon in der ersten Ebene sehr in die Breite geht (Dateinamen ta*.htm bis tq*.htm - sind 18 Bereiche), und anschließend sehr in die Tiefe (bis Ebene 7 - tecbbdaa.htm).

Ja, wahrscheinlich ist es wirklich zuviel. Alleine aus der Befehlsreferenz heraus gibt es über knapp 1000 Links zu lokalen Ankern.

Die Dateinamen repräsentieren immerhin eine streng hierarchische Ordnung, 2 Buchstaben ist die jeweilige Übersicht zu den Hauptkapiteln, 3 Buchstaben zu den Unterkapiteln, 4 Buchstaben sind detaillierte Beschreibungen, 5 Buchstaben sind sehr interessant, Anzeigebeispiele, die nur über einen Backlink (So sieht's aus) verfügen und auch nur über die "So wird's gemacht"-Links zu erreichen sind.

Das hilft dir bei deiner Suche nach einem Programm zwar nicht weiter, aber wenn du einigermaßen fit bist in Perl oder PHP, dann solltest du es zumindest hinkriegen, die Seitenstatistiken selber zu generieren. :)

Tja, bin ich leider nicht. Interessiert bin ich zwar sehr daran, und ich habe auch schon mal reingeschaut, aber dafür reicht die Zeit jetzt leider nicht, so was kommt erst, wenn die Arbeit fertig ist ;-)

Gruß
Pascal