Michael Schröpl: Webalizer, Unterschied Hits, Files, Pages, Visits, Sites

Beitrag lesen

Hi Statistica,

Wer kann mir bei folgenden Webalizer-Daten helfen?

hast Du mal selbst eine Webalizer-Konfiguration gebaut? Dabei solltest Du diese Begriffe automatisch gelernt haben (weil Du einen Teil davon selbst definieren mußt).

Total Hits                           9164

Das sind die HTTP-Requests, die an den Server gestellt wurden.

Total Files                          6760

Nicht alle Requests führen zur Auslieferung von Dateien - "Files" sind diejenigen, die das tun, also genau diejenigen, die mit einem HTTP-Status 200 ausgeliefert wurden.
(Kannst Du selbst vergleichen - der Webalizer liefert auch eine Liste der HTTP-Statuswerte mit den entsprechenden Trefferzahlen.)

Total Pages                          2535

Nicht alles, was angefordert wird, sind Seiten - einiges sind auch Bilder, JavaScript-Code, CSS-Definitionen etc.
Was genau eine "Seite" ist, legst Du in der Webalizer-Konfiguration fest (durch eine Liste von Endungen für Dateinamen).

Total Visits                          462

Das ist ein bißchen "Voodoo".
Der Webalizer versucht, Zugriffe von derselben "Site" (siehe unten) innerhalb eines bestimmten Zeitraums (welcher in seiner Konfiguration einstellbar ist) als zusammenhängende "Sitzung" zu interpretieren.
Das ist insofern wildes Kristallkugelraten, als es weder mit nicht-transparenten Proxies klar kommt (solche, die eine Adreßübersetzung vornehmen, also im Webserverlog ihre eigene Adresse hinterlassen statt derjenigen des Client) noch mit IP-Adressen aus Pools oder mit wechselnden IP-Adressen innerhalb einer Sitzung ... mein Vorschlag: Vergiß diesen Wert einfach.

Total KBytes                        54065

Das sollte selbsterklärend sein. (Wobei das _nicht_ der TCP/IP-Traffic ist, den Deine Site tatsächlich verursacht - zähle mal pro Request ein KB drauf, dann kommt das ziemlich gut hin.)

Total Unique Sites                    433

Hm ... je nachdem, was im Webserver-Log steht (IP-Adresse oder DNS-Name des Client) und ob der Webalizer als "webazolver" läuft oder nicht (er kann selbst reverse DNS lookups machen, wenn man das einschaltet, also IP-Adressen in DNS-Namen übersetzen - das kostet allerdings viel Zeit, sowohl CPU- als auch Realzeit), versucht er hier, die Menge der eindeutigen Clients zu berechnen. (Mit denselben Probleme wie bei den "Sessions" oben - auch diese Zahl ist mit Vorsicht zu genießen.)

Total Unique URLs                     238

Das ist die Zahl der eindeutigen URLs, welche innerhalb Deines Servers angesprochen wurden.
Wobei der Webalizer einerseits den Query-String ignoriert und andererseits bestimmte definierte Übersetzungen vornehmen kann - ich habe bei mir beispielsweise eingestellt, daß "/index.html" als Endung auf "/" abgebildet werden soll, weil das auf meinem Server generell der DirectoryDefault ist und mich ja nicht interessiert, mit welchem von mehreren möglichen Namen dieselbe Seite angesprochen wurde.

Total Unique Referrers                145

Dasselbe für die Menge derjenigen URLs, welche innerhalb des HTTP-Headers im Feld "Referer:" (sic!) mitgesendet wurden, also die "Vorgängerseiten" des jeweiligen Zugriffs.
Durch die Referrer-Angaben kannst Du sehen, woher Deine Besucher kommen - von Suchmaschinen (dafür hat der Webalizer dann auch noch eine separate Suchbegriffs-Analyse-Funktion) bzw. von statischen Seiten (so erfährst Du, wer Links auf Deine Seiten gesetzt hat).

Was ist z.B. der Unterschied zwischen Hits und Files

Siehe oben (Files sind echt ausgelieferte Daten, Hits können auch Validierungen des Cache-Inhalts eines Browsers sein).

oder Visits und Unique Sites?

Visits sind "Besuche", Unique Sites sind "Besucher".

Die Website besteht aus einem Frameset mit mehreren Frames.

Das ist im obigen Kontext irrelevant.

Viele Grüße
      Michael

P.S.: Im Gegensatz zu anderen Beiträgen in diesem Thread finde ich den Webalizer ziemlich gut - man sollte seine Konfiguration sehr genau gelesen haben, um zu verstehen, was man damit alles machen kann. (Beispielsweise kann man über URL-Gruppierung sehr schön den Traffic thematischer Teilbereiche einer Domain zusammengefaßt analysieren.)