wombat: Statistik über Arten von Webseiten

Hallo,

ich bin auf der Suche nach einer Statistik über die Arten oder Strukturen von Webseiten. Mit Arten meine ich z.B. "kommerziell", "wissenschaftlich", "privat", mit Struktur meine ich "Foren", "Shops", "normales HTML".

Mir schwebt etwas vor wie: "20% der Webseiten sind privater Natur, 30% sind kommerziell und 40% sind Werbung / Spam / etc" (wobei die Zahlen willkürlich aus der Luft gegriffen sind.

Hat jemand eine Idee, wo man eine solche Statistik (oder etwas ähnliches) erhalten kann?

Mfg und vielen Dank im Voraus

  1. Kurze Antwort: Selbermachen.

    Lange Antwort:

    Ein sehr praktisches Hilfsmittel ist dabei die Google-Suche. Kommerzielle Seiten müssen Steuer-Nummern im Impressum aufführen, also kannst Du dieses Kriterium (in unterschiedlichen Schreibweisen) verwenden, um diese zu filtern.

    Wissenschaftliche Arbeiten bedürfen immer einer Quellenangabe (an dieser Stelle müssen Mineralwasserhersteller, artesische Brunnen usw. selbstredend wieder herausgefiltert werden).

    Shops haben immer einen Warenkorb oder Kassenlink, häufig jedoch beides. Auch hier muss man natürlich die falschen Treffer aussortieren.

    Nach diesem bzw. einem ähnlichen Schema kannst Du Kriterien finden und die Anzahl der Suchergebnisse für Deine Statistik verwenden.

    Gruß, LX

    --
    RFC 1925, Satz 8: Es ist komplizierter als man denkt.
    1. Hallo,

      Kurze Antwort: Selbermachen.

      ;-)

      Ein sehr praktisches Hilfsmittel ist dabei die Google-Suche. Kommerzielle Seiten müssen Steuer-Nummern im Impressum aufführen

      Das ist nicht ganz richtig. Die Steuernummer (also die, die man dem Finanzamt gegenüber immer angeben muss), ist im Impressum weder gefordert noch sinnvoll. Mein Steuerberater sagt sogar, man solle diese Steuernummer nie angeben, wenn sie nicht zwingend gefordert ist (z.B. auf Rechnungen), weil die Gefahr des Missbrauchs besteht.
      Was allerdings ins Impressum muss, ist die Umsatzsteuer-Identnummer (UStID), wenn man eine hat. Muss man aber nicht haben.

      Wissenschaftliche Arbeiten bedürfen immer einer Quellenangabe (an dieser Stelle müssen Mineralwasserhersteller, artesische Brunnen usw. selbstredend wieder herausgefiltert werden).

      Auf diese Interpretation des Wortes "Quelle" wäre ich jetzt gar nicht gekommen. Betriebsblindheit ...

      Nach diesem bzw. einem ähnlichen Schema kannst Du Kriterien finden und die Anzahl der Suchergebnisse für Deine Statistik verwenden.

      Und davon ausgehen, dass automatisch erstellte Statistiken sowieso immer mit einer gewissen Fehlerquote behaftet sind, die man akzeptieren muss.

      So long,
       Martin

      --
      Keine Sorge, wir finden für jede Lösung ein Problem.
      1. Hallo,

        vielen Dank für die Vorschläge. Ich hatte gehofft, dass so eine Statistik schon existiert und ihr auch eine gewissen Menge an Daten zugrunde liegt.

        mfg