Ich möchte gerne wissen wie oft welches Programm herruntergeladen wurde um einen Überblick zubekommen, welche Rubrik sich lohnt und welche ich rausnehmen kann. Mit welcher Art von Script kann man das erreichen.
Viele Wege führen nach Rom.
Ich nehme mal den "UNIX way" für meinen Apache-Webserver:
awk '{print $7}' access_log sort uniq -c sort -nr
Schön kurz, nicht wahr?
a) awk 'print $7' gibt die 7. Spalte der Log-Datei (im Standardformat, Leerzeichen als Trenner) aus. Da steht die angesprochene URL drin.
b) sort sortiert diese Werte (als Zeichenketten).
c) uniq -c faßt aufeinanderfolgende gleiche Zeilen zusammen und generierte davor (!) eine zusätzliche Spalte mit der Anzahl der zusammengefaßten Werte.
d) Nochmal sort -nr sortiert die Werte (numeric reverse), also die höchste Trefferanzahl nach vorne.
shell is' was Nettes ...