Hi,
Meint der doch glatt, ich wär' Grundschullehrer!
Seh' ich etwa so aus?Ne eher wie ein Körperpfleger! ;)
Meines Wissens gibt es von mir kein Photo im Netz, wer also hat Dir eines geschickt?
"A Bloom filter with 1% error and an optimal value of m, on the other hand, requires only about 9.6 bits per element" http://en.wikipedia.org/wiki/Bloom_filter#Space_and_time_advantages
Ich sag mal mit durchschnittlich 9.6 Bits kodiere ich die ganze Postingliste mit 0% Fehler. (diesmal bitte keine Bierkiste :)
1% ist aber recht viel, ein Promille ist da schon realistischer.
nee, Eigentoor, es ist sogar schlimmer, sofern dein Bloomfiltercaculator was taugt:
?
Achos, nein, ich meinte den Bedarf. 1% Fehlerquote wäre für den Cachingzweck einfach zuviel. Da es hier diskret zugeht, wären bei 400 Elementen und 1% Fehlerquote im Schnitt vier Stück falsch, bei 0,1% weniger als eines.
Aber ich befürchte ein Mathematiker läßt sich von meinen Milchmädchenrechnungen nicht verführen ;-)
Kostet aber natürlich auch nicht viel mehr pro Element, das ist wohl wahr. (0% ist sehr schwierig, da müßten nicht nur alle Hashfunktion minimal perfekt sein, sondern auch alle Permutationen.)
für 0% kann man keine Bloomfilter nehmen weil die grundsätzlich verlustbehaftet sind, selbst wenns im Nanobereich läge.
Ja, es ist eine Definitionsfrage, ob der Bloomfilter bei Fehlerfreiheit gar kein Bloomfilter mehr ist.
Aber wie gesagt: 0% gibt's hier nur mit minimal perfektem Hash. Und dann kannst Du Dir die Mühe mit dem Bloomfilter eh sparen und gleich eine normale Hastabelle nehmen und als fertiges Javascript-Array mitgeben.
Mmh ...
Auch keine schlechte Idee.Das war ja auch jetzt meine Idee ... naja macht nix.
Deswegen habe ich sie auch im Laufe meines "Nachdenkens" verworfen.
Nein, natürlich nicht deswegen ;-)
Steck deinen 400er-Cache in nen normalen JS-Hash ohne propietäre Hashfkt, das reicht doch dicke!
Er wäre aber immer noch um ein vielfaches "dicker" udn heutzutage liegen die höchsten Kosten nunmal bei der Übertragung. Bei SelfHTML umso mehr, als das die gesponort werden, wenn es also zuviel wird ist es möglich, das dem Sponsor es auch zuviel wird und er sich für die Zusammenarbeit bedankt und das Sponsoring einstellt.
Bei der Kostenminimierung den Transfer auszuschließen wäre demnach nicht gar so günstig.
Aber das ist hier auch nicht so schlimm, denn auf Grund der Statik des Arrays würde dieses Javascript gecached werden können.
und zippen kann wg der Entropie auch nix helfen.
Nein, tut mir leid, _so_ leicht führst Du mich nicht auf's Glatteis, ich hab' schon bemerkt, das Du hier die Informationsbits _netto_ zugrunde gelegt hast ;-)
hmm, ne Brutto,
400 (einträge) *10 Bytes /5-10 (gzip)=800-400 Bytes
Die Informationsbits sind die 9,6 Bit, das ist ein Nettobetrag, nach Abzug aller Redundanzen. Keine Redundanzen -> keine Kompression.
Das Gebiet "Suche" ist derart gut bekannt, das es für weiter signifikante Fortschritte der hellsten Köpfe bedarf. Deren Auswahl unter den Bewerbern soll _extrem_ scharf sein, einige berichteten von über 20 Interviews und wurden dann doch nicht genommen. Einzige Alternative ist also massiver Hardwareeinsatz.
ui dann will ich hier öffentlich nicht mehr Tricks verraten ;)
Ich würde das immer öffentlich machen, deswegen könnte ich, abgesehen von meiner Unfähigkeit, nie da anfangen.
Im ernst die Leute dürften dann in dem Bereich promoviert haben.
Nein, die wollen Leute, die es wirklich können >;->
BTW: Würde google anbieten suchergebnisse nach Anchors zu gliedern, bräuchten wir hier keine eigene Suchmaschine...
Wenn man denen das bezahlt machen die das sicherlich gerne.
Phh, wer will den Usern verbieten google zu nutzen?
Niemand, aber Google bietet ja keine Gliederung nach Anchors na, wie Du bereits sagtest (auch wenn ich ehrlicherweise keine Ahnung habe, was Du darunter genau verstehst).
Bei Ausfall der Archivsuche mußt und kannst Du auch Google gut benutzen. Wenn ich etwas im Archiv suche tue ich das auch stest als erstes, damit belaste ich den Selfserver schonmal ein Stückchen weniger; nicht nur bei der Rechenarbeit sondern vor allem auch beim Transfer.
PS: Wird einsam hier unten,
Nein, das sieht nur so aus.
meinst du es liest noch jmd mit oder sollen wir leiber aufs mailen ausweichen?
Normalerweise ist hier alleine schon die Frage verpönt, aber da wir uns so langsam beginnen im Kreise zu drehen, alles recht theoretisch wird und es dadurch zu Darstellungsproblemen kommt (nunmal ehrlich: längere und/oder komplexere Formeln in ASCII sind doch eine Quälerei, oder?) und sich bis jetzt keiner beschwert hat ...
so short
Christoph Zurnieden