Christian Kruse: / Menschelei: Automatische Doppelpostingerkennung / Markierung

Beitrag lesen

Hallo Jakob,

Meinst du wirklich, dass der Vergleich soviel Ressourcen
fressen würde?

Ja. Ein solcher Vergleich muss ja auf Aehnlichkeit beruhen,
nicht auf exakter Gleichheit. Derartige Algorithmen sind
nicht einfach. In der aktuellen c't steht etwas darueber.

Mehr als 30 Threads enthält die Hauptdatei doch sowieso
nie...

Oder irre ich mich?

Ja:

MainFileMaxPostings  "2000"
 MainFileMaxThreads   "250"

Du siehst: maximal 250 Threads, maximal 2000 Postings. Das
haeufigste Kriterium, das den Archiver anwirft, ist im Moment
MainFileMaxPostings. Es muessten also im worst case

2000 * (12288 + 60 + 64 + 60 + 26 + 10 + 18) = 25052000

Byte in den Vergleich mit einbezogen werden. Was das kostet,
kannst du dir vorstellen?

Gruesse,
 CK

--
http://cforum.teamone.de/
http://wishlist.tetekum.de/
If God had meant for us to be in the Army, we would have been born with green, baggy skin.