Hi,
Wobei nach meiner Überzeugung ein Stringvergleich trotzdem schneller ist als der einfachste Automat.
Das wage ich aber schwer zu bezweifeln ;-)
(Der einfachste Automat ist der, der nix macht. So rein aus dem Bauch raus würde ich doch annehmen, das der schneller wäre)
Die Website (Spam-Schutz) hört sich zum Teil an wie ein angepasster Soundex:
Hat mit Soundex nichts zu tun, funktioniert anders. Aber das Prinzip des gewollt kollisionsreichen Hashings ist das gleiche, klar.
Habe gerade mit Levenshtein probiert. Und die nüchterne Erkenntnis ist, daß Levenshtein die Worte komplett aus dem Kontext herausreißt. Damit erkennt Levenshtein kaum noch hinzugefügte oder gelöschte Wörter.
Wenn Du den auf die Buchstaben anwendest ist das nur natürlich. Du mußt den schon auf das Alphabet anpassen, das Du benutzen möchtest.
Aber alleine schon wegen der Lahmheit würde ich den nur auf sehr kurze Stücke Text benutzen.
Genau deswegen finde ich die 'Ankermethode' so schön. 'Ein' und 'Kein' werden als inhaltliche Änderung sofort erkannt.
Alle anderen Methoden würden das auch als Änderung erkennen.
In diesem Zusammenhang, gerade weil du Knast erwähnst, würde mich interessieren, wie sich die Wikipedia gegen Beleidigungen, Falschmeldungen und Unterstellungen wehrt.
In dem sie die umgehend korrigieren. Alle Artikel unterliegen ständiger Beobachtung.
Oder reicht der einfache Hinweis, daß die Webseite ein Plattform zur öffentlichen Meinung darstellt, und deswegen für die Inhalte nicht verantwortlich ist ?
Nein, von der Verantwortung kannst Du Dich auch als Herausgeber nicht befreien. Du mußt regelmäßig nachschauen, damit Du "zeitnah" reagieren kannst.
Die Definition von "zeitnah" schwankt etwas, aber mit "einmal täglich" sollte es bedient sein.
Vorsicht wenn Du von Dritten informiert wirst, dann mußt Du deutlich schneller reagieren.
Der Filter soll ja in erster Linie die mutwillige Zerstörung des Textes feststellen - dazu zählt neben dem Löschen auch ein komplettes Ersetzen durch einen anderen Text.
Das kann kein Filter, das kann nur ein Mensch.
Wenn es tatsächlich Befürchtungen gibt, das erheblicher(!) Mißbrauch betrieben werden könnte muß eben _jeder_ Artikel geprüft werden. Wie das bei Wikipedia fast schon der Fall ist.
Wenn ich mir bei Wiki das System des Versionstracking anschaue, dann nimmt man zwei Versionen und bekommt die Unterschiede ausgeschmissen.
Und das noch nicht mal so besonders brauchbar, finde ich.
Ja, das ist ziemlich besch...eiden, stimmt. Aber das kannst Du ja ändern und tust das auch bereits.
Lediglich für eine Website kann man die nicht einbinden...
Klar kann man die einbinden, oder was meinst Du jetzt?
Daher will ich kein rein administratives, sondern eher ein redaktionelles Werkzeug haben, das jeder nutzen kann.
Ich glaube man sollte das einmal etwas aufdröseln, das wird mir hier etwas zu durcheinander. Ist aber kein Vorwurf, ich bin ja auch nicht besser ;-)
- Du möchtest also ein Wiki basteln
- Du möchtest eine Warnung bekommen, wenn die Qualität der
Änderung der Artikel ein gewisses Maß überschreitet. - Du möchtest ein bequemes Browser-Frontend für den Benutzer,
das die Unterschiede zwischen den Versionen optisch
aufzeigt.
Um ein Wiki überhaupt basteln zu können braucht es ein aktives Backend: irgendeine Programmiersprache und die Möglichkeit etwas zu speichern. Da kannst Du zur Not etwas Fertiges nehmen, es ist aber mehr als einfach, das hast Du schneller selber gemacht.
Wenn Du besagte Warnung ausstoßen möchtest, mußt Du die Qualität messen können. Das gelingt aber nicht, das kann kein Computer, zumindest jetzt noch nicht. Es müssen also Menschen machen.
Für das Browserfrontend würde ich das nehmen, das Du jetzt schon hast, das ist i.O. und wenn die letzten Gimmiks eingebaut sind auch schon deutlich mehr als nur i.O.
Bleibt also nur noch der Alarm übrig. Da wolltest Du die vom Frontend erzeugten Diffs benutzen, das geht natürlich nicht, da sie vom Clienten erzeugt wurden. Entweder portierst Du den Algorithmus auf die Sprache des Wikiservers, was dann aber die Flexibilität der Clientimplementation brach legen würde oder Du siehst es ein, das es sich nunmal um ein nicht-technisches Problem handelt. Wenn die Mitglieder Deiner Community (fleißig) mitarbeiten brauchst Du Dich normalerweise um rein gar nichts mehr zu kümmern.
Meine Meinung ist also, das Du fertig bist mit dem technischem Teil (zumindest mit der Grundidee, 'was zu verbessern findet sich ja eh immer ;-), kümmere Dich um den Aufbau der Community, das ist schwierig genug. Kleiner Tip dazu von mir noch auf den Weg: sei pragmatisch. Laß Dich nicht von anderer Leite Aufgeregtheit anstecken, es ist seltenst etwas dahinter.
so short
Christoph Zurnieden