Hallo!
Naja, das ganez ist ziemlich langsam. Ist eigentlich ein primary-index schneller als ein normaler index? Jedenfalls braucht die Abfrage der Tabelle ca. 0,3 Sekunden, was viel zu langsam ist. In der Tabelle stehen mnoch alle Wärter vielfach drin, halt ime nur mit vielen Zeichen drucm herum, halt "", (), '' $... ich habe keine Ahnung wie ich das sinnvol trennen kann, auch am von Grund auf weiß ich es nicht, da ich ja jeir auch nach bestimten funktionen gesucht wird, oder ich mache es so das ich mir eienn Standard überlege, wie ich alle Funkrionen dann auch beim Suchstring verändere, wenn ich das in meiner Tabelle und beim Suchen gleich mache dürfte es funktionieren, nur unterscheiden sich die Sprachen leider so stark. Bei Javacript oder PHP für sich wäre es kein Problem, aber die Kombination aus allen Sprachen ist tötlich! Was könnte ich den m,al alles für Sonderzeichen entfernen? Halt einfach alle Leerzeichen am Anfang und am Ende, , vielleicht noch " und ', aber das wars dann auch schon wieder. Ich muß mit der Suche hier definitiv _unter_ 1/10 Sekunde, sonst ist mir das zu teuer. Das doofe ist, wenn ich mich jetzt ein paar Wochen hinsetzen würde und alles sinnlose manuell rauschmeißen würde blieben noch ein paar 10.000 kurze Datensätze übrig, und das ganze wäre nicht viel langsamer als 1/100 Sekunde, aber wie komme ich denn automatisirt dahin?
Udn noch ein Problem, ich wollte einen primärschlüssel definieren, aber da saget er mir es gäbe duplikate vorhanden:
Error
SQL-query :
ALTER TABLE words2
DROP PRIMARY KEY, ADD PRIMARY KEY(word
)
MySQL said:
Duplicate entry '"'Layer2','','hide','Layer3','','hide','Layer4',' for key 1
Aber das kann nicht sein, ein SELECT DISTINST word FROM table ergibt genau gleich viele Datensätze! Außerdem habe ich dei Tabelle über ein "CREATE TABLE... SELECT word, SUM(count) FROM tabelle GRPUP BY word" erstellt, wie sollen da noch Duplikate drin sein, gerade das habe ich doch verhindert, oder?
ich habe ja den Link zur Datendatei gepostet(im Mozilla wird die sogar im Browser "als Stream" geöffnet, kann man ja sofort abbrechen), dummerweise nach Anzahl sortiert, denn oben steht natürlich nicht so viel Mist, aber weiter unten wird es immer schlimmer, vor allem so Code-Fragmenteda weiß ich nicht ob ich die noch aufteilen soll oder was ich damit machen soll, keine Ahnung!
Viele Grüße
Andreas