nugsoc: HTML überarbeiten

Hallo Forum,

ich biete meinen Vereinsmitglieder die Möglichkeit, über ein Formular Einträge in eine Datenbank vorzunehmen. Diese Einträge werden dann nachher als "News" angezeigt.
Da in den News auch Tabellen etc vorkommen, erstellen viele Mitglieder einfach das ganze in Word, und exportieren das dann nach HTML. Diesen HTML-Code fügen die in das Formular ein.
Dass Word einen total verkorksten HTML-Code erstellt, brauch ich ja nicht zu erwähnen.
Jedenfalls möchte ich diesen blöden Code natürlich nicht auf meiner Seite haben. Also möchte ich beim Eintragen in die Datenbank den misshandelten HTML-Code überarbeiten. Als Sprache benutze ich PHP.

Gibt es so einen "Überarbeiter" schon als vorgefertigten Code? Ich würde das ja auch selbst programmieren, nur fehlt dazu die Zeit (und auch die Kenntnis, die ich mir natürlich aneignen könnte).
Wenn es sowas nicht vorgefertigt gibt, könnt ihr mir dann Tipps und Wege geben, wie sowas zu programmieren ist?

Vielen Dank
nugsoc

  1. Hallo,

    fertige Editoren wie z.Bsp. http://tinymce.moxiecode.com/ haben entsprechende Funktionen für so etwas.

    Gruß Rainer

  2. Hi nugsoc!

    Wenn es sowas nicht vorgefertigt gibt, könnt ihr mir dann Tipps und Wege geben, wie sowas zu programmieren ist?

    Google mal nach "Word HTML Cleaner". =)

    Und dann schau dir Tidy an.

    MfG H☼psel

    --
    "It's amazing I won. I was running against peace, prosperity, and incumbency."
    George W. Bush speaking to Swedish Prime Minister unaware a live television camera was still rolling, June 14, 2001
    Selfcode: ie:% fl:( br:> va:) ls:& fo:) rl:? n4:& ss:| de:] js:| ch:? sh:( mo:) zu:)
  3. Das kommt darauf an, inwiefern Du teile (z.B. Breitenangaben übernehmen willst). Eine einfache Methode die mir spontan durch den Kopf geht wäre:

    preg_replace('/<table.*?>/', '<table was="immer Du willst" >, $eingabe);

    Das kann man mit allen Elementen machen.