Guido: Webseiten speichern! Problem

Hallo Leute!

Ich hab ein nun nicht mehr ganz so großes Problem, da mir schon viele hier weitergeholfen haben. Jetzt möchte ich nen erarbeiteten Lösungsweg abchecken lassen.

Ne kurze Erklärung:  Ich schreib grad in meiner Diplomarbeit eine Anforderungsspezifikation für eine Client-Software die als Teil eines Web-Client Internetseiten in einem Dokumenten-Management-System ablegen soll.
Wenn eine Internetseite gespeichert werden soll, soll der Anwender über ein Browser Plug-In ein weiteres Fenster mit der Startseite des Web-Client öffnen, über die sich der Anwender am DMS anmeldet. Diese Umsetzung ist soweit i.O.
Auch wie ich im System die Webseitenteile zu einem Dokument zusammensetze ist schon gelöst.
Anforderung: Die Daten dürfen nicht vom Web-Server abgerufen werden sondern müssen direkt vom Browser geholt werden, damit zwischen Aufruf und Speicherung der Seite keine Änderung der Seite gespeichert wird.

Nun mein Lösungsansatz:
Durch ein Plug-In im Browser wird aus dem Browserfenster mit der zu speichernden Seite ein zweites Browserfenster mit der Log-In Seite des DMS gestartet.
Beide Browserfenster haben eine im System gespeicherte Session-ID. Die Daten der in den Browserfenstern angezeigten Webseiten werden im Cache vorgehalten.
Nun gehe ich her und speicher entweder über das Plug-In die Daten der des ersten Browserfensters aus dem Cache auf der Festplatte des Rechners. (Finden der Daten über Session-ID)
Oder ich ziehe sie direkt über den Web-Client des DMS aus dem Cache ins System wo sie über einen Parser (Vorschlag: jtidy) analysiert, ausgewertet und direkt auf dem Server gespeichert werden können.

Mein größtes Problem ist, dass dieser Lösungsansatz einfach so simpel ist, dass ich kaum glauben kann, dass es so einfach sein soll.
Vielleicht könnt ihr euch mal darüber auslassen ob das so gehen kann und warum oder warum nicht.

Vielen lieben Dank und eine schönen Tag noch.

Guy

  1. Hi,

    Mein größtes Problem ist, dass dieser Lösungsansatz
    einfach so simpel ist, dass ich kaum glauben kann,
    dass es so einfach sein soll.

    ich finde Deinen Ansatz keineswegs 'simpel'.

    Das geht schon mal damit los, daß Du überhaupt ein
    plugin brauchst, d. h. Dein CMS ist abhängig von einer
    bestimmten Plattform des verwendeten Clients.

    Dann muß dieses plugin auch noch Schreibrecht auf die
    Festplatte des Benutzers haben. Das mag von den Rand-
    bedingungen Deiner Aufgabenstellung abgedeckt sein -
    aber ein plugin zu installieren, welches den Inhalt
    meiner Festplatte verändern kann, würde ich mir drei-
    mal überlegen (und mit fetten Sicherheitsprüfungen
    versehen). So etwas wäre eine prima Angriffsstelle,
    um ein gesamtes Netzverk virös zu verseuchen.

    Vielleicht könnt ihr euch mal darüber auslassen ob
    das so gehen kann und warum oder warum nicht.

    Du läßt praktisch die gesamte Verarbeitungslast den
    Client erledigen, statt eine typische Client-Server-
    Anwendung zu bauen. Das bedeutet, daß Deine Clients
    sehr viel mehr können (und erlauben) müssen, als das
    bei anderen CMS-Systemen der Fall ist. Das macht die
    Implementierung Deines CMS natürlich einfacher - es
    schränkt die Verwendbarkeit des Systems andererseits
    erheblich ein.
    Für eine Auftragsarbeit (konkretes Intranet-Projekt)
    mag das akzeptabel sein. Aber spätestens wenn der
    Betreiber dieses Systems _irgendwas_ an seiner Netz-
    Architektur ändern will, wird er die heftigen Abhän-
    gigkeiten zu spüren bekommen, die Du ihm aufdrückst.

    Viele Grüße
          Michael