Frank aus Ulm: Eigene Freitextsuche - zu kompliziert?

Beitrag lesen

Hi, hallo

noch nie in _live_ gesehen, was du haben möchtest ..

aber wie wäre es mit selbst programmieren?

  • Durchsuchung von HTML-Seiten und PDF-Dokumenten

HTML durchsuchen, kein großes Problem,
PDF Dokumente, ohne entsprechende serverseitige Komponente nicht möglich, PDF ist ein proprietäres Format von ADOBE ... es gibt aber 3rd Party Komponenten, aber für Geld

  • Individuelle Ausgabeseite für die Ergebnisse

was ist "individudel" ?

  • keine Werbeeinblendungen

ich dachte es geht um eine "Freitext"-Suche ... oder suchst du einen Dienst auf einem fremden Server?

  • serverseitig

aha, wie sollte es clientseitig funktionieren? da müßte man ja vorher alle PDF downloaden und auch wieder den Acrobat Reader bzw. vergleichbare Komponente haben

  • kostenlos oder möglichst günstig

wie gesagt, noch nie in freier Wildbahn gefunden, wenn'ses doch gibt, dann steckt schon einiger Entwicklungsaufwand drin -> kostet sicher nicht minder Geld

Das ganze soll dann so aussehen, daß ich eine HTML-Seite
habe, auf der in mehreren Zeilen jeweils mit gleichen
Angaben Produkte beschrieben werden. Am Ende jeder
Zeile gibt es den Punkt "Details", der einen Link zu
einem PDF-Dokument bietet.

HTML ist ein Graus. Inhalt und Layout sind dort miteinander vermischt ... versuch doch mal per Freitextsuche in irgendeiner beliebigen HTML Resource ein bestimmtes Wort zu finden und dann festzustellen, was steht in der selben Zeile wie das Wort? Und gehört das, was layouttechnisch in der selben Zeile steht auch sinn-mäßig zu deinem gefundenen Wort ... und dann versuch das mal zu automatisieren.

HTML hat keine Datenstruktur, ist dadurch auch nicht vernünftig weiterverarbeitbar.

PDF hat noch den Nachteil, daß du da nicht einfach fröhlich in den Quelltext schauen kannst, weil du da nur Hieroglyphen siehst -> proprietäres Format.

Tschau, tschüß,
Frank