Hi, hallo
noch nie in _live_ gesehen, was du haben möchtest ..
aber wie wäre es mit selbst programmieren?
- Durchsuchung von HTML-Seiten und PDF-Dokumenten
HTML durchsuchen, kein großes Problem,
PDF Dokumente, ohne entsprechende serverseitige Komponente nicht möglich, PDF ist ein proprietäres Format von ADOBE ... es gibt aber 3rd Party Komponenten, aber für Geld
- Individuelle Ausgabeseite für die Ergebnisse
was ist "individudel" ?
- keine Werbeeinblendungen
ich dachte es geht um eine "Freitext"-Suche ... oder suchst du einen Dienst auf einem fremden Server?
- serverseitig
aha, wie sollte es clientseitig funktionieren? da müßte man ja vorher alle PDF downloaden und auch wieder den Acrobat Reader bzw. vergleichbare Komponente haben
- kostenlos oder möglichst günstig
wie gesagt, noch nie in freier Wildbahn gefunden, wenn'ses doch gibt, dann steckt schon einiger Entwicklungsaufwand drin -> kostet sicher nicht minder Geld
Das ganze soll dann so aussehen, daß ich eine HTML-Seite
habe, auf der in mehreren Zeilen jeweils mit gleichen
Angaben Produkte beschrieben werden. Am Ende jeder
Zeile gibt es den Punkt "Details", der einen Link zu
einem PDF-Dokument bietet.
HTML ist ein Graus. Inhalt und Layout sind dort miteinander vermischt ... versuch doch mal per Freitextsuche in irgendeiner beliebigen HTML Resource ein bestimmtes Wort zu finden und dann festzustellen, was steht in der selben Zeile wie das Wort? Und gehört das, was layouttechnisch in der selben Zeile steht auch sinn-mäßig zu deinem gefundenen Wort ... und dann versuch das mal zu automatisieren.
HTML hat keine Datenstruktur, ist dadurch auch nicht vernünftig weiterverarbeitbar.
PDF hat noch den Nachteil, daß du da nicht einfach fröhlich in den Quelltext schauen kannst, weil du da nur Hieroglyphen siehst -> proprietäres Format.
Tschau, tschüß,
Frank