Frank aus Ulm: Eigene Freitextsuche - zu kompliziert?

Beitrag lesen

Hi, hallo

Kennst du Anbieter. Google durchsucht auf jeden Fall auch
PDF-Dokumente. Aber die bieten leider keinen Suchmechanismus
für die eigene Webseite an...

da wäre ich mir nicht 100%ig sicher, ob die wirklich PDF-Dokumente durchsuchen, oder ob die nicht eine Capture/OCR dran haben, was den Text erkennt... an Google hab ich nicht mitgewirkt ... :-(  Interessieren täts mich aber auch :-)

und wie ich schon sagte, ich hab sowas in freier Natur noch nie gefunden und ich bin schon ne ganze Weile im Internet

schau dich dochmal auf www.adobe.de um, von denen stammt ja das PDF Format, wenn die einen Mechanismus/eine Komponente bieten, dann aber sicher nicht für wenig geld.

aha, wie sollte es clientseitig funktionieren? da müßte man ja
»»vorher alle PDF downloaden und auch wieder den Acrobat Reader bzw.
»»vergleichbare Komponente haben
Ja? Aber eine Suche mit JavaScript wäre doch clientseitig.
Egal, das möchte ich ja sowieso nicht.

muß nicht unbedingt JS sein, auch ActiveX Dlls oder Java-Applets

Naja, immerhin sehen die Zeilen immer nahezu gleich aus.

aber, was im Browser auf gleicher Höhe steht kann trotzdem herkunftsmäßig vom A** der Welt stammen und layoutmäßig ganz anders positioniert werden. HTML ist einfach nur eine Auszeichnungssprache, die interessiert es nicht, ob zwei sachen die in benachbarten Tabellenzeilen/zellen stehen inhaltlich zusammengehören. HTML kennt nicht den Unterschied zwischen Inhalten, nur zwischen zu interpretierenden Tags und auszugebenden Literalen.

Tschau, tschüß,
Frank