Moin Moin !
Hmmm...dazu habe ich Fragen:
- Wie fuehre ich eine Suche in einer DB und Indexing Service aus? (ziemlich verschieden!) Einfach beide hintereinander durchsuchen?
Genau.
ErgebnisListeDB = Suche_in_der_DB(suchanfrage)
ErgebnisListeIndex = Suche_im_Indexing_Service(suchanfrage)
Ergebnis = Vereinigungsmenge ( ErgebnisListeDB , ErgebnisListeIndex )
Du kannst auch erstmal alle Ergebnisse raussuchen, die in beiden Listen vorkommen. Dann packst Du beide Listen in eine neue Liste, und löscht dann die doppelten Ergebnisse.
In Perl (ist wohl nicht ganz Dein Ding, schätze ich) geht das noch anders, über ein assoziatives Array (hash), dabei geht (ohne weitere Tricks) allerdings die Sortierung der Ergebnisse verloren:
@listedb=dbsuche($suchanfrage);
@listeindex=indexsuche($suchanfrage);
%alle=();
foreach $element (@listedb) {
$alle{$element}=1;
}
foreach $element (@listeindex) {
$alle{$element}=1;
}
@ergebnis=keys %alle;
- Ok. dann habe ich Recordsets mit den Results der Suche. Wie fuehre ich diese Listen zusammen? Irgendiwe so(???):
Checke Dateinamen der pdf Datei in Fulltext Search Results (nur darueber laesst sich die Datei identifizieren, da Scanqualitaet und OCR ziemlich schlecht sind) - dann habe ich einen eindeutigen Index fuer die Meta DB....und dann wieder eine Abfrage der Meta-DB mit diesen Indexcodes? (Erscheint mir reichlich kompliziert...)
Ja, mir auch. Siehe oben. Willst Du unbedingt bei der Index-Teilmenge auch Ergebnisse aus der Meta-DB anzeigen, oder reicht es Dir aus, eine Liste aller passenden PDFs zu bekommen?
Hast Du noch andere Ideen?
Klar: Such Dir einen Externen, der den Job übernimmt, und verklag ihn anschließend, weil es nicht so funktioniert, wie Du es haben willst. ;-)
Alexander
Nein, ich beantworte keine Fragen per eMail. Dafür ist das Forum da.
Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so!"