• Jetzt anmelden. Es dauert nur 2 Minuten und ist kostenlos!

Suchfunktion für HTML-Seiten und gelinkte Dokumente

Status
Für weitere Antworten geschlossen.

Wile E. Coyote

Neues Mitglied
Suchfunktion für HTML-Seiten und gelinkte Dokumente

Hallo,

also zuerst mal: Ich bin neu hier und habe ungefähr keine Ahnung
von HTML und allem, was da so dranhängt.
Trotzdem bin ich nun in die Situation gekommen, dass ich eine Suchfunktion für HTML-Seiten schreiben soll. Die Suchfunktion soll
nicht nur die Seiten selber durchsuchen, sondern auch die Dokumente, die
auf ihnen verlinkt sind.
Meine Suche über Schlüsselwörter hat leider keine Ergebnisse geliefert.
Wäre prima, wenn mir hier jemand helfen könnte oder wenn jemand sogar so eine Funktion hat?

Vielen Dank schon mal im Voraus, Wile E.
 
bei google kann man einen quellcode für sich kopieren, mit dem man dann seine eigenen seite, oder mit google suchen kann!
 
Ja prima, darunter kann ich mir schon eher etwas vorstellen.
Kann ich damit auch Dokumente (z.B. PDF oder doc), die auf meiner Seite verlinkt sind, durchsuchen?

Danke und Gruß, Wile E.
 
OK, vom Prinzip her ist das ja schon OK.
Allerdings werden bei beiden Lösungen nicht meine Seiten, sondern nur das WEB durchsucht. Das darf aber nicht sein, und auch die Ergebnisse dürfen nicht über die
Webpages angezeigt werden. Das soll mal ne Suchfunktion für das Intranet einer
Firma werden, d.h. es sollen nur die Intranet-Seiten und die Dokumente durchsucht werden. Und auch die Anzeige muss dann praktisch im Intranet stehen.
Werden bei den beiden Funktionen von Yahoo und Google Suchfunktionen aufgerufen, die bei denen auf den Servern hinterlegt sind?
Genau das wäre es dann ja, was ich brauche??? Gibt es da denn nicht schon fertige Funktionen irgendwo?
Sorry, aber ich hab das aufs Auge gedrückt bekommen und hab´ echt keine Ahnung davon...

Wile E.
 
GRatis ist natürlich Klasse...ich wäre schon bereit, etwas dafür zu bezahlen, wenn es sich im Rahmen von 100 Euro oder so bewegt...aber nicht 3000 Dollar!!!!
Hast du eventuell auch einen Gratis-Link für mich?
Oder hat das keiner auf dieser Seite schon mal gemacht?? Hier sind
so viele Cracks, da muss doch einer so was schon mal gemacht haben???
 
ich hab mir gerade das google teil angeschaut, das geht ab wie fusspilz (sorry fuer meine aussdrucksweise)! da ist ja auch ein kompletter PC dabei, also mit 100 euro koennteste dir sowas nichtmal selbst basteln. tut mir leid, ich habe schonmal eine suchmaschine gebastelt, aber PDF zu indexen ist ne andere geschichte :) und dann sollen die ergebnisse ja auch noch relevant sein? eventuell solltest du mal www.sourceforge.net durchstoebern, dort gibt es jede menge opensource software (gratis), die z.T. den kommerziellen produkten um nix nachsieht.
 
Mal ganz dumm gefragt: Was ist denn das Problem dabei, PDF´s "zu indexen"?
Versteh´ mich nicht falsch, ich weiss nicht wie es geht, mich interessiert es nur.
Ist das bei Word-Dokumenten auch so schwer?
Glaub´ dann muss ich das noch mal absprechen, wie das mit dem Inhalt der Dokumente gehandelt werden soll. Ich werde mich auf jeden Fall auch mal bei sourceforge umschauen, vielleicht finde ich da ja was. Könntest du mir eventuell
deine Suchmaschine zur Verfügung stellen? Wäre echt cool, denn vielleicht streichen die ja evtl. die Anforderung mit dem Inhalt der Dokumente.
Auf jeden Fall schon mal vielen Dank für deine Geduld!!!
Und wenn du sonst noch eine Idee hast, wäre cih dir auch sehr dankbar, wenn du sie hier noch einstellen könntest...ich bin allerdings erst morgen abend wieder da.
Und wie schon gesagt, vielen Dank für deine Mühe,
Gruß aus Braunschweig, Wile E.
 
soviel ich weiss (ich bin mir da aber nicht sicher) werden PDF dokumente nicht plain-text gespeichert, also man muss sie zuerst "dechiffrieren". Das selbe gilt fuer ms-word dokumente, meines erachtens nach. Das heisst, wenn du ein PDF doukment mit dem normalen windows Editor oeffnest, kannst du keinen text lesen. (wiederum, das ist eine vermutung. wer's genau wissen will, soll ausprobieren).

meine suchmaschine kann ich dir leider nicht zur verfuegung stellen, da ich sie nichtmehr besitze (das war mal ein schulprojekt, vor langer langer zeit!) ansonsten wurede ich das gerne tun. sie wuerde dir aber nicht weiterhelfen, da sie nur den inhalt aus einer SQL datenbank gelesen hat.

Ich nehme mal an du musst die sache fuer deinen chef machen. Ich wuerde auf jeden fall die google alternative zumindest vorschlagen und klar machen, dass das sicherlich die eleganteste loesung waere. Eventuell kriegt man auf ebay ein billigeres angebot, da es jemand gekauft hat und gemerkt dass es nix fuer ihn ist? Nur eine idee.

Andernfalls sollte dir sourceforge weiterhelfen. Es gibt noch eine partnerseite, namens Freshmeat (link ist auf sourceforge verfuegbar) welche auch opensource projekte verwaltet. Eventuell dort auch nochmals nachschauen. Ansonsten ist google immer dein freund, ich bin mir sicher du bist nicht der erste der mit diesem problem konfrontiert ist bzw. sicherlich nicht der erste der sowas in einem forum fragt :)
 
ja genauso is es!
wenn du allerdings ei pdfdoku mit nem editor öffnest, wirst du garantiert keinen richtigen text vor dir haben!
genauso ist es bei wordokumenten!
wirst du deshalb wahrscheinlich in normlaen htmltext umschreiebn müssen, sofern deien pdfs durchsuchbar sein sollen!
 
kannst du mir denn mla den link von dem googlescript geben, wo man auswählen kann, ob man mit google, oder in seiner eigenen site suchen will; ich find das da nur bei yahoo! :cry:
 
Status
Für weitere Antworten geschlossen.
Zurück
Oben