Hallo Michael
Nun, Yacy ist keine Software, die man nebenbei auf seinem 10-jährigen Schlepptopp laufen hat.
Bei näherer Betrachtung der aktuellen westlichen Suchmaschinenszene kann man gewisse Entwicklungen feststellen und Erkenntnisse ableiten:
Wenn man weiss, was man sucht (d.h. man hat es schon mal gefunden), dann ist G gut, weil schnell und umfangreich.
Wenn man neugierig ist und auf der Suche nach neuen Dingen, dann ist G nur bedingt geeignet, weil komplett Advertising driven.
Der anfänglich gepriesene Brin’sche Algorithmus kann aufgrund der vielen unzusammenhängenden Inseln im Web gar nicht wirklich funktionieren.
Um echt Neues zu finden ist eigentlich jede Art von Suchmaschine nur 2. Wahl. Woher weiss denn eine Suchmaschine, wo die neuen Dinge sind? Eben.
Dies ist der Grund, weshalb G und andere selbsternante Sicherheitswächter gratis Nameserver bereitstellen: Von neuen Domains erfahren die DNS immer zuerst.
Aus dem gleichen Grund sind Virenscanner gratis, denn nur der weiss wirklich, welche Seiten Papa besucht.
Personalisierte Ads empfide ich hingegen sogar ganz angenehm, allerdings nur, wenn sie mir coole NEUE Sache zeigen - und nicht 5 Wochen lang Reifen verkaufen wollen, nur weil ich bei G mal nach nem Online Händler gesucht habe.
Am Besten fahre ich im Moment mit einem Setup aus einer Metasuchmaschine, in der meine Yacy Instanzen zuliefern. Im Bereich, wo ich meine YaCys mit Content gefüttert habe (EU Homepages, v.a. B2B und Schweizer Regional Zeitungen und Links), sind sie bei den Ergebnissen immer vorne mit dabei (2 Sekunden Timeout über alle Maschinen). Richtig gut performt das Ganze, seit ich G tatsächlich rausgeworfen habe. Bing, DuckDuck…und neuerdings mojeek liefern Ergebnisse mit einer Performance, da tropfen Dir die Augen.
Ach ja, von G kann man viel lernen. Die pfeifen auf das EU DSGwhatever VO Zeugs, im Gegenteil:
Seit es das gibt, klickt jeder alle Enverständnisserklärungen nur noch weg - und die grossen können endlich durchdrücken was sich schon immer wollten.
Den privaten spannenden Content habe sie sehr wohl - wie sonst sollte denn auch der Index funktionieren. Jeder Depp lässt ja seine Hosen Runter wenn der G Bot hinten rein will.
Im Suchergebnis erscheint ja nur - ganz legal - der Link zum Content.
Mit diesem Wissen lässt sich G und Konsorten übrigens perfekt als “DB-Cloud” benutzen, du musst das nur noch automatisieren. Die Suche funktioniert so: “Namen plus eins.”
Name kann dabei auch Produkt, Firma oder Ort sein. das “Plus eins” ist das Stichwort, bzw Thema.
Kombiniert und permutiert gibt das ein paar Mio. Abfragen für G und eine schöne Liste an Starturls für YaCy.
Auf die Art - genug YaCy Ressourcen vorausgesetzt - lässt sich mit überschaubarem Aufwand sehr schnell eine eigene Suchmaschine aufbauen. Jetzt müssen nur noch mehrere Gleichgesinnte mitmachen. 2-3 YaCy Büchsen nebeneinander haben sich bei mir als Best Practice herausgestellt.
Ich beschäftige damit meine ausrangierten Serverlein mit 200GB - 1TB Plattenspeicher.
Auf Windoofs läuft YaCy bei mir lustigerweise stabiler als auf FreeBSD oder Debian, aber ohne Reboot alle paar Tage geht es nirgends.
Schönen Gruss nach Augsburg, dort bin ich aufgewachsen und: Gute Besserung!
Markus