Google Site-Abfrage
Mal wieder etwas aus der Ecke „Suchmaschinentricks“:
Google-Site-Abfrage richtig auswerten:
Manchmal möchte man gerne wissen, wie viele Seiten die Suchmaschine Google von einer bestimmten Domain bereits gespidert hat. Die Site-Abfrage hat allerdings ihre Tücken:
So können zum Beispiel die Abfragen:
- site:www.domain.de
- site:www.domain.de/
- site:domain.de
- und site:domain.de/
… mitunter völlig unterschiedliche Resultate zu Tage fördern.
Wenn man seine Seite kennt, sollte man ja eigentlich wissen, welche Maximalanzahl an Seiten überhaupt möglich ist. Nach einigen Experimenten bin ich jüngst zu dem Schluss gekommen, dass die Abfrage „site:domain.de/“ (mit Slash am Ende) momentan wohl die korrektesten Abfrageergebnisse liefert. Bei alten Seiten ist der Unterschied eher marginal bis nicht vorhanden, bei neuen Seiten allerdings erheblich!
Hat jemand anderes beobachtet?
Google Site-Abfrage
Benutzerinformation und Links:
- Autor: fob (Mittwoch, - 17. Oktober 2007 - 15:24 Uhr)
- Blog-Ablage: Google, Internet, Suchmaschinentricks
- Stichwortsuche /
Schöner Hinweis. Habe leider vergessen, zu erwähnen, dass die Grundmasse des Experiments eine solche gewesen ist. D.h., alle überprüften Seiten hatten bereits eine bereinigte URL-Struktur.
https://www.fob-marketing.de/ zeigt zum Beispiel bei:
site:www.fob-marketing.de
site:www.fob-marketing.de/
site:fob-marketing.de und
site:fob-marketing.de/
exakt das gleiche Ergebnis an. Hätte die Site-Abfrage etwas mit „einheitlicher Startseiten-URL“ zu tun, müssten davon doch eigentlich zwei bis drei Abfragen ein leeres Ergebnis anzeigen. Oder? Fakt ist aber, dass bei anderen Domains merkwürdigerweise völlig unterschiedliche Index-Stände angezeigt werden, je nachdem, wie die Site-Abfrage gerade aussieht…
Die Suchmaschinen betrachten eine Seite, die unter mehreren URLs erreichbar ist, also z.B. mit vorgeschaltetem „www“ oder ohne, mit / am Ende oder ohne, als unterschiedliche Seiten mit eigenständigen Adressen. Von daher ist es verständlich, dass die Statistik unterschiedliche Werte ausweist. Am besten erklärt man eine Seite zum Master und leitet alle anderen Versionen mit einer 301-Umleitung auf diesen Master um.
wurde denn für die site bei google webmaster eine definition bezüglich mit/ohne www vorgenommen? so kann man google ja auf die richtige fährte setzen. habe beim selbsttest eine differenz von 20 seiten (mit/ohne www, bei ca 3000 indizierten seiten) festgestellt, in den suchergebnissen dann aber einige subdomains entdeckt, die ohne www offenbar dazugezählt werden. insofern also wohl korrekt.
Schon mal umgeblättert? Da könnte sich das Ergebnis dann noch einmal verändern. 😉
[…] der PageRank Up- und Downgrade-Aktion stelle ich gerade fest, dass die Google-Site-Abfrage wieder ordnungsgemäß zu funktionieren […]
Danke. Das mit dem .de/ ergibt ja eigentlich auch einen doppelten Content, oder?
Gruß
Theoretisch ja. Praktisch sehe ich in diesem Punkt kein großes Problem. Sauberer (und unter Umständen für den PageRank der Google-Toolbar von Bedeutung) ist in jedem Fall die Verwendung und einheitliche Vernetzung einer eindeutigen Domain-Adresse (URL).