Steuerung der suchmaschinenindexierung
Was ist es, was ändert sich,wie bereite ich mich vor?
Wer ist das?
Johannes Beus, SISTRIX
• Suchmaschinenoptimierung seit 5 Monaten
• Betrieb eigener Webprojekte unterschiedlichster Themengebiete und
• SISTRIX Toolbox
Was ist Google Caffeine?
Was ändert sich durch Google Caffeine?
Wie kann ich mich auf Google Caffeine vorbereiten?
1 Was ist Google Caffeine?
im August 2009 der Öffentlichkeit vorgestellt
monatelang in einer öffentlichen Sandbox testbar
für Januar 2010 angekündigt
… und immer noch nicht richtig live.
Achtung: die folgenden Folien sind „Educated Guess", nicht
1 Was ist Google Caffeine?
Vereinfachter Aufbau einer Suchmaschine
Crawlen Indexieren Ranken
1 Was ist Google Caffeine?
Vereinfachter Aufbau einer Suchmaschine
Crawlen Indexieren Ranken
1 Was ist Google Caffeine?
Unter dem Arbeitstitel Caffeine wird ein Teil der Suchinfrastruktur, also
der eben gezeigt mittlere Teil der Suchmaschine, neu konzipiert und
Zu der Infrastruktur gehört Software wie:
• MapReduce – paralleles Verarbeiten sehr großer Datenmengen• BigTable – Speichern und Durchsuchen umfangreicher Tabellen• GFS (Google File System) – Verteiltes Dateisystem als Grundlage
der Software von Google
1 Was ist Google Caffeine?
GFS – Google File System
Als Google das GFS konzipiert hat, wurden Entscheidungen getroffen wie: „Hoher Durchsatz ist wichtiger als kurze Wartezeit"
Gut für monatliche oder wöchentliche Updates eines Suchindexes,
schlecht für Anforderungen, die heute an Google gestellt werden:
1 Was ist Google Caffeine?
GFS2 – Google File System Version 2
Das Google File System wird neu konzipiert und umgesetzt. Dabei
werden Fehler und Grenzen, die in den letzten Jahren aufgetreten sind
beseitigt. Dadurch kann Google Informationen in Zukunft schneller
verarbeiten und Software, die auf dem GFS basiert, kann besser
Nerd-Wissen:• Kleinere Chunks (von 64MB auf 1MB, dadurch weniger Latenz)• Multi-Master-Setup (Dadurch werden kleinere Chunks erst möglich,
da Metadaten als B-Tree im RAM des Masters liegen)
1 Was ist Google Caffeine?
• Google Caffeine ist kein Algorithmus-Update, sondern Google
erneuert die Software-Infrastruktur, da sie den wachsenden Anforderungen nicht mehr Stand hält.
• Das Google-System wird neue Informationen in Zukunft schneller
verarbeiten können. Google legt damit den Software-Grundstein für
eine bessere und schnellere Realtime-Suche.
• Da die erneuerte Infrastruktur Google nicht mehr einschränkt,
werden in Zukunft neue und andere Signale in den Algorithmus
einfließen können.
2 Was ändert sich durch Google Caffeine?
Der Realtime-Index rückt näher
Google ist in den letzten Jahren zwar schneller geworden, ein
Realtime-Index mit unterschiedlichen Datenquellen ist das aber noch
Google Caffeine legt die Grundlagen, damit sowas in Zukunft
umgesetzt werden kann. Anzeichen dafür wie die Vorstellung von
PuSH (Realtime Syndication Protokoll) sind ausreichend
2 Was ändert sich durch Google Caffeine?
Bessere und aktuellere Signale für den Google Algorithmus
Viele der aktuell genutzten Ranking-Signale sind langsam und
entsprechen damit nicht mehr den Erfordernissen an einen Realtime-
Index. Google versucht das durch domainweite Signale wie Trust zu
Durch Caffeine können vermutlich auch Signale wie die
Anzahl der ReTweets oder Ähnliches in den Algorithmus
einfließen und für sehr frischen Inhalte bessere
Werte als die alten Signale liefern.
2 Was ändert sich durch Google Caffeine?
Google indexiert mehr Dokumente
Tests an der öffentlichen Sandbox haben gezeigt, dass Google
Caffeine häufig mehr Ergebnisse findet als die bekannte Google-
Suche. Crawling von Ajax-Seiten und Teilen des Deepwebs scheinen
dazu beizutragen.
2 Was ändert sich durch Google Caffeine?
Google indexiert mehr Dokumente
Tests an der öffentlichen Sandbox haben gezeigt, dass Google
Caffeine häufig mehr Ergebnisse findet als die bekannte Google-
Suche. Crawling von Ajax-Seiten und Teilen des Deepwebs scheinen
dazu beizutragen.
2 Was ändert sich durch Google Caffeine?
Die Antwortzeiten der Googlesuche sinken
Viele Features und Umsetzungen der aktuellen Google-Suche mussten um die Beschränkungen der derzeitigen Infrastruktur „drumherum" entwickelt werden. Auf Basis von Caffeine können effizientere
Methoden gewählt werden und die Antwortzeit sinkt.
2 Was ändert sich durch Google Caffeine?
Die Antwortzeiten der Googlesuche sinken
Viele Features und Umsetzungen der aktuellen Google-Suche mussten um die Beschränkungen der derzeitigen Infrastruktur „drumherum" entwickelt werden. Auf Basis von Caffeine können effizientere
Methoden gewählt werden und die Antwortzeit sinkt.
2 Was ändert sich durch Google Caffeine?
• Google entwickelt sich in Richtung Realtime-Suchmaschine. Der
Index wird bei vielen Themen aktueller und schnelllebiger.
• Neue Signale werden Einzug in den Algorithmus erhalten. Diese
Signale werden häufig ein Beziehung zu Erkenntnissen aus dem Realtime-Index haben.
• Der Google-Index wird (deutlich) umfangreicher und trotzdem wird
Google in der Lage sein, Ergebnisse schneller als bisher zu liefern.
3 Wie bereite ich mich auf Google Caffeine vor?
3 Wie bereite ich mich auf Google Caffeine vor?
Vorbereitung auf neue Signale
Welche Signale Google in Zukunft zusätzlich in den Algorithmus
aufnehmen wird, ist unklar. Gute Chancen dürften Realtime-Signale
haben: Twitter, Facebook-Stream, sonstiger Social-Kram.
Also wenn noch nicht geschehen: Twitter- & Facebook-Account
anlegen und sinnvolle (!) Kontakte knüpfen. Tricksereien
in sozialen Netzwerken sind leichter zu enttarnenals in Linknetzwerken …
3 Wie bereite ich mich auf Google Caffeine vor?
Vorbereitung auf andere Darstellungs- und Auslieferungswege
Das Crawlen von Webseiten ist zum Datensammeln gut geeignet,
wenn man es nicht eilig hat. Google hat es eilig und wird alternative
Bereitstellungsformen fordern. PuSH (PubSubHubbub), eine Art
erweiterter Atom/RSS-Feed wurde bereits vorgestellt, weitere werden
vermutlich folgen.
Wer zeitkritischen Content hat, sollte seine Technik
so aufstellen, dass sie die Anforderungen von
Google flexibel umsetzen kann.
3 Wie bereite ich mich auf Google Caffeine vor?
Indexierung gezielt steuern
Der Google-Index wird mit Caffeine wachsen, Google muss also mehr
Seiten crawlen. Deswegen fängt der Googlebot an, Ajax zu parsen,
Formulare auszufüllen und ob Verbote in der robots.txt auf Dauer
eingehalten werden, ist auch nicht so sicher.
Es ist wichtig, diese Aktivitäten von Google im Auge zu
behalten und gegebenenfalls einzugreifen. Ihr wisst
besser, welche Inhalte in den Index dürfen und welche
3 Wie bereite ich mich auf Google Caffeine vor?
Auch wenn es keinen direkten Bezug zu Caffeine hat: achtet darauf,
dass die Ladezeiten eurer Seiten in einem akzeptablen Rahmen
bleiben. Das gilt sowohl für die Auslieferungszeit des reinen HTML als
auch für die Ladezeit der kompletten Seite beim User.
Die Webmaster-Tools von Google zeigen euch unter „Labs",
welche Ladezeit-Daten Google derzeit von euch hat:
3 Wie bereite ich mich auf Google Caffeine vor?
• Mögliche Realtime-Signale, die Google in Zukunft nutzen könnte für
das eigene Umfeld ausmachen und sich darauf vorbereiten.
• Die Technik so flexibel aufstellen, dass verschiedene
Distributionsmethoden genutzt werden können, wenn Google das will.
• Aufpassen, welche Inhalte Google indexiert und darauf achten, dass
die ausgelieferten Inhalte schnell bei Google und beim Nutzer sind.
Download und Zusammenfassung:
www.sistrix.de/news & seo.at
Twitter nicht vergessen, könnte wichtig werden:
Wenn sonst noch was ist:
Source: http://seo.at/wp-content/uploads/2010/03/SISTRIX_-_Google_Caffeine.pdf
I Quaderni ZooBioDi N. 3/2010 Herbal Remedies in Animal Farming Rimedi Vegetali in Zootecnia Giovedì 9 Settembre 2010 XXII SALONE INTERNAZIONALE DEL NATURALE 9-12 settembre 2010 Il Quaderno ZooBioDi N.3/2010 raccoglie i lavori presentati al convegno "Herbal Remedies in Animal Farming - Rimedi Vegetali in Zootecnia" nell'ambito del XXII Salone Internazionale del Naturale che si è tenuta a Bologna il 9 settembre 2010, presso il Quartiere Fieristico Bologna, Sala Opera. COMITATO SCIENTIFICO Mauro Serafini, Università degli studi di Roma, Sapienza Agostino Macrì, Istituto Superiore di Sanità Roberto Balducchi, ENEA BAS-BIOTEC C.R. La Trisaia Renzo Nazareno Brizioli, Istituto Zooprofilattico Sperimentale Lazio e Toscana Paolo Ranalli, Consiglio per la Ricerca e la sperimentazione in Agricoltura COMITATO ORGANIZZATORE Paola del Serrone, Consiglio per la Ricerca e la sperimentazione in Agricoltura CRA Marcello Nicoletti, Società Italiana di Fitochimica S.I.F. Marinella Trovato, Società Italiana Scienze e Tecniche Erboristiche S.I.S.T.E. Paolo Pignattelli, Associazione Italiana di Zootecnia Biologica e Biodinamica - ZooBioDi Giovanni Giacometti, Associazione Scientifica Internazionale di medicina tradizionale, Complementare e Scienze Affini - OLOSMEDICA SEGRETERIA ORGANIZZATIVA S.I.S.T.E. - Via Filagro, 38 20143 Milano, Tel: 02-45487428 Fax: 02-4548790, PROGETTO GRAFICO Susanna Lolli, ZooBioDi. FOTO Archivio del Laboratorio di Sostanze Naturali del Dipartimento del Farmaco, Istituto Superiore di Sanità. Tutti i diritti riservati Copyright © 2010, ZooBioDi – Associazione Italiana di Zootecnia Biologica e Biodinamica Pubblicazione fuori commercio ISBN 978-88-903475-3-5
The Oral Diabetes Drugs Treating Type 2 Diabetes Comparing Effectiveness, Safety, and Price Six classes of oral medicines (and 12 individual drugs) are now available to help the 25.8 million people in theU.S. with type 2 diabetes control their blood sugar when diet and lifestyle changes are not enough. Our eval-uation of these medicines found the following: