Die Evolution des Suchalgorithmus von Yandex

Yandex Suchalgorithmus: 1997 bis 2017

Als Suchmaschine existiert Yandex bereits seit 19 Jahren. Seit 2000 stellt das russische IT-Unternehmen eine geschützte Marke dar. Im folgenden Blogartikel stellen wir eine Übersicht der Entwicklung des Suchalgorithmus von Yandex in den letzten 10 Jahren zusammen.

Der Suchdienst von Yandex wurde offiziell im September 1997 lanciert und während seiner Anfänge unterm Dach des Mutterunternehmens CompTek International entwickelt. Das Wort „Yandex“ steht übrigens für Yet Another iNDEXer. Der Name soll darauf hinweisen, dass der innovative Search Dienst einen anderen Suchalgorithmus als die Konkurrenz anbietet.

Die Ranking-Formeln von Yandex

Erst 2007 fing das Unternehmen an,  seine Ranking Formeln zum Teil öffentlich zu machen, davor war sie gänzlich undokumentiert. Seit 2007 wurden fast alle neuen Ranking Formeln von Yandex nach einer Stadt genannt. Dahinter steckte das Prinzip eines bekannten russischen Gesellschaftsspiels „Städte“, bei dem man eine Stadt nennen soll, deren Name mit dem letzten Buchstaben der vorher genannten Stadt beginnt. Dieses Prinzip wurde bis Juli 2013 eingesetzt.

Die neun bis dahin entwickelten Ranking-Formeln von Yandex hießen daher:

Magadan -> Nakhodka -> Arzamas -> Snezhinsk -> Konakovo -> Obninsk -> Krasnodar -> Reykjavik -> Kaliningrad.

So hätte die Reise durch die Yandex-Geschichte auf einer geografischen Karte aussehen können:

Ranking Formeln von Yandex als geografische Karte

Hier sind die Besonderheiten aller Ranking Formeln, die für die für SEO der russischsprachigen Websites zu einem bestimmten Zeitpunkt relevant waren.

Magadan (April 2008)

Der Suchalgorithmus „Magadan“ hat für eine Revolution im russischen Internet gesorgt. Er hatte mindesten doppelt so viel Ranking-Faktoren als der alte Algorithmus. Die Einzigartigkeit des Contents der Websites spielte eine besonders wichtige Rolle.

Ferner hat Yandex gelernt, die so genannte Transliteration (das Schreiben russischer Wörter mit lateinischen Buchstaben, z.B. in URLs) und die oft benutzten Abkürzungen zu verstehen und konnte Dokumente, die auf solchen Kenntnissen basierten, besser auflisten. Dies erlaubte es der russischen Suchmaschine, unter anderem die Webseiten auf Englisch zu indexieren.

Darüber hinaus konnte Yandex durch „Magadan“ alle Texte besser verstehen und auch dann relevante Webseiten finden, wenn diese keine genaue  Keywords-Kombination enthielten.

Nakhodka (September 2008)

Sechs Monate nach „Magadan“ hat Yandex den Suchalgorithmus „Nakhodka“ vorgestellt. Die Suchmaschine konnte schon Stop-Wörter verstehen (wie etwa Präpositionen, Bindewörter usw.) und sie für das Ranking der Dokumente berücksichtigen. Parallel erweiterte sich der Wortschatz der Suchmaschine, sodass sie Synonyme und Variationen der Rechtschreibung verstehen konnte.

Arzamas (April 2009)

Im April 2009 war die Zeit für die Ranking Formel „Arazamas“ reif, die eine effektive lokale Suche ermöglichte. Durch den Suchalgorithmus wurden alle Suchanfragen in zwei Gruppen untergeordnet: geo-abhängige und geo-unabhängige (auf Englisch: geo-dependant und geo-independant).  Bei geo-abhängigen Suchanfragen hatten die Webseiten von lokalen Unternehmen den Vorrang in lokalen SERPs (Search Engine Result Pages). So wurde ein Taxi-Unternehmen aus Novosibirsk bei einer Suchanfrage aus Novosibirsk beispielsweise besser rangiert als ein Taxi-Unternehmen aus Moskau. Außerdem war Arzamas der erste Suchalgorithmus von Yandex, der die Webseiten mit Pop-up und Pop-under Advertising gut aussortieren konnte.

Snezhinsk (November 2009)

Bei der Ranking Formel „Snezhinsk“ gab es gleich mehrere Tausend neue Ranking-Faktoren auf einmal, die Ende 2009 eine richtige Panik unter russischen SEO-Spezialisten verursacht hatten. Hier sind die wichtigsten davon:

die geprüften Webseiten wurden im Allgemeinen besser rangiert als alle anderen;

einzigartige Inhalte wurden zu einem Muss. Websites mit Duplicate Content wurden gestraft;

alte Backlinks hatten mehr Wert als die, die vor kurzem erworben wurden;

– es wurde ein neuer Filter zur Strafung von Webseiten mit niedriger Qualität eingeführt (AGS)

Was die technische Seite angeht, so wurde gleichzeitig auch die selbstlernende Suchmaschine MatrixNet ins Netz gestellt. Wegen diesen Veränderungen wurde es für SEO-Profis um ein Vielfaches schwerer, die Webseiten auf  hohe Positionen bei Yandex zu bringen.

Konakovo (Dezember 2009)

Mit „Konakovo“ wurde der lokale Suchalgorithmus von „Arzamas“, der ursprünglich nur in 19 Regionen Russlands eingesetzt wurde, auch in anderen Landesteilen verfügbar. So kam er bis Ende 2009 in insgesamt 1250 russischen Städten zum Einsatz.

Obninsk (September 2010)

Beim nächsten Suchalgorhitmus kam grundsätzlich nichts Neues dazu, es wurde regelrecht Vieles verbessert. Das Neue an der Ranking Formel „Obninsk“ war, dass sie viele paid Links heruntergestuft hatte. Darüber hinaus wurde das geo-independant Search verbessert und die Suchmaschine konnte besser die Urquelle des Textes (bei Duplicate Content) identifizieren.

Krasnodar (Dezember 2010)

Mit den nächsten Algorithmus hatte Yandex gelernt, mit Hilfe der Spectrum Technologie die eigentliche Intention des Users zu verstehen. D.h. die Suchmaschine konnte auch bei Wörtern mit mehreren Bedeutungen verstehen, wonach der User tatsächlich fragt, und dadurch irrelevante Webseiten aus der Ergebnisliste ausschließen.

Reykjavik (August 2011)

Mit dem Suchalgorithmus „Reykjavik“ konnte Yandex die bevorzugte Sprache des Users identifizieren und ihm anhand dieser Daten Ergebnisse in dieser Sprache liefern. Da sich die Ranking-Formel für die Suchanfragen in anderen Sprachen eignete, wurde sie nach einer nicht russischen Stadt benannt.

Kaliningrad (Dezember 2012)

Der Suchalgorithmus „Kaliningrad“, der erst vor drei Monaten eingeführt wurde, hat den Usern von Yandex eine personalisierte Suche ermöglicht. Im Unterschied zur personalisierten Suche von Google wurden bei Yandex nach den unternehmeneigenen Angaben etwa 75 bis 80% aller Suchergebnisse personalisiert, unabhängig davon, ob der User eingeloggt war oder nicht. Damit wollte Yandex die Bedürfnisse seiner User besser bedienen, da viele SEOs bereits gelernt haben, wie sie mit allen anderen Neuheiten der Suchmaschine umgehen sollen.

Dublin (Mai 2013)

„Dublin“ – eine Modifikation von „Kaliningrad“, die im Frühling 2013 eingeführt wurde. Während „Kaliningrad“ die Interessen der User in kurzfristige und langfristige einteilte, hatte der neue Suchalgorithmus gelernt, auf die sofortigen Interessen zu reagieren. Um das gewährleisten zu können, fand sein Update jede Paar Sekunden statt. Ein Beispiel: wenn früher schon festgestellt wurde, dass ein User sich für Filme interessiert, jedoch kurzfristig auch Interesse für Geographie und Reisen zeigt, dann werden ihm für seine Suchanfrage“Madagaskar“ Ergebnisse für die Insel Madagaskar, und nicht für den gleichnamigen Animationsfilm gezeigt.

Yandex Dublin

Yandex Dublin

„Ostrowa“ (Juli 2013)

Im Sommer des gleichen Jahres annoncierte Yandex den Suchalgorhitmus „Inseln“ mit einer Änderung des Interfaces für die Suchergebnisse. Die wichtigste Neuerung der „Inseln“ bestand in seinen interaktiven Blöcken, die in den Suchergebnissen angezeigt wurden und mit dessen Inhalten man interagieren konnte, ohne auf die jeweilige Webseite zu gehen.

Wenn man zum Beispiel den Titel eines Filmes in das Suchfeld eingab, wurden dem User sofort die Vorstellungs-Zeiten in den Kinos seiner Stadt gezeigt. Außerdem konnte man direkt aus der Ausgabe der Suchergebnisse Aktionen vollziehen: Flugtickets buchen, einen Termin mit einem Arzt vereinbaren, die Postlieferung verfolgen und einiges mehr. Das Unternehmen ging davon aus , dass die „Inseln“ von den Website-Betreibern selbst erstellt werden.

Yandex Ostrowa

Yandex Ostrowa

Minusinsk (April 2015)

Am 15. April 2015 teilte Yandex mit, dass ab dem Tag, Websites, die bisher SEO-Backlinks verwendet haben, niedriger rangiert werden könnten. Die Vertreter von Yandex begründeten diese Entscheidung damit, dass sie den Ausbau der Unternehmensseiten fördern wollten. Damit die Unternehmer das Geld in eine gewinnbringende Optimierung statt in den Kauf von Links investierten.

„In den letzten Jahren haben wir zielstrebig versucht die Auswirkungen der SEO-Backlinks (gekauften Links) auf die Platzierung in der Rangliste in Grenzen zu halten. Aber diese wurden weiterhin gekauft und es wurden Budgets ausgegeben, die sinnvoller investiert werden konnten – z.B. in die Entwicklung der eigenen Website“, – teilte die Pressestelle von Yandex mit. Der richtige Weg für Unternehmer laut Yandex: Investitionen in Inhalt, Design, und Userfreundlichkeit der Website einfließen lassen, statt sie auf Backlinks zu verschwenden.

Wladiwostok (Februar 2016)

Der Suchalgorithmus „Wladiwostok“ wurde durch die Einführung der Suchtechnologie, die einen Verifikationsprozess für volle Kompatibilität mit mobilen Geräten durchführt, bekannt. Damit hat Yandex einen weiteren Schritt in Richtung mobile Nutzerfreundlichkeit gemacht. Um ein besseres Ranking in der mobilen Suche zu haben, musste die Webseite mit Mobilgeräten kompatibel sein. Um höher als die Konkurrenten in den Suchergebnissen zu stehen, sollte die Webseite auf allen mobilen Geräten, sei es ein Tablet oder Smartphone, korrekt angezeigt werden. „Wladiwostok“ prüfte auch das Vorhandensein von Java und Flash-Plugins, die Anpassungsfähigkeit der Inhalte auf die Größe des Bildschirms (die Breite der Textanzeige), die Lesbarkeit des Textes und die Bequemlichkeit der Link- und Button-Aktivierung.

Palekh (November 2016)

Am 02. November stellte Yandex einen neuen Algorithmus mit dem Namen „Palekh“ vor. Das Neue an diesem Algorithmus besteht in einer besseren Zuordnung von Longtail-Suchanfragen zu relevanten Ergebnissen oder Dateien. „Palekh“ ermöchlichte der Suchmaschine von Yandex genauer zu verstehen, was die User mit Ihren Anfragen meinten. Dank „Palekh“ gab die russische Suchmaschine bessere Ergebnisse bei der Suche heraus, die nicht nur den Schlüsselwörtern entsprechen, sondern auch inhaltlich zum Thema passen. Laut Yandex werden täglich etwa 100 Millionen einzigartige oder seltene Suchanfragen gestellt. Der Algorithmus sollte helfen diese schnell und vor allem richtig zu bearbeiten.

Für den inhaltlichen Vergleich der Suchanfragen und der Websites war ein Algorhitmus, basierend auf neuronalen Netzwerken, verantwortlich. „Palekh“ bildete einen n-dimensionalen Vektorraum, der durch die Schlüsselwörter der Suchanfrage und durch die Wörter der Webseiten gebildet wurde. Je näher die Vektoren der Suchanfrage und die der Dokumente zusammenlagen, desto relevanter waren die Letzten für die jeweilige Suchanfrage. Die Technologie der semantischen Vektoren zeigte großes Potenzial.  Es konnten nicht nur Titel sondern ganze Texte in solchen Vektoren analysiert werden, sodass der gesamte Wortlaut der Texte oder Dokumente erfasst werden konnte.

Yandex Palekh

Yandex Palekh

Korolyov (August 2017)

Im August 2017 erschien der zweite netzwerkbasierte Algorithmus „Korolyov“, der auf „Palekh“ aufbaut. Der neue Suchalgorithmus wurde nach einer Stadt nordöstlich von Moskau benannt, die seit vielen Jahren als Zentrum des russischen Weltraumforschungsprogramms auftitt. Das Update verbessert die Art, wie Yandex seltene und komplexe Suchanfragen behandelt (auch als Long-Tail Keywords bekannt).

Es gibt zwei bedeutende Neuerungen. Erstens, versteht Korolyov besser als sein Vorgänger, was die User mit ihrer Suchanfrage meinen, weil es die Gesamtheit der Websites analysiert und nicht nur auf ihre Headline achtet. Zweitens, hat Korolyov eine stärkere Leistungskraft und kann tausendmal mehr Dokumente in Echtzeit analysieren als „Palekh“.

Yandex‘ Position als größte Suchmaschine Russlands schafft eine positive Feedback-Basis für das Ausbauen des tiefen neuronalen Netzwerkalgorithmus, der zu immer besseren Suchergebnissen führt. „Korolyovs“ Ergebnisse werden in MatrixNet – Yandex’s proprietärem maschinellem Lernen des Ranking-Algorithmus – geleitet, wo eine Reihe anderer Ranking-Faktoren berücksichtigt wird, bevor Ergebnisse einem User angezeigt werden.

Vor kurzem begann MatrixNet Daten aus „Yandex.Toloka“ und Yandex’s Crowdsourcing-Plattformen sowie anonymisierten Nutzerdaten einzubeziehen, um die maschinellen Lernalgorithmen weiter auszubauen und zu trainieren. Diese Updates sollen Yandex dabei helfen, die Qualität der Suchdienste für seine User weiter zu verbessern. Ein entferntes, aber äußerst interessantes Ziel besteht darin, ein Modell auf Basis des neuronalen Netzwerks zu gestalten, das das semantische „Matching“ von Suchanfragen und Dokumenten auf dem Niveau des „Verstehens“ bearbeitet, vergleichbar mit dem Gedächtnis eines Menschen.

0 Kommentare

Dein Kommentar

Want to join the discussion?
Feel free to contribute!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.