yandex Algorithmen

Yandex Suchalgorithmus: 1997 bis 2016

Als Suchmaschine existiert Yandex bereits seit 19 Jahren. Seit 2000 stellt das IT-Unternehmen eine geschützte Marke dar. Im folgenden Artikel stellen wir einen Überblick über die Entwicklung des Suchalgorithmus von Yandex vom Gründungsjahr 1997 bis heute zusammen.

Der Suchdienst von Yandex wurde offiziell im September 1997 angekündigt und während seiner Anfänge unterm Dach des Mutterunternehmens CompTek International entwickelt. Das Wort „Yandex“ steht übrigens für Yet Another iNDEXer„. Der Name soll darauf hinweisen, dass der innovative Search Dienst einen komplett anderen Suchalgorithmus als die Konkurrenz  anbietet.

Die Ranking-Formeln von Yandex

Es gibt leider keine Quellen, in denen die Ranking-Formel von Yandex bis zum Jahr 2007 dokumentiert wird. Erst 2007 fing das Unternehmen an,  seine Ranking Formel zum Teil öffentlich zu machen. Seit der Zeit wurde jede neue Ranking Formel von Yandex meistens nach einer Stadt genannt. Dahinter steckte das Prinzip eines bekannten russischen Gesellschaftsspiels „Städte“, bei dem man eine Stadt nennen soll, deren Name mit dem letzten Buchstaben der vorher genannten Stadt beginnt. Dieses Prinzip wurde bis Juli 2013 eingesetzt.

Die neun bis dahin entwickelten Ranking Formeln von Yandex hießen daher:

Magadan -> Nakhodka -> Arzamas -> Snezhinsk -> Konakovo -> Obninsk -> Krasnodar -> Reykjavik -> Kaliningrad.

So hätte die Reise durch die Yandex-Geschichte auf einer geografischen Karte aussehen:

Ranking Formeln von Yandex als geografische Karte

Hier sind die Besonderheiten aller Ranking Formeln, die für die russische SEO zu einem bestimmten Zeitpunkt relevant waren.

Magadan (April 2008)

Der Suchalgorithmus namens Magadan hat für eine Revolution im russischen Internet gesorgt. Er hatte mindesten doppelt so viel Ranking-Faktoren als der vorherige Algorithmus, wobei die Einzigartigkeit der Webseite eine besonders wichtige Rolle spielte.

Ferner hat Yandex gelernt, die so genannte Transliteration (das Schreiben russischer Wörter mit lateinischen Buchstaben, z.B. in URLs) und die oft benutzten Abkürzungen zu verstehen und konnte Dokumente, die auf solchen Kenntnissen basierten, besser auflisten. Dies erlaubte es der russischen Suchmaschine, unter anderem die Webseiten auf Englisch zu indexieren.

Darüber hinaus konnte Yandex durch Magadan alle Texte besser verstehen und auch dann relevante Webseiten finden, wenn sie keine genaue  Keywords-Kombination enthielten.

Nakhodka (September 2008)

Sechs Monate nach Magadan hat Yandex den Suchalgorithmus Nakhodka vorgestellt. Die Suchmaschine konnte schon Stop-Wörter verstehen (wie etwa Präpositionen, Bindewörter usw.) und sie für das Ranking der Dokumente verwenden.

Parallel erweiterte sich der Wortschatz der Suchmaschine, sodass sie Synonyme und Variationen der Rechtschreibung verstehen konnte.

Arzamas (April 2009)

April 2009 war die Zeit für die Ranking Formel Arazamas reif, die eine effektive lokale Suche ermöglicht hat. Durch den Suchalgorithmus wurden alle Suchanfragen in zwei Gruppen untergeordnet: geo-abhängige und geo-unabhängige (auf Englisch: geo-dependant und geo-independant).  Bei geo-abhängigen Suchanfragen hatten die Webseiten von lokalen Unternehmen den Vorrang in lokalen SERPs (Search Engine Result Pages). So wurde ein Taxi-Unternehmen aus Novosibirsk bei einer Suchanfrage aus Novosibirsk beispielsweise besser rangiert als ein Taxi-Unternehmen aus Moskau.

Außerdem war Arzamas der erste Suchalgorithmus von Yandex, der die Webseiten mit Pop-up und Pop-under Advertising gut aussortieren konnte.

Snezhinsk (November 2009)

Bei der Ranking Formel Snezhinsk gab es gleich mehrere Tausende neue Ranking-Faktoren auf einmal, die Ende 2009 eine richtige Panik unter russischen SEO-Spezialisten verursacht haben. Hier sind die wichtigsten:

– die geprüften Webseiten wurden im Allgemeinen besser rangiert als alle anderen;

– einzigartige Inhalte wurden zu einem Muss. Webseiten mit Duplicate Content wurden bestraft;

– alte Links hatten mehr Wert als die, die vor kurzem erworben wurden;

– es wurde ein neuer Filter zur Bestrafung von Webseiten niedriger Qualität eingeführt: AGS

Was die technische Seite angeht, so wurde gleichzeitig auch die selbstlernende Suchmaschine MatrixNet ins Netz gestellt. Wegen diesen Veränderungen wurde es für SEO-Profis um ein Vielfaches schwerer, die Webseiten auf  hohe Positionen bei Yandex zu bringen.

Konakovo (Dezember 2009)

Mit Konakovo wurde der lokale Suchalgorithmus von Arzamas, der ursprünglich nur in 19 Regionen Russlands eingesetzt wurde, auch in anderen Landesteilen eingeführt, sodass er bis Ende 2009 in insgesamt 1250 russischen Städten zum Einsatz kam.

Obninsk (September 2010)

Das Besondere an der Ranking Formel Obninsk war, dass sie viele „SEO Links“ oder paid Links heruntergestuft hat.

Darüber hinaus wurde das geo-independant Search verbessert und die Suchmaschine konnte besser die Urquelle des Textes (bei Duplicate Contents) identifizieren.

Krasnodar (Dezember 2010)

Mit diesem Algorithmus hat Yandex gelernt, mit Hilfe der Spectrum Technologie die eigentliche Intention des Users zu verstehen. D.h. die Suchmaschine konnte auch bei Wörtern mit mehreren Bedeutungen verstehen, wonach der User tatsächlich sucht, und dadurch irrelevante Webseiten aus der Ergebnisliste ausschließen.

Reykjavik (August 2011)

Mit dem Suchalgorithmus Reykjavik konnte Yandex die bevorzugte Sprache des Users identifizieren und ihm anhand dieser Daten Ergebnisse in dieser Sprache zeigen.

Da sich die Ranking Formel für die Suche in Fremdsprachen eignete, wurde sie nach einer nicht russischen Stadt benannt.

Kaliningrad (Dezember 2012)

Der Suchalgorithmus Kaliningrad, der erst vor drei Monaten eingeführt wurde, hat den Usern von Yandex eine personalisierte Suche ermöglicht.

Im Unterschied zur personalisierten Suche von Google wurden bei Yandex nach den unternehmeneigenen Angaben etwa 75 bis 80% aller Suchergebnisse personalisiert, unabhängig davon, ob der User eingeloggt ist oder nicht.

Damit wollte Yandex die Bedürfnisse seiner User besser bedienen, da viele SEOs bereits gelernt haben, wie sie mit allen anderen Neuheiten der Suchmaschine umgehen sollen.

Rein statistisch gesehen gab es bis jetzt bei Yandex alle sechs bis zwölf Monate eine neue Ranking Formel, die manchmal die ganze SEO-Community im russischen Internet aus der Reihe gebracht hat.

Dublin (Mai 2013)

„Dublin“ – eine Modifikation von „Kaliningrad“, die im Frühling 2013 eingeführt wurde. Während Kaliningrad die Interessen der User in kurzfristige und langfristige einteilte, hat der neue Suchalgorithmus gelernt, auf die sofortigen Interessen zu reagieren, da das Update jede Paar Sekunden stattfand.

Ein Beispiel: wenn früher schon festgestellt wurde, dass ein User sich für Filme interessiert, jedoch kurzfristig auch Interesse für Geographie und Reisen zeigt, dann werden ihm für seine Suchanfrage“Madagaskar“ Ergebnisse für die Insel Madagaskar, und nicht für den gleichnamigen Animationsfilm gezeigt.

„Ostrowa“ (Juli 2013)

Im Sommer des gleichen Jahres annoncierte Yandex die „Inseln“ – die Änderung des Interface für die Suchergebnisse. Die wichtigste Neuerung der „Inseln“ sind seine interaktiven Blöcke, die in den Suchergebnissen angezeigt werden und mit dessen Inhalten man interagieren kann, ohne auf die jeweilige Webseite zu gehen.

Wenn man zum Beispiel den Titel eines Filmes in das Suchfeld eingibt, erscheinen dem User sofort die Zeiten der Vorstellungen des Filmes in den Kinos. Außerdem kann man jetzt direkt aus der Ausgabe der Suchergebnisse Flugtickets buchen, einen Termin mit einem Arzt vereinbaren, die Postlieferung verfolgen und einiges mehr. Das Unternehmen ging davon aus , dass die „Insel“ von den Website-Betreiber selbst erstellt werden.

Minusinsk (April 2015)

Am 15. April 2015 teilte Yandex mit, dass ab diesem Tag, Websites, die bisher SEO-Referenzen verwendet haben, niedriger rangiert werden können. Die Vertreter von Yandex begründeten diese Entscheidung damit, dass sie die Förderung des Ausbaus der Seite und ihres Interfaces seitens der Webseiten-Betreiber fördern wollen. Damit diese das Geld in eine Optimierung statt in den Kauf von Links investieren.

2014 führte Yandex ein Experiment durch und schaltete die Berücksichtigung von Links für das Ranking von Webseiten vollständig ab. Buchhaltung Links in der Rangliste für eine Reihe von kommerziellen Anfragen in Moskau abgeschnitten. In Yandex darauf hingewiesen, dass trotz dieser, die Verwendung solcher Links „weit verbreiteten Art von Spam bleibt.“

„In den letzten Jahren haben wir zielstrebig versucht die Auswirkungen der SEO-Links (gekauften Links) in der Rangliste einzugrenzen. Aber sie wurden weiterhin gekauft und es wurden Ressourcen ausgegeben, die sinnvoller eingesetzt werden konnten – z.B. in die Entwicklung der Website“, – teilte die Pressestelle von Yandex mit. Der richtige Weg laut Yandex lautet: Investitionen in Inhalt und Design, das heißt, Investitionen in Komfort und Originalität Ihrer Website.

Wladiwostok (Februar 2016)

Der Suchalgorithmus Wladiwostok ist durch die Einführung der Suchtechnologie, die einen Verifikationsprozess für volle Kompatibilität mit mobilen Geräten durchführt bekannt geworden. Yandex hat einen weiteren Schritt in Richtung mobile Nutzer gemacht. Speziell für sie wurde dieser Suchalgorithmus entwickelt. Für ein besseres Ranking in der mobilen Suche muss die Webseite mit Mobilgeräten kompatibel sein. Um höher als die Konkurrenten in den Suchergebnissen zu stehen, sollte die Webseite auf allen mobilen Geräten, sei es ein Tablet oder Smartphone, korrekt angezeigt werden. Wladiwostok prüfte das Vorhandensein von Java und Flash-Plugins, die Anpassungsfähigkeit der Inhalte auf die Größe des Bildschirms (die Breite der Textanzeige), die Lesbarkeit des Textes und die Bequemlichkeit der Betätigung der Links und Buttons.

Palekh (November 2016)

Am 02. November hat Yandex einen neuen Algorithmus mit dem Namen Palekh vorgestellt. Das Neue an diesem Algorithmus besteht in einer besseren Zuordnung von Longtail-Suchanfragen zu relevanten Dokumenten oder Ergebnissen. Palekh ermöchlicht der Suchmaschine von Yandex genauer zu verstehen, was die User mit Ihren Anfragen meinen. Dank Palekh findet die Suchmaschine, bessere Ergebnisse, die nicht nur den Schlüsselwörtern entsprechen, sondern auch inhaltlich zum Thema passen. Für den inhaltlichen Vergleich der Suchanfragen und der Webseiten ist ein Suchmodell auf Basis neuronaler Netze verantwortlich. Palekh bildet einen n-dimensionalen Vektorraum, der durch die Schlüsselwörter der Suchanfrage und durch die Wörter der Webseiten gebildet wird. Je näher die Vektoren der Suchanfrage und die der Dokumente zusammenliegen, desto relevanter sind die Letzten für die jeweilige Suchanfrage. Laut Yandex werden täglich etwa 100 Millionen unikale und seltene Suchanfragen gestellt. Der neue Algorithmus soll helfen diese schnell und vor allem richtig zu bearbeiten.

Die Technologie der semantischen Vektoren hat großes Potenzial.  Es können nicht nur Titel sondern ganze Texte in solchen Vektoren analysiert werden, sodass der gesamte Wortlaut der Dokumente erfasst wird. Dies wird den Abgleich der Suchanfragen mit den Webseiten noch genauer durchführen. Als semantischer Vektor kann auch ein Benutzerprofil im Internet dargestellt werden, er enthält Interessen, den Suchverlauf und die Übergänge. Ein entferntes, aber äußerst interessantes Ziel besteht darin, ein Modell auf Basis des neuronalen Netzwerks zu gestalten, das das semantische „Matching“ von Suchanfragen und Dokumenten auf dem Niveau des „Verstehens“ bearbeitet, vergleichbar mit dem Niveau eines Menschen.

0 Kommentare

Dein Kommentar

Want to join the discussion?
Feel free to contribute!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.