Fragen Sie einen SEO: Warum werden meine Seiten entdeckt, aber nicht indiziert?
Die heutige Frage „Stellen Sie eine SEO“ kommt von Mandeep, der Probleme mit der Indexierung seiner Website hat.
Mandeep fragt:
„Wir haben eine Website neu gestaltet und einige neue Seiten hinzugefügt. Einige Seiten wurden erfolgreich indiziert, andere nicht.
Ich habe es mehrmals bei Google versucht, aber das funktioniert nicht. Während ich nun die URL zur Indexierung übermittle, wird über die Google Search Console dieser Fehler angezeigt: Entdeckt – derzeit nicht indexiert […]
Ich habe alles versucht, aber nichts hat funktioniert. Bitte helfen Sie mir, dieses Problem zu lösen.“
Diese Warnung stammt aus dem Abschnitt „Seiten“ des Berichts „Indexierung“ in der Google Search Console. Dieser Bericht gibt Nutzern Einblick in die Seiten, die Google gecrawlt und indiziert hat, und über die dabei möglicherweise aufgetretenen Probleme.
Der Bericht enthält Einzelheiten zu Seiten, die erfolgreich gecrawlt und indiziert wurden. Außerdem werden Gründe aufgeführt, warum die Seiten der Website nicht indiziert wurden.
Ist es ein Problem, wenn eine Seite nicht indiziert ist?
Die meisten Websites verfügen über Seiten, die nicht indiziert sind. Dies geschieht oft auf Wunsch des Website-Eigentümers.
Beispielsweise kann eine Seite mithilfe eines HTML-Tags „noindex“ auf der Seite absichtlich aus den Suchmaschinenindizes ausgeschlossen werden oder das Crawlen in der robots.txt-Datei wird blockiert.
In diesem Bericht werden URLs angezeigt, die absichtlich von der Indexierung ausgeschlossen wurden, sowie Seiten mit problematischen Indexierungsproblemen.
Im Allgemeinen kann es einige Zeit dauern, bis eine neue Seite einer Website gecrawlt und indexiert wird. Wenn es eine Weile dauert, bis eine neue Seite unter den „indizierten“ Seiten des Berichts angezeigt wird, ist dies nicht immer ein Anzeichen für ein Problem.
Nicht jeder Grund im Bericht „Warum Seiten nicht indiziert werden“ muss angesprochen werden.
Indexierungsprobleme
Google crawlt und indiziert nicht jede gefundene URL. Ihr Hauptanliegen als Website-Manager besteht darin, dass die Seiten, die Sie als Suchergebnis verfügbar haben möchten, indiziert werden.
Wenn sie nicht indiziert sind, kommen sie grundsätzlich nicht für die Platzierung in den Suchergebnissen in Frage.
Im Bericht „Warum Seiten nicht indiziert werden“ gibt es mehrere Gründe dafür Tun Schlagen Sie ein Problem auf der Website vor, das untersucht werden sollte. Zum Beispiel „Serverfehler (500)“ und „Soft 404“.
Diese Flags stellen möglicherweise nicht unbedingt ein Problem für die einzelnen URLs dar, wenn Sie diese nicht indizieren möchten, sie können jedoch auf ein umfassenderes Problem mit der Website hinweisen.
Was ist „entdeckt – derzeit nicht indiziert“?
„Entdeckt – derzeit nicht indiziert“ ist ein Fehler, den Google für URLs meldet, die ihm bekannt sind, die aber nicht indiziert wurden.
Es ist wichtig zu bedenken, dass URLs nicht in diesem Bucket erscheinen, wenn sie in einen anderen im Bericht passen.
Beispielsweise könnte eine Seite mit einem Noindex-Tag technisch gesehen von Google entdeckt und nicht indiziert worden sein, würde aber im Bucket „Ausgeschlossen durch ‚noindex‘-Tag“ erscheinen, sodass Seiten im Bucket „Entdeckt – derzeit nicht indiziert“ vorhanden sind aus einem anderen Grund.
Die Erklärung, die Google für eine URL gibt, die als „Entdeckt – derzeit nicht indiziert“ angezeigt wird, lautet:
„Die Seite wurde von Google gefunden, aber noch nicht gecrawlt. Normalerweise wollte Google die URL crawlen, es wurde jedoch erwartet, dass dies die Website überlasten würde. Daher hat Google den Crawl verschoben. Aus diesem Grund ist das Datum des letzten Crawls im Bericht leer.“
Google versucht, seine Bots gewissenhaft zum Crawlen zu bringen.
Das heißt, da der Googlebot nicht der einzige Besucher einer Website ist und möglicherweise einer von vielen Bots, die sie crawlen, möchte er die Website nicht zum Absturz bringen, indem er zu viele „Anfragen“ an den Server sendet.
Was könnte dazu führen, dass eine URL „entdeckt – derzeit nicht indiziert“ wird?
Es gibt zwei Hauptgründe, warum eine Seite Google bekannt, aber nicht indexiert ist. Details dazu gab John Muller im Jahr 2023 bekannt.
Im Wesentlichen wird neben den Bedenken hinsichtlich der Fähigkeit des Servers, dem Crawlen standzuhalten, auch die Seitenqualität berücksichtigt.
Wenn eine Seite nicht gecrawlt wurde, wie kann Google dann deren Qualität ermitteln? Nun ja, das geht nicht. Es kann Annahmen treffen, die auf der Qualität der Seiten an anderen Stellen der Website basieren.
Das ist richtig – dünne, doppelte Seiten mit geringem Wert an anderer Stelle Ihrer Website können die Indexierung Ihrer Kernseiten beeinträchtigen.
So beheben Sie das Problem
Es gibt keine schnelle Lösung, um eine Seite von „Entdeckt – derzeit nicht indiziert“ in „Indiziert“ zu verschieben, aber Sie können mehrere Lösungen ausprobieren.
Überprüfen Sie, ob die Seite tatsächlich indiziert ist
Die erste Anlaufstelle besteht darin, festzustellen, ob der Google Search Console-Bericht korrekt und aktuell ist.
In der oberen rechten Ecke des Berichts sehen Sie das Datum „Letzte Aktualisierung“. Dadurch erhalten Sie eine Vorstellung davon, ob der Bericht möglicherweise veraltet ist.
Gehen Sie als Nächstes zu Google und führen Sie einen aus Website:[yourwebsitedomain] inurl:[the URL slug of the page you want to index] suchen.
Wenn die Seite als Suchergebnis zurückgegeben wird, wissen Sie, dass sie tatsächlich indiziert ist.
Geben Sie dem Bericht etwas Zeit, um aktualisiert zu werden. Dann erscheint er im Abschnitt „Indiziert“ und nicht im Bericht „Entdeckt – derzeit nicht indiziert“.
Überprüfen Sie die Seitenqualität Ihrer Website
Als Nächstes möchten Sie möglicherweise die Gesamtqualität Ihrer Website berücksichtigen, da dies der Grund dafür sein könnte, dass Google Ihre Seite nicht indiziert.
Denken Sie daran, dass Qualität nicht nur ein Maß für die Wörter auf Ihrer Website, ihre Relevanz für Suchanfragen und den insgesamt angezeigten „EEAT“ ist. Stattdessen beschrieb es John Muller von Google wie folgt:
„Wenn es um die Qualität des Inhalts geht, meinen wir nicht nur den Text Ihrer Artikel.
Es kommt wirklich auf die Qualität Ihrer gesamten Website an.
Und das umfasst alles vom Layout bis zum Design.
Wie Sie Dinge auf Ihren Seiten präsentieren, wie Sie Bilder integrieren, wie Sie schnell arbeiten, all diese Faktoren spielen dort eine Rolle.“
Überprüfen Sie Ihre Website also unter Berücksichtigung dieser Kriterien. Wie ist die Qualität Ihrer Website im Vergleich zu der Ihrer Mitbewerber?
Ein gründlicher Website-Audit ist ein guter Anfang.
Suchen Sie nach doppelten Seiten
Manchmal verfügt eine Website möglicherweise über minderwertige oder doppelte Seiten, von denen der Website-Manager keine Kenntnis hat.
Beispielsweise kann eine Seite über mehrere URLs erreicht werden. Möglicherweise verfügen Sie über eine „Kontakt“-Seite, die sowohl auf exampledomain.com/contact-us als auch auf exampledomain.com/contact-us/ vorhanden ist.
Die URL mit und die URL ohne den „Trailing Slash“ werden vom Googlebot als separate Seiten betrachtet, wenn er beide Seiten erreichen kann und der Server einen Statuscode 200 zurückgibt. Das heißt, es handelt sich bei beiden um Live-Seiten.
Es besteht die Möglichkeit, dass alle Ihre Seiten auf die gleiche Weise dupliziert werden.
Möglicherweise enthält Ihre Website auch viele URL-Parameter, die Ihnen nicht bekannt sind. Dabei handelt es sich um URLs, die „Abfragezeichenfolgen“ enthalten, beispielsweise exampledomain.com/dress?colour=red.
Sie werden normalerweise durch Filter- und Sortieroptionen auf Ihrer Website verursacht. Auf einer E-Commerce-Website könnte dies wie eine Produktkategorieseite aussehen, die nach Kriterien wie Farbe gefiltert wird und nach Preis sortiert werden kann.
Dadurch ändern sich durch diese Filterung und Sortierung nicht die Hauptmerkmale der Seite, sondern nur die aufgelisteten Produkte. Hierbei handelt es sich um technisch getrennte, crawlbare Seiten, die möglicherweise viele Duplikate auf Ihrer Website verursachen.
Sie denken vielleicht, dass Ihre Website nur 100 hochwertige Seiten enthält. Aufgrund dieser technischen Probleme kann ein Googlebot jedoch Hunderttausende nahezu doppelte Seiten sehen.
Möglichkeiten zur Behebung von „Entdeckt – Derzeit nicht indiziert“
Sobald Sie die wahrscheinlichen Ursachen dafür identifiziert haben, dass Ihre URL nicht indexiert wird, können Sie versuchen, das Problem zu beheben.
Wenn Ihre Website doppelte Seiten, minderwertige, gelöschte Inhalte oder andere Qualitätsprobleme aufweist, sollten Sie hier ansetzen.
Als Nebeneffekt werden Sie wahrscheinlich feststellen, dass sich Ihr Ranking auf allen Seiten verbessert, während Sie an der Behebung dieser Probleme arbeiten.
Machen Sie die Bedeutung der Seite deutlich
Im Beispiel unserer Eröffnungsfrage gibt es eine bestimmte Seite, bei der Mandeep Schwierigkeiten hat, indexiert zu werden.
In diesem Szenario würde ich vorschlagen, zu versuchen, die Bedeutung der Seite in den Augen der Suchmaschinen zu stärken. Geben Sie ihnen einen Grund, es zu crawlen.
Fügen Sie die Seite zur XML-Sitemap der Website hinzu
Eine Möglichkeit, Google zu zeigen, dass es sich um eine wichtige Seite handelt, die es verdient, gecrawlt und indiziert zu werden, besteht darin, sie zur XML-Sitemap Ihrer Website hinzuzufügen.
Dies ist im Wesentlichen ein Wegweiser zu allen URLs, die Ihrer Meinung nach von Such-Bots gecrawlt werden sollten.
Denken Sie daran, dass der Googlebot bereits weiß, dass die Seite existiert. Es glaubt einfach nicht, dass es von Vorteil ist, es zu crawlen und zu indizieren.
Wenn es bereits in der XML-Sitemap enthalten ist, hören Sie hier nicht auf. Betrachten Sie diese nächsten Schritte.
Fügen Sie der Seite interne Links hinzu
Eine andere Möglichkeit, die Wichtigkeit einer Seite anzuzeigen, besteht darin, von internen Seiten der Website aus darauf zu verlinken.
Fügen Sie beispielsweise die Seite Ihrem primären Navigationssystem hinzu, z. B. das Hauptmenü.
Oder fügen Sie aus dem Text auf anderen Seiten Ihrer Website kontextbezogene Links hinzu. Diese signalisieren dem Googlebot, dass es sich um eine wichtige Seite Ihrer Website handelt.
Fügen Sie der Seite externe Links hinzu
Backlinks – sie sind ein grundlegender Bestandteil von SEO. Wir wissen seit einiger Zeit, dass Google Links von anderen Websites verwendet, um die Relevanz und Autorität einer Seite für ein Thema zu bestimmen.
Wenn Sie Schwierigkeiten haben, Google zu zeigen, dass Ihre Seite von ausreichender Qualität ist, um sie zu indexieren, können externe Links von seriösen, relevanten Websites, die darauf verweisen, den Wert der Seite zusätzlich bestätigen.
Wenn es sich bei der Seite, die Sie nur schwer indizieren lassen, um die Produktdetailseite eines bestimmten roten Kleids handelt, kann die Veröffentlichung der Seite dieses Kleids in einigen Modeblogs Google das Signal geben, dass es sich um eine qualitativ hochwertige Seite handelt.
Senden Sie es zum Crawlen
Nachdem Sie Änderungen an Ihrer Website vorgenommen haben, versuchen Sie, die Seite erneut zum Crawlen über die Google Search Console einzureichen.
Wenn Sie im Bericht „Indexierung“ der Google Search Console feststellen, dass sich die URL nach einiger Zeit immer noch im Bereich „Entdeckt – derzeit nicht gecrawlt“ befindet (es kann einige Tage bis einige Wochen dauern, bis Google eine übermittelte Seite crawlt). ), dann wissen Sie, dass Sie möglicherweise immer noch Probleme mit der Seite haben.
Zusammenfassend
Optimieren Sie Ihre Website für Crawling und Indexierung. Wenn Sie dies tun, werden Sie wahrscheinlich feststellen, dass diese Seiten von „Entdeckt – derzeit nicht indiziert“ zu „Indiziert“ wechseln.
Die Optimierung Ihrer speziellen Website erfordert eine eingehende Analyse der Gesamtqualität der Website und die Ermittlung, wie Sie dem Googlebot die Bedeutung der „Entdeckten – derzeit nicht indizierten“ Seiten vermitteln können.
Weitere Ressourcen:
- 14 Hauptgründe, warum Google Ihre Website nicht indiziert
- Vollständiger SEO-Leitfaden für die Google Search Console
- Stand der SEO 2025
Ausgewähltes Bild: Paulo Bobita/Search Engine Journal