Błędy indeksowania występują, gdy wyszukiwarka próbuje dotrzeć do strony w twojej witrynie, ale się nie powiedzie. Indeksowanie to proces, w którym wyszukiwarka próbuje odwiedzić każdą stronę witryny za pośrednictwem bota. Bot wyszukiwarki znajdzie link do twojej witryny i zacznie od niej szukać wszystkich twoich publicznych stron.
Bot przeszukuje strony i indeksuje całą zawartość do wykorzystania w Google, a także dodaje wszystkie linki na tych stronach do stosu stron, które musi jeszcze zaindeksować. Twoim głównym celem jako właściciela witryny jest upewnienie się, że bot wyszukiwarki może uzyskać dostęp do wszystkich stron w witrynie. W przeciwnym razie zwracane są błędy, które nazywamy błędami indeksowania.
Twoim celem jest upewnienie się, że każdy link w Twojej witrynie prowadzi do rzeczywistej strony. Może to być przekierowanie 301, ale strona na samym końcu tego łącza powinna zawsze zwracać odpowiedź 200 OK serwera.
Google dzieli błędy indeksowania na dwie grupy:
- Błędy witryny. Nie chcesz tego, ponieważ oznacza to, że nie można zaindeksować całej witryny.
- Błędy URL. Te też nie chcesz, ale ponieważ dotyczą tylko jednego konkretnego adresu URL na błąd, są łatwiejsze do utrzymania i naprawy.
Omówmy to.
Błędy witryny
Błędy witryny to wszystkie błędy indeksowania, które uniemożliwiają botowi wyszukiwarki dostęp do twojej witryny. Może to być wiele przyczyn, które są najczęściej spotykane:
- Błędy DNS . Oznacza to, że wyszukiwarka nie może komunikować się z serwerem. Może to na przykład oznaczać, że twoja witryna nie może być odwiedzona. Zwykle jest to problem tymczasowy. Google wróci później do Twojej witryny i mimo to zaindeksuje twoją witrynę. Jeśli zauważysz to w swojej wyszukiwarce Google przy błędach indeksowania, prawdopodobnie oznacza to, że Google próbował kilka razy i nadal nie mógł tego zrobić.
- Błędy serwera . Jeśli Twoja konsola wyszukiwania pokazuje błędy serwera, oznacza to, że bot nie mógł uzyskać dostępu do Twojej witryny. Żądanie mogło przekroczyć limit czasu. Wyszukiwarka (fi) próbowała odwiedzić Twoją witrynę, ale załadowanie trwało tak długo, aż serwer wyświetlił komunikat o błędzie. Błędy serwera występują również wtedy, gdy w kodzie występują błędy uniemożliwiające załadowanie strony. Może to również oznaczać, że Twoja witryna ma tak wielu odwiedzających, że serwer nie mógł obsłużyć wszystkich żądań. Wiele z tych błędów jest zwracanych jako kody statusu 5xx, takie jak : 500 i 503 .
- Awaria robota . Przed zaindeksowaniem (fi) Googlebot próbuje także zindeksować plik robots.txt, aby sprawdzić, czy w twojej witrynie nie ma żadnych obszarów, które nie zostałyby zindeksowane. Jeśli to bot nie może dotrzeć do pliku robots.txt, Google odroczy crawl aż można dotrzeć do pliku robots.txt. Dlatego zawsze upewnij się, że jest dostępny.
To wyjaśnia odrobinę o błędach indeksowania związanych z całą witryną. Zobaczmy teraz, jakie rodzaje błędów indeksowania mogą wystąpić w przypadku konkretnych stron.
Błędy URL
Jak wspomniano, błędy URL-i odnoszą się do błędów indeksowania, które występują, gdy bot wyszukiwarki próbuje zaindeksować określoną stronę witryny. Kiedy omawiamy błędy adresów URL, najczęściej omawiamy błędy indeksowania, takie jak (miękkie) błędy 404 Not Found . Powinieneś często sprawdzać tego typu błędy (użyj Google Search Console lub narzędzi dla webmasterów Bing) i napraw je. Jeśli strona / temat tej strony rzeczywiście nie ma nigdy, aby powrócić na twoją stronę, podaj stronę 410. Jeśli masz podobną zawartość na innej stronie, użyj zamiast niej przekierowania 301. Upewnij się oczywiście, że mapa witryny i linki wewnętrzne są również aktualne.
Odkryliśmy, że wiele z tych błędów adresów URL jest spowodowanych przez linki wewnętrzne. Tak wiele z tych błędów jest twoją winą. Jeśli usuniesz stronę z witryny, dostosuj ją lub usuń. Te linki już nie mają zastosowania. Jeśli ten link pozostanie taki sam, bot go znajdzie i podąży za nim, tylko po to, aby znaleźć ślepy zaułek (błąd 404 Not found). Na twojej stronie. Musisz teraz wykonać pewne czynności konserwacyjne na swoich wewnętrznych linkach!
Wśród tych typowych błędów może być okazjonalny błąd DNS lub błąd serwera dla tego konkretnego adresu URL. Ponownie sprawdź ten adres URL później i sprawdź, czy błąd zniknął. Pamiętaj, aby użyć narzędzia Pobierz jako Google i oznaczyć błąd, który został naprawiony w Google Search Console, jeśli jest to twoje główne narzędzie monitorowania.
Bardzo konkretne błędy URL
Występują błędy URL, które dotyczą tylko niektórych witryn. Dlatego chciałbym je wymienić osobno:
- Błędy adresów URL związane z urządzeniami mobilnymi. Odnosi się to do błędów indeksowania specyficznych dla strony, które występują na nowoczesnym smartfonie. Jeśli masz responsywną stronę, jest mało prawdopodobne, że się pojawią. Być może właśnie dla tego kawałka zawartości Flash, którą chciałbyś już zastąpić. Jeśli utrzymujesz oddzielną komórkową subdomenę, taką jak m.example.com, możesz napotkać więcej błędów. Jest to spowodowane błędnymi przekierowaniami z witryny na komputery do witryny mobilnej. Być może niektóre witryny mobilne zostały zablokowane za pomocą linii w pliku robots.txt.
- Złośliwe oprogramowanie. Jeśli napotkasz błędy w swoich narzędziach dla webmasterów, oznacza to, że Bing lub Google wykrył złośliwe oprogramowanie pod tym adresem URL. Może to oznaczać, że oprogramowanie jest używane, na przykład, „do gromadzenia informacji chronionych lub ogólnie do zakłócania ich działania” ( Wikipedia ). Musisz zbadać tę stronę i usunąć złośliwe oprogramowanie.
- Błędy Google News. Istnieje kilka konkretnych błędów Google News. Istnieje dość lista tych możliwych błędów w dokumentacji Google, więc jeśli twoja witryna jest w Google News, możesz uzyskać te błędy indeksowania. Różnią się one od braku tytułu do błędów, które mówią, że twoja strona w ogóle nie zawiera artykułów. Pamiętaj, aby sprawdzić, czy dotyczy to Twojej witryny.
Napraw błędy indeksowania
Najważniejsze w tym artykule jest zdecydowanie: jeśli napotkasz błędy indeksowania, napraw je. Powinno to być częścią harmonogramu konserwacji witryny, aby od czasu do czasu sprawdzać błędy indeksowania.