Jak działają wyszukiwarki?

W tym przewodniku zamierzamy przedstawić Ci jak działają wyszukiwarki. Obejmie on procesy indeksowania i przeszukiwania, jak również pojęcia takie jak budżet na przeszukiwanie i PageRank.

Szukiwarki działają poprzez przeszukiwanie setek miliardów stron za pomocą własnych robotów indeksujących. Są one powszechnie określane jako boty lub pająki wyszukiwarek. Wyszukiwarka porusza się po sieci, pobierając strony internetowe i podążając za linkami na tych stronach, aby odkryć nowe strony, które zostały udostępnione.

Indeks wyszukiwarki

Strony, które zostały odkryte przez wyszukiwarkę, są dodawane do struktury danych zwanej indeksem.

Indeks zawiera wszystkie odkryte adresy URL wraz z szeregiem istotnych kluczowych sygnałów dotyczących zawartości każdego adresu URL, takich jak:

  • Słowa kluczowe odkryte w treści strony – jakie tematy porusza strona?
  • Typ treści, która jest indeksowana (przy użyciu mikrodanych zwanych Schema) – co jest zawarte na stronie?
  • Świeżość strony – jak niedawno była aktualizowana?
  • Poprzednie zaangażowanie użytkowników na stronie i/lub domenie – jak ludzie wchodzą w interakcję ze stroną?

Jaki jest cel algorytmu wyszukiwarki?

Celem algorytmu wyszukiwarki jest przedstawienie odpowiedniego zestawu wysokiej jakości wyników wyszukiwania, które spełnią zapytanie użytkownika tak szybko, jak to możliwe.

Użytkownik wybiera opcję z listy wyników wyszukiwania, a ta czynność, wraz z późniejszą aktywnością, jest uwzględniana w przyszłych wnioskach, które mogą mieć wpływ na rankingi wyszukiwarek.

Co się dzieje podczas wyszukiwania?

Gdy użytkownik wpisuje zapytanie do wyszukiwarki, wszystkie strony, które są uważane za istotne, są identyfikowane z indeksu, a algorytm jest używany do hierarchicznego uszeregowania odpowiednich stron w zestaw wyników.

Algorytmy używane do uszeregowania najbardziej istotnych wyników różnią się dla każdej wyszukiwarki. Na przykład strona, która zajmuje wysoką pozycję dla zapytania w Google, może nie zajmować wysokiej pozycji dla tego samego zapytania w Bing.

Oprócz zapytania wyszukiwarki używają innych istotnych danych, aby zwrócić wyniki, w tym:

  • Lokalizacja – Niektóre zapytania są zależne od lokalizacji, np. 'kawiarnie w pobliżu’ lub 'godziny seansów filmowych’.
  • Wykryty język – Wyszukiwarki zwrócą wyniki w języku użytkownika, jeśli można go wykryć.
  • Historia poprzednich wyszukiwań – Wyszukiwarki zwrócą różne wyniki dla zapytania w zależności od tego, czego użytkownik szukał wcześniej.
  • Device – A different set of results may be returned based on the device from which the query was made.

Why Might a Page Not be Indexed?

There are a number of circumstances where a URL will not be indexed by a search engine. This may be due to:

  • Robots.txt file exclusions – a file which tells search engines what they shouldn’t visit on your site.
  • Directives on the webpage telling search engines not to index that page (noindex tag) or to index another similar page (canonical tag).
  • Search engine algorithms judging the page to be of low quality, have thin content or contain duplicate content.
  • The URL returning an error page (e.g. a 404 Not Found HTTP response code).

Next: Search Engine Crawling

Author

Sam Marsden

Sam Marsden

Sam Marsden is DeepCrawl’s SEO & Content Manager. Sam regularnie przemawia na konferencjach marketingowych, takich jak SMX i BrightonSEO, i jest współpracownikiem publikacji branżowych, takich jak Search Engine Journal i State of Digital.