Hogyan működnek a keresőmotorok?

Ezzel az útmutatóval bevezetést nyújtunk a keresőmotorok működésébe. Kitérünk a lánctalálási és indexelési folyamatokra, valamint az olyan fogalmakra, mint a lánctalálási költségvetés és a PageRank.

A keresőmotorok úgy működnek, hogy több százmilliárd oldalt láncolnak át saját webes lánctalálók segítségével. Ezeket a webkúszókat általában keresőrobotoknak vagy pókoknak nevezik. A keresőmotor úgy navigál a weben, hogy weboldalakat tölt le, és az ezeken az oldalakon található linkeket követve új, elérhetővé tett oldalakat fedez fel.

A keresőmotor indexe

A keresőmotor által felfedezett weboldalak egy indexnek nevezett adatstruktúrába kerülnek.

Az index tartalmazza az összes felfedezett URL-t, valamint az egyes URL-ek tartalmára vonatkozó számos releváns kulcsjelzést, mint például:

  • Az oldal tartalmában felfedezett kulcsszavak – milyen témákkal foglalkozik az oldal?
  • A feltérképezett tartalom típusa (a Schema nevű mikroadatok segítségével) – mit tartalmaz az oldal?
  • Az oldal frissessége – mennyire frissítették nemrég?
  • Az oldal és/vagy a domain korábbi felhasználói elkötelezettsége – hogyan lépnek kapcsolatba az emberek az oldallal?

Mi a keresőmotor algoritmusának célja?

A keresőmotor algoritmusának célja, hogy olyan releváns, jó minőségű keresési találatokat mutasson be, amelyek a lehető leggyorsabban teljesítik a felhasználó lekérdezését/kérdését.

A felhasználó ezután kiválaszt egy lehetőséget a keresési találatok listájából, és ez a művelet, valamint a későbbi tevékenység a jövőbeni tanulságokba kerül, amelyek befolyásolhatják a keresőmotorok rangsorát a továbbiakban.

Mi történik a keresés végrehajtásakor?

Amikor a felhasználó beír egy keresőkérdést egy keresőmotorba, az indexből azonosítják az összes relevánsnak ítélt oldalt, és egy algoritmus segítségével hierarchikusan rangsorolják a releváns oldalakat egy találati sorba.

A legrelevánsabb találatok rangsorolásához használt algoritmusok keresőmotoronként eltérőek. Például egy oldal, amely egy keresési lekérdezésre a Google-ban magasan rangsorol, ugyanerre a lekérdezésre a Bing-ben nem biztos, hogy magasan rangsorol.

A keresési lekérdezésen kívül a keresőmotorok más releváns adatokat is felhasználnak az eredmények visszaadásához, többek között:

  • Hely – Egyes keresési lekérdezések helyfüggőek, pl. ‘kávézók a közelemben’ vagy ‘mozi időpontok’.
  • Nyelv észlelése – A keresőmotorok a felhasználó nyelvén adnak vissza eredményeket, ha az észlelhető.
  • Korábbi keresési előzmények – A keresőmotorok a felhasználó korábbi kereséseinek függvényében különböző eredményeket adnak vissza egy lekérdezésre.
  • Device – A different set of results may be returned based on the device from which the query was made.

Why Might a Page Not be Indexed?

There are a number of circumstances where a URL will not be indexed by a search engine. This may be due to:

  • Robots.txt file exclusions – a file which tells search engines what they shouldn’t visit on your site.
  • Directives on the webpage telling search engines not to index that page (noindex tag) or to index another similar page (canonical tag).
  • Search engine algorithms judging the page to be of low quality, have thin content or contain duplicate content.
  • The URL returning an error page (e.g. a 404 Not Found HTTP response code).

Next: Search Engine Crawling

Author

Sam Marsden

Sam Marsden

Sam Marsden is DeepCrawl’s SEO & Content Manager. Sam rendszeresen tart előadásokat marketingkonferenciákon, például az SMX-en és a BrightonSEO-n, és olyan iparági kiadványok munkatársa, mint a Search Engine Journal és a State of Digital.