Hogyan működnek a keresőmotorok?

július 3, 2021admin

Ezzel az útmutatóval bevezetést nyújtunk a keresőmotorok működésébe. Kitérünk a lánctalálási és indexelési folyamatokra, valamint az olyan fogalmakra, mint a lánctalálási költségvetés és a PageRank.

A keresőmotorok úgy működnek, hogy több százmilliárd oldalt láncolnak át saját webes lánctalálók segítségével. Ezeket a webkúszókat általában keresőrobotoknak vagy pókoknak nevezik. A keresőmotor úgy navigál a weben, hogy weboldalakat tölt le, és az ezeken az oldalakon található linkeket követve új, elérhetővé tett oldalakat fedez fel.

A keresőmotor indexe

A keresőmotor által felfedezett weboldalak egy indexnek nevezett adatstruktúrába kerülnek.

Az index tartalmazza az összes felfedezett URL-t, valamint az egyes URL-ek tartalmára vonatkozó számos releváns kulcsjelzést, mint például:

Az oldal tartalmában felfedezett kulcsszavak – milyen témákkal foglalkozik az oldal?
A feltérképezett tartalom típusa (a Schema nevű mikroadatok segítségével) – mit tartalmaz az oldal?
Az oldal frissessége – mennyire frissítették nemrég?
Az oldal és/vagy a domain korábbi felhasználói elkötelezettsége – hogyan lépnek kapcsolatba az emberek az oldallal?

Mi a keresőmotor algoritmusának célja?

A keresőmotor algoritmusának célja, hogy olyan releváns, jó minőségű keresési találatokat mutasson be, amelyek a lehető leggyorsabban teljesítik a felhasználó lekérdezését/kérdését.

A felhasználó ezután kiválaszt egy lehetőséget a keresési találatok listájából, és ez a művelet, valamint a későbbi tevékenység a jövőbeni tanulságokba kerül, amelyek befolyásolhatják a keresőmotorok rangsorát a továbbiakban.

Mi történik a keresés végrehajtásakor?

Amikor a felhasználó beír egy keresőkérdést egy keresőmotorba, az indexből azonosítják az összes relevánsnak ítélt oldalt, és egy algoritmus segítségével hierarchikusan rangsorolják a releváns oldalakat egy találati sorba.

A legrelevánsabb találatok rangsorolásához használt algoritmusok keresőmotoronként eltérőek. Például egy oldal, amely egy keresési lekérdezésre a Google-ban magasan rangsorol, ugyanerre a lekérdezésre a Bing-ben nem biztos, hogy magasan rangsorol.

A keresési lekérdezésen kívül a keresőmotorok más releváns adatokat is felhasználnak az eredmények visszaadásához, többek között:

Hely – Egyes keresési lekérdezések helyfüggőek, pl. ‘kávézók a közelemben’ vagy ‘mozi időpontok’.
Nyelv észlelése – A keresőmotorok a felhasználó nyelvén adnak vissza eredményeket, ha az észlelhető.
Korábbi keresési előzmények – A keresőmotorok a felhasználó korábbi kereséseinek függvényében különböző eredményeket adnak vissza egy lekérdezésre.
Device – A different set of results may be returned based on the device from which the query was made.

Why Might a Page Not be Indexed?

There are a number of circumstances where a URL will not be indexed by a search engine. This may be due to:

Robots.txt file exclusions – a file which tells search engines what they shouldn’t visit on your site.
Directives on the webpage telling search engines not to index that page (noindex tag) or to index another similar page (canonical tag).
Search engine algorithms judging the page to be of low quality, have thin content or contain duplicate content.
The URL returning an error page (e.g. a 404 Not Found HTTP response code).

Next: Search Engine Crawling

Author

Sam Marsden

Sam Marsden is DeepCrawl’s SEO & Content Manager. Sam rendszeresen tart előadásokat marketingkonferenciákon, például az SMX-en és a BrightonSEO-n, és olyan iparági kiadványok munkatársa, mint a Search Engine Journal és a State of Digital.