Hogyan működnek a keresőmotorok?
Ezzel az útmutatóval bevezetést nyújtunk a keresőmotorok működésébe. Kitérünk a lánctalálási és indexelési folyamatokra, valamint az olyan fogalmakra, mint a lánctalálási költségvetés és a PageRank.
A keresőmotorok úgy működnek, hogy több százmilliárd oldalt láncolnak át saját webes lánctalálók segítségével. Ezeket a webkúszókat általában keresőrobotoknak vagy pókoknak nevezik. A keresőmotor úgy navigál a weben, hogy weboldalakat tölt le, és az ezeken az oldalakon található linkeket követve új, elérhetővé tett oldalakat fedez fel.
A keresőmotor indexe
A keresőmotor által felfedezett weboldalak egy indexnek nevezett adatstruktúrába kerülnek.
Az index tartalmazza az összes felfedezett URL-t, valamint az egyes URL-ek tartalmára vonatkozó számos releváns kulcsjelzést, mint például:
- Az oldal tartalmában felfedezett kulcsszavak – milyen témákkal foglalkozik az oldal?
- A feltérképezett tartalom típusa (a Schema nevű mikroadatok segítségével) – mit tartalmaz az oldal?
- Az oldal frissessége – mennyire frissítették nemrég?
- Az oldal és/vagy a domain korábbi felhasználói elkötelezettsége – hogyan lépnek kapcsolatba az emberek az oldallal?
Mi a keresőmotor algoritmusának célja?
A keresőmotor algoritmusának célja, hogy olyan releváns, jó minőségű keresési találatokat mutasson be, amelyek a lehető leggyorsabban teljesítik a felhasználó lekérdezését/kérdését.
A felhasználó ezután kiválaszt egy lehetőséget a keresési találatok listájából, és ez a művelet, valamint a későbbi tevékenység a jövőbeni tanulságokba kerül, amelyek befolyásolhatják a keresőmotorok rangsorát a továbbiakban.
Mi történik a keresés végrehajtásakor?
Amikor a felhasználó beír egy keresőkérdést egy keresőmotorba, az indexből azonosítják az összes relevánsnak ítélt oldalt, és egy algoritmus segítségével hierarchikusan rangsorolják a releváns oldalakat egy találati sorba.
A legrelevánsabb találatok rangsorolásához használt algoritmusok keresőmotoronként eltérőek. Például egy oldal, amely egy keresési lekérdezésre a Google-ban magasan rangsorol, ugyanerre a lekérdezésre a Bing-ben nem biztos, hogy magasan rangsorol.
A keresési lekérdezésen kívül a keresőmotorok más releváns adatokat is felhasználnak az eredmények visszaadásához, többek között:
- Hely – Egyes keresési lekérdezések helyfüggőek, pl. ‘kávézók a közelemben’ vagy ‘mozi időpontok’.
- Nyelv észlelése – A keresőmotorok a felhasználó nyelvén adnak vissza eredményeket, ha az észlelhető.
- Korábbi keresési előzmények – A keresőmotorok a felhasználó korábbi kereséseinek függvényében különböző eredményeket adnak vissza egy lekérdezésre.
- Device – A different set of results may be returned based on the device from which the query was made.
Why Might a Page Not be Indexed?
There are a number of circumstances where a URL will not be indexed by a search engine. This may be due to:
- Robots.txt file exclusions – a file which tells search engines what they shouldn’t visit on your site.
- Directives on the webpage telling search engines not to index that page (noindex tag) or to index another similar page (canonical tag).
- Search engine algorithms judging the page to be of low quality, have thin content or contain duplicate content.
- The URL returning an error page (e.g. a 404 Not Found HTTP response code).
Next: Search Engine Crawling
Author
Sam Marsden
Sam Marsden is DeepCrawl’s SEO & Content Manager. Sam rendszeresen tart előadásokat marketingkonferenciákon, például az SMX-en és a BrightonSEO-n, és olyan iparági kiadványok munkatársa, mint a Search Engine Journal és a State of Digital.