7.5.09

Urejanje rezultatov pri Googlu






Vas zanima kako Google ureja rezultate? Naj vam predstavim v čem je skrivnost.


Prvi korak je v preiskovanju in indeksiranju na biljone strani svetovnega spleta. To delo opravlja Googlebot, nekakšen spletni "pajek" , kateri se povezje s spletnimi strežniki, da bi s tem ulovil spletne dokumente. Strani, ki jih ulovi oštevilči, da bi se kasneje lahko ponovno vrnil nanje.

Naslednji korak je izgradnja indeksa. Namesto da bi poskenirali vsako besedo, ki jo vsebuje dokument, uredijo podatke, da bi poindeksirali njihove dokumente. Beseda "civil" naprimer, se lahkjo pojavi v dokumentih številka 3, 8, 22, 56, 68 in 92, medtem ko se beseda "war" pojavi v dokumentih pod zaporednimi številkami 2, 8, 15, 22, 68 in 77. Ko zgradijo indeks so pripravljeni na rangiranje dokumentov in odločanje kako relevantni so.

Predpostavimo, da neki googlov uporabnik išče po naslednjih ključnih besedah:" civil war". Da bi pravilno prezentirali rezultate na Googlu naredijo naslednji dve stvari:

1. Poiščejo set strani, ki nekje v svojem zapisu vsebujejo ključne besede, ki jih je uporabnik vpisal v iskalnik

2.Rangirajo ustrezne strani glede na njihovo relevantnost.

Google za samo rangiranje uporabja več faktorjev. Najbolj poznan izmed njih je PageRank . Le-ta evaluira dve stvari: Koliko strani na našo stran ima hiperpovezavo do naše strani ter kako kvalitetne so te strani. Google skuša po pravilu najti tiste strani, ki so tako ugledne kakor tudi relevantne. Ko končno naredijo seznam dokumentov in točk, ki so si jih le-ti pridobili, dodelijo največjo vrednost tistim, ki so si pridobili največ točk. Google nato doda še kratke izvlečke strani (snippets) sestavljene iz nekaj stavkov.

Končni rezultat je rangiran seznam URLjev s pripadajočimi izvlečki, ki ga posredujejo uporabniku, kot odgovor na njegovo poizvedbo.

Za vsako poizvedbo se aktivira čez 500 računalnikov, ki delujejo sočasno, z namenom da bi našli najboljše dokumente. Vse to pa se zgodi v času manj kot pol sekunde.

Prosti prevod (malo po Prešernu ;) ) s spletne strani:
http://www.google.com/librariancenter/articles/0512_01.html

1 komentar:

  1. Na naslovu http://www.vaughns-1-pagers.com/internet/google-ranking-factors.htm je objavljen seznam parametrov, ki naj bi jih Google uporabljal pri razvrščanju strani. Neuradno, naj bi upošteval več kot 300 različnih parametrov.

    OdgovoriIzbriši