Računalnik in jaz: Google
Ko želimo na internetu nekaj poiskati, se nas skoraj večina odpravi na spletno stran Google.
Na spletni strani www.google.com ali www.google.si najdemo poleg iskalnika še vrsto drugih zelo uporabnih pripomočkov. Med najbolj uporabne seveda sodijo GMail za delo z elektorsko pošto, pa Picasa, za urejanje slik in fotografij, Google Earth, ki omogoča interaktivno popotovanje po svetu, in pa Google Maps, ki nudi iskanje lokacij na zemljevidu, kjerkoli na svetu. Poleg tega pa je na izbiro še mnogo drugih koristnih programov od finančnih pripomočkov, preko pripomočkov za urejanje zdravstvenih podatkov, pa vse do orodij za pisanje blogov in vodenje koledarja. Do vseh teh dodatkov pridete tako, da na Googlovi spletni strani izberete povezavo »About Google« ali slovensko »Vse o Googlu«, kjer nato izberete »Google Services and Tools«, slovensko »Googlove Storitve in Orodja«.
Google je začel s svojim delovanjem že leta 1996 kot projekt spletnega iskalnika, ki sta ga razvijala stanfordska študenta Larry Page in Sergey Brin. Iskalnik je deloval na naslovu http://google.stanford.edu, leta 1997 pa je bila registrirana domena google.com. Leto kasneje pa je bilo ustanovljeno istoimensko podjetje.
Google iskalnik vsebuje tri dele, vsak del posebej je del distribucijske mreže tisočih poceni računalnikov, ki sočasno opravljajo vzporedno procesiranje, kar pomeni metodo, v kateri je mnogo izračunavanj opravljenih vzporedno, kar omogoča hitrejše procesiranje. Google iskalnik je sestavljen iz modula »Googlebot«, ki je spletni iskalec, ki samodejno išče nove spletne strani, modula »Indexer«, ki shrani vsako besedo na vsaki strani, kar posledično naredi ogromno podatkovno bazo, in modula »Query processor«, ki primerja naše želeno iskanje s svojo podatkovno bazo in izpiše zadetke dokumentov, v katerih je našel omenjene ali podobne izraze.
Kako sploh deluje Google? Googlebot je iskalni robot, ki poišče strani na svetovnem spletu in jih preda Google Indexer-ju. Po navadi si Googlebot predstavljamo kot majhnega pajka, ki pleza po mreži svetovnega spleta, ampak v resnici Googlebot deluje podobno kot naš spletni brskalnik, se pravi pošilja pakete z zahtevami strežniku, na katerem je spletna stran, shrani celotno stran ter jo preda Google Indexer-ju. Googlebot z velikim številom računalnikov išče spletne strani veliko hitreje kakor naš internetni iskalnik. Hkrati lahko pregleduje tudi več tisoč strani.
Googlebot preda Indekserju popolna besedila ter naslove strani, kjer jih je našel. Ta besedila Indekser shrani v podatkovno bazo. Ta indeks je razvrščen po abecedi. Za izboljšanje iskanja Google ne upošteva pogostih besed ali angleško »stop words«, kot so »the«, »is«, »on«, »or«, »of«, »how«, »why«, kot tudi ne enomestnih številk ali znakov. Indexer tudi ignorira odvečne presledke ter velike in male črke zaradi hitrejšega delovanja.
Query processor ima več različnih delov. Vključuje uporabniški vmesnik ali iskalnik, kjer sistem preveri naš vpis in vpise v podatkovni bazi. Google vsebuje več kot sto faktorjev, s katerimi ugotavlja, kateri dokumenti so najbolj primerni za prikaz. Prve so prikazane strani, ki imajo najvišjo obiskanost ter jih razvrsti po strani od najbolj podobnih do manj podobnih. Google si naše vpise zapisuje in s tem nadgrajuje svoj sistem. Tako nam lahko ponudi rezultate, kakršne so iskali tudi ljudje pred nami, ki so vnesli enako ali podobno besedo. Internetni strežnik pošlje naš vpis »Index serverju«, ki je drugi del Query processorja. Vsebina v Index sserverju je podobna kazalu na koncu knjige, saj pove, katera stran vsebuje določene besede. Naš vpis potuje do strežnika dokumentov, ki dejansko vrne shranjene dokumente. Generira se kratek povzetek, ki opisuje vsako iskanje.
Z Googlom je naše življenje na internetu lažje. Poleg Googla so na voljo še drugi iskalniki, a nobenemu še ni uspelo premagati Googla.