Seznam zase vylepšil algoritmus

Je to už pár dní, co seznam vypustil zprávu, že znovu vylepšil svůj algoritmus. A my musíme zatleskat, právě na tohle jsme čekali. Taky vás rozčilovalo, že když jste publikovali na svém webu článek, tak Google váš článek zaindexoval během pár minut, ale Seznam třeba ani do týdne ne? Nyní by se to už stávat nemělo.

Kluci ze Seznamu zpřesnili plánování návštěv robota na webových stránkách. Databáze Seznamu aktuálně obsahuje přes 2,5 miliardy webových stránek a 2 miliardy obrázků. Což je docela úctyhodná velikost, ale robot denně prošel jenom 200 miliónu URL adres, kdy zjišťoval jaký obsah se zde nachází.

Seznam tedy nyní navýšil databázi o 80% a navýšil také kapacitu stahování a tím snížil návštěvu robota na pouhé dva dny ze čtyř dnů u předchozího algoritmu. Což je dle nás velké zlepšení, stále je ale pořád co zlepšovat.

Což samozřejmě neznamená, že nyní vaše stránky bude navštěvovat minimálně jednou za dva dny, ale bude to optimalizovat a vypočítávat podle určitých parametrů.

Seznam to komentuje takto:

Doba od změny stránky po stažení robotem je v tomto případě počítána jako vážený průměr, změřený na testovací množině, u které známe datum skutečné změny stránek. Použitá váha vyjadřuje důležitost stránky z pohledu SeznamBota.

Pozor: Tato změna se nijak nedotkne pořadí výsledků ve vyhledávání, jde pouze o rychlejší aktualizaci.

Přidat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

*
*