Z Googlu unikl interní dokument pro hodnocení webů
V úterý Search Engine Land informoval o tom, že získal od
anonymního čtenáře tzv. Google
Search Quality Rating Guidelines. Tato verze je označena jako 3.18 a
je označena jako z března roku 2011. Dokument je PDF o 125 stránkách
a 2MB interních informací o hodnocení stránek při vyhledávání. Pokud se
nechcete brodit takovou záplavou informací, přečtěte si shrnutí na
stránkách PotPieGirl (v angličtině) nebo diskusi na Google+ profilu Barryho Schwartze. Podívejme se
nyní na pár příkladů, co se můžeme v zmíněném dokumentu dozvědět:
Ilustrativní grafika nás informuje o tom, jak v Googlu probíhá
proces změn algoritmu:
Google Panda Update
Zjistíte, že penalizace kterou ovlivnil Panda Update, ovlivní hodnocení
celého webu a ne jen zmíněné stránky (což není zas až tak
překvapující). Zajímavé je, že Panda Update je prý samostatný
algoritmus nepříliš závislý na samotném algoritmu vyhledávače
Google. Panda Update je spíše popisován jako hodnotící faktor
(ranking signal), což znamená, že Panda může každý web označit štítkem
(tag) pro klasického Googlebota, který, až půjde kolem, tento štítek
zaznamená a zpracuje. Spoustu dalších zajímavých věcí najdete přímo ve
zmiňovaném
dokumentu Google Search Quality Rating Guidelines handbook, pokud dojde
k jeho odstranění, napište nám v komentářích. Zdroje:
Autorem článku je Pavel Ungr
Díky za upozornění na zajímavý materiál.
Pro koho není SEO, algoritmy a jiná magie ;-) denní chleba, je rád, že se o velkém G něco dozví…
Na první pohled to jsou směrnice pro hodnotitele (Google říká „raters“, my v Seznamu říkáme „kalibrátoři“). Z těch se toho dozvědět moc nedá, protože se to dá vymyslet. Vyhledávač prostě potřebuje data pro testování algoritmů a potřebuje vycvičit lidi, jak výsledky hodnotit. V Seznamu máme něco hodně podobného, podobnou formou, s příklady, jenom stručnější. Například škatulky hodnocení máme úplně stejné, pouze Google má navíc škatulku „nehodnotitelné“. Na tomhle dokumentu je velmi zajímavá 4. kapitola, kde se rateři učí rozpoznávat spam. Je nutné si uvědomit, že toto nejsou kritéria, podle kterých pak Google spam rozpoznává (nebo dokonce bannuje), ale že to jsou pouze pokyny pro lidi, jak klasifikovat učící data. Teprve potom je podle těchto učících dat trénován nějaký model (ať už tvořený „ručně“, nebo pomocí strojového učení). Skutečně bombastické by bylo, kdyby Googlu uteklo něco o tom, jak se počítají konkrétní signály, které vstupují do výpočtu relevance nebo strojového učení. Všechno ostatní je v podstatě nezajímavé a tajné to je jenom pro formu. Ale pěkné čtení, díky za odkaz.
poučné čtení, už jsem si to poslal do kindlu a mám co číst :)
You must be very familiar with the task language and task location in order to represent the experience of users in your task location. If you do not have the knowledge to do this, please inform your employer.
:D
nestihl jsem to. :( Dokument už byl odstraněn. šlo by nějak zaslat mailem? díky.
Taky jsem to nestihl… Prosím e-mail :-)
i já bych poprosil na email
Petře, Kubo, Honzo – měli bychom mít nový odkaz, zkuste se podívat, zda vám funguje.
Funguje, to — díky moc Pavle!
Google Panda update n kdy te Farmer update je ozna eni ktere bylo p i azeno nejnov j i aktualizaci vyhledavaciho algoritmu Googlu. Dle slov samotneho Googlu tento update ovlivnil tem 12 v ech hledani… .Skute nost e Google Panda Farmer update nebyl jen jednou z mnoha minoritnich zm n dokazuje p ipad webu Mahalo.com.