Přejít k obsahu  Přejít k hlavnímu menu

Firemní weblog poradenské společnosti H1.cz

Zobrazit všechny články
Zpět

IIS SEO Toolkit – nástroj na technickú a obsahovú analýzu webu



Bezproblémový prístup vyhľadávacích robotov k obsahu a jeho správna interpretácia patrí k základným pilierom SEO. Ak sa na vašom webe nachádzajú stovky či tisíce stránok, manuálna kontrola každej z nich by bola príliš zdĺhavá. Nástroj IIS SEO Toolkit prejde všetky stránky za vás, nazbierané dáta spracuje a poskytne úctyhodné množstvo reportov. Umožňuje vytvárať taktiež vlastné reporty, čo robí z IIS SEO Toolkit veľmi silný nástroj na analýzu webu.

Inštalácia a spustenie programu

  • Na stránke o SEO Toolkit nájdete odkaz na inštaláciu (zelené tlačidlo na pravej strane). Program sa nainštaluje prostredníctvom Microsoft Web Platform Installer.
  • Počas inštalácie budete pravdepodobne vyzvaní aj k inštalácii ďalších súčastí, bez ktorých nástroj nebude fungovať.
  • Po nainštalovaní spustíte SEO toolkit prostredníctvom ponuky „Start → All programs → IIS 7.0 Extensions → Search Engine Optimization (SEO) Toolkit 1.0“. Prípadne sa dá spustiť aj prostredníctvom IIS Managera, ktorého je SEO Toolkit súčasťou: V ponuke Start zadajte do vyhľadávacieho poľa príkaz „inetmgr“. Následne stačí v rozhraní IIS Manager spustiť „Search Engine Optimization“ (obrázok 1).
  • Novú analýzu vytvoríte v časti „Site Analysis“ kliknutím na „Create new analysis“ (obrázok 2).

Program funguje len na Windows Vista, Windows 7 a Windows Server 2008. Na Windows XP, Linuxe ani Mac OS bohužiaľ nefunguje. Umiestnenie Search Engine Optimization v IIS Manager

Obrázok č. 1: Umiestnenie Search Engine Optimization v IIS Manager

Vytvorenie novej analýzyObrázok č. 2: Vytvorenie novej analýzy

Nastavenia

  • Väčšinu nastavení môžete pozmeniť priamo pri vytváraní novej analýzy. Okrem jej pomenovania a zadania URL je potrebné nastaviť aj ďalšie možnosti v „Advanced Settings“.
  • „Maximum number of URLs“ určuje maximálny počet adries, ktoré nástroj prezrie. Pri obrovskom počte analyzovaných URL začína byť nástroj neobratný a pomalý, takže občas je vhodné rozdeliť analýzu na viacero častí, prípadne analyzovať len časť stránok. V jednej analýze by malo byť maximálne 100 000 až 200 000 stránok.
  • Zaškrtnutím možností Ignore nofollow atribute, resp. noindex meta tag, nástroj analyzuje aj URL adresy, na ktoré odkazujete s atribútom rel=“nofollow“, resp. majú v hlavičke (X)HTML dokumentu zakázanú indexáciu.
  • „Store copies of analyzed Web pages locally“ uloží obsah všetkých textových súborov na disk. To umožňuje zobraziť nedostatky odhalené nástrojom priamo v zdrojovom kóde. Taktiež sprístupní pokročilú analýzu obsahu (Word Analysis), ktorá zobrazuje kľúčové slová na stránkach a poskytuje aj ďalšie možnosti vo vytváraní reportov. Avšak pri ukladaní celého obsahu stránok sa mnohonásobne zvýši náročnosť na kapacitu a niektoré reporty môžu zaberať až niekoľko GB na disku.
  • V „Consider as internal link if coming from“ definujete, aký rozsah URL má nástroj analyzovať. Nastaviť môžete analýzu domény, subdomén, či konkrétny „priečinok“. Nie je možné presnejšie určiť, aké URL nástroj má, či nemá analyzovať. Avšak IIS SEO Toolkit plne rešpektuje inštrukcie v robots.txt. User agent sa označuje ako „iisbot“, takže ak chcete zakázať napríklad prístup robota k priečinku „dis“, robots.txt bude obsahovať:

    User-agent: iisbot
    Disallow: /dis 

Vytvorenie novej analýzy a úvodné nastaveniaObrázok č. 3: Vytvorenie novej analýzy a úvodné nastavenia

Niekoľko ďalších nastavení sa nachádza vo „Feature Settings“, ktoré nájdete vedľa zoznamu zhotovených analýz a kliknete na „Edit feature settings“ (obrázok 4).

Umiestnenie Obrázok č. 4: Umiestnenie „Edit Feature Settings“

Dôležitá je predovšetkým možnosť „Maximum Number Of Concurrent Requests“, ktorá určuje počet URL, ktoré sa spracovávajú naraz (maximálny počet je 20). Avšak vyšší počet požiadavkov neznamená vždy rýchlejšiu analýzu, pretože pri veľkom nápore je robot častejšie „odmietnutý“ a prehliadanie stránok robotom sa predlžuje. Preto ak máte pocit, že crawlovanie je veľmi pomalé, skúste znížiť počet požiadaviek a analýzu po krátkom čase spustiť znova. Ja mám hodnotu štandardne nastavenú na 8 konkurentných požiadaviek.

Ako pracuje SEO Toolkit robot (IISBot)

Presmerovania

  • Nasleduje presmerovania prostredníctvom stavových kódov 301, 302 a ďalších.
  • Rozpozná meta refresh
  • Nerozpozná žiadne JavaScriptové presmerovanie

Indexácia

  • Prechádza atribútom rel=“nofollow“, aj zákazom indexácie prostredníctvom meta noindex (ak to v nastaveniach povolíte)
  • Riadi sa inštrukciami v robots.txt. O URL adresách, ktoré IISBot nespracoval, vás informuje.

Ďalšie vlastnosti

  • Rozpozná použitie tzv. „Canonical tagu“. Avšak nástroj označí kanonickú URL adresu ako klasický odkaz, čo výrazne komplikuje kontrolu používania Canonical tagov.
  • Nasleduje aj URL adresy uvedené v XML mape stránok. Robot sám od seba nekontroluje štandardné umiestnenie sitemap.xml, resp. http://www.testovana-domena.com/sitemap.xml. Na mapu stránok musí viesť odkaz, alebo direktíva v robots.txt (Sitemap: sitemap.xml).
  • Poradí si len s kódovaním UTF-8. S Windows-1250 a ISO-8859–2 má problémy.

Reporting výsledkov

Nástroj ponúka rozsiahly počet preddefinovaných reportov, ktoré sa rozdeľujú na kategórie content (obsah), performance (výkon), links (odkazy) a violations (porušenia). Prvé 3 kategórie obsahujú množstvo základných reportov, ktoré sa využívajú pri technickej analýze webu. Napríklad report  externých odkazov, duplicitných stránok a podobne. Reporty môžete ľubovoľne modifikovať a vytvárať aj vlastné, prostredníctvom rozhrania „Query“. Napríklad ak chcete upraviť nejaký report, stačí kliknúť pravým tlačidlom do hornej časti reportu a vybrať možnosť „Open Query“ (obrázok 5). K vytváraniu vlastných reportov sa budeme podrobnejšie venovať v ďalšom článku o IIS SEO Toolkit. Analyzované stránky je možné vyexportovať aj priamo do CSV súboru a so získanými dátami pracovať napríklad v Exceli (obrázok 6).

Ako zvoliť modifikáciu reportuObrázok č. 5: Ako zvoliť modifikáciu reportu

Export dát do CSVObrázok č. 6: Export do CSV

V kategórii „Violations“ sa nachádzajú chyby, upozornenia a ďalšie dôležité informácie, ktoré by vám nemali uniknúť. Ak rozkliknete konkrétny nedostatok, zobrazia sa bližšie informácie o probléme vrátane odporúčania, ako ho odstrániť (obrázok 7).

Ukážka podrobností o nedostatkuObrázok č. 7: Ukážka podrobností o nedostatku

Avšak odporúčania sú všeobecné a nie je vždy vhodné riadiť sa nimi. V niektorých prípadoch môžu byť zavádzajúce, takže radšej ich berte s rezervou.

Ak pri podrobnostiach o nedostatku kliknete na záložku „Content“, zobrazí sa výber zdrojového kódu, v ktorom sa nedostatok nachádza (obrázok 8).

Ukážka zdrojového kódu s označeným nedostatkomObrázok č. 8: Ukážka zdrojového kódu s označeným nedostatkom

Dajú sa doprogramovať aj vlastné „Violations“. Zaujímavý úvod k vývoju vlastných rozšírení nájdete napr. v článku Carlosa Aguilar Maresa(podieľa sa priamo na vývoji IIS).

Prednosti nástroja

  • Veľmi rozsiahle množstvo analyzovaných dát.
  • Rozšíriteľnosť – vytváranie vlastných reportov, doprogramovanie rozšírení.
  • Robot sa chová veľmi podobne ako vyhľadávací roboti – rozpozná canonical tag, nasleduje XML mapu stránok a podobne.
  • Je zadarmo.

Nedostatky

  • Neporadí si s iným kódovaním ako UTF-8.
  • Funguje len na Windows Vista, Windows 7 a Windows Server 2008.
  • Poskytuje obmedzené nastavenia URL adries, ktoré majú byť analyzované.
  • Občas má problémy so stabilitou.

IIS SEO Toolkit poskytuje mnoho funkcií na rýchlu a rozsiahlu analýzu webu. Bohužiaľ sám si hádže polená pod nohy, keď si nedokáže poradiť s niektorými základnými prvkami webu, ako je napríklad kódovanie.

Autorem článku je Ján Januška.

  • Adam Fendrych
    13. 07. 2011 / 10:36

    Přiznám se, že jsem tak rozmazlený, že článek nečtu jen proto, že je slovensky. Škoda.

  • Štěpán Vraný
    13. 07. 2011 / 11:20

    Adam Fendrych: Zvláštní, mám stejný problém. Na jakémkoliv české portálu slovenské články přeskakuji …

  • Anna Češková
    13. 07. 2011 / 12:43

    Tak ještě můžete použít GoogleTranslate ;-)

  • Tomáš
    13. 07. 2011 / 13:53

    Dobrý den, nahodou jsem zabrousil na tento článek a sjel až dolů na zajímavou diskuzi. Jako překladatel z češtiny do slovenštiny mám radost, protoze mi neubude práce ;-) Google Translator moc nedoporučuju ani pro překlady do slovenštiny, špatně se to čte. Ale mohu vám vyhovět a přeložit vám ho, ale zadarmo to nebude :-)

  • Kabibara
    22. 07. 2011 / 02:27

    Mám rád recenze ušetří čas. Diky. btw slovensky je fajn lepší jak český blábolení že?

  • Tomek
    21. 09. 2011 / 12:50

    Překlad do češtiny: http://bit.ly/qevMRi

  • Maros Bajla
    21. 09. 2011 / 14:53

    dobry clanok, akurat hladam rozne nastroje na spravu webstranok a dosledovanie zmien na nich. vyskusam aj tento. inac fajn tool je aj seo spyglass alebo ibp. vacsinou ale kazdy seo tool ma aj nevyhody. cize treba pouzivat rozne nastroje na rozne veci.

  • Martin
    21. 09. 2011 / 16:04

    Komentáře mě fakt pobavily :-). Já jsem si prohlédl jenom obrázky – ale na druhou stranu by to nemuselo být špatné :-)

  • Marek Lecián
    27. 02. 2015 / 10:33

    Instalace Microsoft SEO ToolKit na Windows 8.1 64bit Super SEO crawler, který nainstalovat na Windows 8.1 64Bit je UX peklo. Návod k instalaci. http://mareklecian.cz/…windows-8-1/

RSS feed komentářů k tomuto článku
RSS feed komentářů ke všem článkům



(nebude zveřejněn)



Položky označené * jsou povinné