A weboldal szerkezete és tartalma mellett szintén fontos terület oldal forrása, felépítése:
Egyedi, az adott aloldalhoz releváns címet jelent, amely általában 40-70 karakter között. A keresők számára az itt megjelenő kulcsszavak kiemelt fontosságúak, és egyben vizsgálják azt is, hogy mennyire releváns az adott oldal tartalmával. Továbbá ez a címsor jelenik meg a böngészők tetején:
és a keresőkben is:
A meta leírás ad egy rövid összefoglalót az adott oldal tartalmáról, kb. 160-200 karakterben. Míg az oldalcím néhány szó vagy kifejezés, itt 1-2 mondat vagy rövid bekezdés mehet. Ezt a tartalmat nem látják a felhasználók az oldalon, de a Google találati listáiban és facebook megosztásoknál is megjelenhet.
A meta kulcsszavakat 2009-től már nem veszi figyelembe a Google, de az oldalcímet és a meta leírást igen, és ezek a találati listákban is megjelenhetnek. Amennyiben ez nincs kitöltve, úgy a Google-re lesz bízva, hogy az oldal melyik részét helyezi be a leírásba, azonban nem biztos, hogy a megfelelő tartalmat fogja kiszedni belőle:
A WordPress, Joomla és hasonló rendszerek általában biztosítanak egy felületet a meta leírás megadásának is. Joomla-ban meg lehet adni egy globális meta leírást, amely akkor jelenik meg, ha pl. cikk esetében nincs kitöltve:
Cikkek, kategóriák esetén:
De léteznek olyan bővítmények is, amelyek a cikk elejét automatikusan beteszik a meta leírásba.
Szükségünk lehet arra, hogy a weboldalt, vagy annak egy bizonyos részét elrejthessük a keresők elől. Erre szolgál a robots.txt fájl. Ezt a fájlt közvetlenül a weboldal gyökérkönyvtárába kell helyezni (pl. http://adwordsblog.hu/robots.txt). Ha ez a fájl nem létezik, az azt jelenti a keresők számára, hogy a teljes tartalmat feltérképezhetik.
Amiket javasolt letiltani a keresők elől: admin felület, fejlesztés és tesztelés alatt lévő oldalak, keresési találatok oldala, stb. Az egyik legnagyobb típushiba, amikor egy új oldalt élesítenek, de elfelejtik átállítani, hogy mostantól feltérképezhető az oldal. Ezáltal még azok az oldalak is kikerülnek a találati listáról, amelyeket már korábban feltérképeztek a keresők (pl. régi weboldalról). A keresőkonzolban le lehet tesztelni, hogy az adott aloldalt tiltja-e a robots.txt fájl:
Továbbá, a keresőbe beírva a site: majd a saját Domain címet, a kereső megmutatja, hogy milyen tartalmakat, hány oldalt térképezett fel a Domain cím alatt. Teljes Domain kizárása esetén már itt is jelzi a kereső, hogy valószínűleg a robots.txt által lett letiltva a Domain. A site: jelölővel akár a weboldalon belüli keresés is megoldható: site:adwordsblog.hu seo esetén a Google az adwordsblog.hu weboldalon belül keresi és mutatja meg az "seo" szóra a találatokat.
Természetesen más módszerrel is le lehet tiltani a keresőket az oldalról, a legnagyobb tartalomkezelőknél akár admin felületről is át lehet állítani.
Jelentése:
Fórumoknál érdemes letiltani a követést, hiszen oda bármely felhasználó betehet linkeket, sőt a spam robotok is megpróbálnak linkeket elhelyezni ezeken a felületeken. És ha ezek rossz minőségű, problémás oldalakra mutatnak, az a saját weboldal megítélését is rontja.
Egy új aloldal esetén előfordul, hogy akár heteket is kell várni, mire megjelenik a találatok között (Ha nem mutat rá link, kicsi a forgalom, másolt, stb. esetén nem is biztos, hogy feltérképezi). Ennek gyorsítására érdemes betenni az oldaltérképbe is a linket, és jelezni a Google részére, hogy frissült. Ez megtehető a keresőkonzolból is (újraküldés), de akár közvetlen linken is: http://google.com/ping?sitemap=http://adwordsblog.hu/sitemap_index.xml ahol a sitemap= után az oldaltérkép linkje szerepel.
Másik módszer, mellyel gyorsítható az aloldal feltérképezése, ha közvetlenül elküldjük a Google részére a linket:
https://www.google.com/webmasters/tools/submit-url?continue=http://www.google.com/addurl/
Egy hosszabb cikknél általában van egy főcím és több alcím, ezek pedig hierarchiába rendezhetők:
Ez a felépítés segít jobban átlátni a tartalmat a felhasználóknak és a keresőknek egyaránt, és egészen 6 szint mélységig támogatják a hierarchiát. Mivel ezek nagyobb súllyal szerepelnek Google számára, így már a tartalom megírásánál is ügyelni kell a helyes használatára. A legtöbb weboldalon a cikk írására grafikus szerkesztőt használnak, így azoknál ez könnyen beállítható:
Mivel a weboldalaknál általában a cikk címe egyben a főcím is, ezért a grafikus felületen írt cikknél már alapból a fejléc 2-vel érdemes megadni az alcímeket.
Ha az oldal egyes részeit becímkézzük, azáltal a keresők sokkal alaposabban fel tudják térképezni az oldalt, cserébe a keresésekben is látványosabban tudja megjeleníteni az oldalt, amely több átkattintást hozhat. Számos címkézési típus létezik, ezek közül a leggyakoribbak: morzsamenük, keresés, receptek, termékek, értékelések, események, cikkek.
Az előző részben részletezett morzsamenüket becímkézve az alábbi módon jelenik meg a találati listában:
Keresés az oldalon belül: A nagyobb látogatottságú oldalaknál a Google kitesz egy keresősávot. Alapesetben, ha azon keresztül keresünk, akkor maradunk a Google keresőjében, de csak az oldalon belül ad vissza találatokat. A strukturális adatok segítségével megadható, hogy ha ezen keresztül indít egy felhasználó keresést, az egyből ugorjon át a saját weboldalra, és a weboldal keresőjének adja át a paramétereket, így a felhasználó a keresés által azonnal átkerül a weboldalra is
Receptek megjelenítése a keresőben képpel, elkészítési idővel, kalóriával:
A kereséseknél megjelenhetnek az értékelések, kritikák egyaránt, és a találatok között meglévő csillagok odavonzzák a figyelmet:
Termékeknél értékelések, ár, raktárkészlet, szállítási idő, stb:
Eseményeknél a legközelebbi időpontok kiemelése, linkekkel együtt:
Cikkek, hírek megjelölése, amelyekre külön is lehet keresni:
A bővített kártyák a strukturált adatoknak egy újabb, modernebb változata, amely mobilnézetben képes arra, hogy az aloldalakat galériaszerűen jelenítse meg.
Jelenleg támogatott típusok: receptek, események, termékek, értékelések, és az AMP oldalaknál a hírek.
Az AMP (Accelerated Mobile Pages) https://www.ampproject.org/ egy új szabvány, melynek célja, hogy a mobilokon villámgyorsan betöltődjenek az oldalak. Nagy előnye a gyors és egyszerű működés, a cikkek galériaszerűen jelennek meg, valamint a Google saját gyorsítótárában tárolódnak az adatok, azonban a gyorsaságért cserébe számos megkötés, korlátozás is érvényben van.
Az egyik legnagyobb korlátozás, hogy jelenleg natív űrlapokat még nem lehet használni az AMP oldalaknál (keresés, hírlevél feliratkozás, belépés, stb.), azonban még idénre várható, hogy bizonyos feltételekkel engedélyezni fogják, és utána várhatóan jelentősen megugrik az AMP oldalak aránya a weben.
Akár szándékosan, akár anélkül, de mást mutatni a keresőknek és a felhasználóknak komoly szankciókat von maga után. Sok esetben az oldal tulajdonosa nem is tud róla, hogy feltörték a weboldalt, legfeljebb csak annyit lát, hogy egyre kevesebb látogató érkezik a Google keresésekből, hátrább sorolódott. Amennyiben az oldal be van regisztrálva a Google keresőkonzoljába, úgy a Google emailben is értesíti az oldal kezelőjét, ha biztonsági hibát, kockázatot talált (pl. elavult rendszert használ), vagy ha valószínűleg feltörték az oldalt. Leggyakrabban nem kézzel, célzottan törik fel az oldalakat, hanem előre elkészített robotok, amelyek egy típushibát keresnek (pl. régi wordpress oldal, amely nem lett frissítve), és azon keresztül helyeznek el kódokat a weboldalon. Ha normál felhasználó nézi az oldalt, akkor minden tökéletesen működik, viszont ha a Google keresője térképezi fel, akkor megtalálja a betett kódokat (pl. számos, külső oldalra mutató link), vagy pedig egyszerűen átirányítja a keresőt egy másik weboldalra. Az alábbi példában, ha felhasználóként megyek az oldalra, akkor magyar nyelvű oldalt találok, de ha a Google keresője, akkor az alábbi oldalt látja helyette: