Vad är webbplatsindexering? Hur går det till? Du kan hitta svar på dessa och andra frågor i artikeln. Webbindexering (indexering i sökmotorer) är processen att lägga till information om en webbplats till databasen av en sökmotorrobot, som sedan används för att söka information om webbprojekt som har genomgått en sådan procedur.
Data om webbresurser består oftast av nyckelord, artiklar, länkar, dokument. Ljud, bilder och så vidare kan också indexeras. Det är känt att sökordsdetekteringsalgoritmen är beroende av sökmotorn.
Det finns en viss begränsning för typerna av indexerad information (flash-filer, javascript).
Initieringshantering
Indexering av en webbplats är en komplex process. För att hantera det (till exempel för att förbjuda bifogning av en viss sida) måste du använda robots.txt-filen och sådana instruktioner som Tillåt, Disallow, Crawl-delay, User-agent och andra.
Också, taggar och rekvisita används för indexering, döljer innehållet i resursen från Google och Yandex-robotar (Yahoo använder taggen).
I Goglles sökmotor indexeras nya webbplatser från ett par dagar till en vecka, och i Yandex - från en till fyra veckor.
Vill du att din webbplats ska visas i sökmotorernas resultatfrågor? Sedan måste det bearbetas av Rambler, Yandex, Google, Yahoo och så vidare. Du måste informera sökmotorer (spindlar, system) om att din webbplats finns, och sedan genomsöker de den helt eller delvis.
Många webbplatser har inte indexerats på flera år. Informationen som finns på dem ses inte av någon förutom deras ägare.
Bearbetningsmetoder
Indexering av en webbplats kan göras på flera sätt:
- Första alternativet är manuellt tillägg. Du måste ange din webbplatsdata genom särskilda formulär som erbjuds av sökmotorer.
- I det andra fallet hittar sökmotorroboten själv din webbplats genom länkar och indexerar den. Han kan hitta din webbplats genom länkar från andra resurser som leder till ditt projekt. Denna metod är den mest effektiva. Om en sökmotor hittar en webbplats på detta sätt, anser den att den är viktig.
Timing
Indexering av webbplatsen går inte för snabbt. Villkoren varierar, från 1-2 veckor. Länkar från auktoritativa resurser (med utmärkt PR och Titz) påskyndar avsevärt placeringen av webbplatsen i sökmotordatabasen. Idag anses Google vara det långsammaste, även om det fram till 2012 kunde göra det här jobbet på en vecka. TillTyvärr förändras saker väldigt snabbt. Det är känt att Mail.ru har arbetat med webbplatser i detta område i ungefär sex månader.
Indexering av en webbplats i sökmotorer är inte möjligt för alla specialister. Tidpunkten för att lägga till nya sidor i databasen för en webbplats som redan bearbetats av sökmotorer påverkas av hur ofta innehållet uppdateras. Om färsk information ständigt dyker upp på en resurs, anser systemet att den är ofta uppdaterad och användbar för människor. I det här fallet påskyndas hennes arbete.
Du kan följa indexeringen av en webbplats på särskilda avsnitt för webbansvariga eller på sökmotorer.
Changes
Så vi har redan listat ut hur sajten är indexerad. Det bör noteras att sökmotordatabaser uppdateras ofta. Därför kan antalet sidor i ditt projekt som läggs till dem ändras (både minska och öka) av följande skäl:
- sökmotorsanktioner mot webbplatsen;
- förekomsten av fel på webbplatsen;
- byta sökmotoralgoritmer;
- äckligt värdskap (otillgänglighet för servern där projektet ligger) och så vidare.
Yandex svar på vanliga frågor
"Yandex" är en sökmotor som används av många användare. Det ligger på femte plats bland världens söksystem när det gäller antalet behandlade forskningsförfrågningar. Om du har lagt till en webbplats till den kan det ta för lång tid att lägga till i databasen.
Att lägga till en URL garanterar inte dess indexering. Detta är bara en av metoderna som systemroboten får vetaom en ny resurs. Om det finns få eller inga länkar till en webbplats från andra webbplatser kan du hitta den snabbare om du lägger till den.
Om indexering inte inträffade måste du kontrollera om det fanns några fel på servern vid tidpunkten för att skapa en applikation för den från Yandex-roboten. Om servern rapporterar ett fel kommer roboten att avsluta sitt arbete och försöka slutföra det i en tur och retur. Yandex-anställda kan inte öka hastigheten för att lägga till sidor i sökmotordatabasen.
Indexering av en webbplats i Yandex är en ganska svår uppgift. Vet du inte hur man lägger till en resurs i en sökmotor? Om det finns länkar till den från andra webbplatser, behöver du inte lägga till en speciell webbplats - roboten kommer automatiskt att hitta den och indexera den. Om du inte har sådana länkar kan du använda formuläret "Lägg till URL" för att tala om för sökmotorn att webbplatsen finns.
Tänk på att att lägga till en webbadress inte garanterar att ditt skapande kommer att indexeras (eller indexeras).
Många undrar hur lång tid det tar att indexera en webbplats i Yandex. Anställda i detta företag ger inga garantier och förutser inte villkor. Eftersom roboten fick reda på sajten, dyker dess sidor i sökningen upp på två dagar, ibland på ett par veckor.
Process
"Yandex" är en sökmotor som kräver noggrannhet och uppmärksamhet. Webbplatsindexering består av tre delar:
- Sökrobot genomsöker resurssidor.
- Innehåll(innehåll) på webbplatsen registreras i söksystemets databas (index).
- Om 2-4 veckor, efter uppdatering av databasen, kan du se resultaten. Din webbplats kommer (eller kommer inte) att visas i sökresultaten.
Indexeringscheck
Hur kontrollerar jag webbplatsindexering? Det finns tre sätt att göra detta:
- Ange namnet på ditt företag i sökfältet (till exempel "Yandex") och kontrollera varje länk på den första och andra sidan. Om du hittar webbadressen till din idé där har roboten slutfört sin uppgift.
- Du kan ange din webbadress i sökfältet. Du kommer att kunna se hur många internetblad som visas, d.v.s. indexerade.
- Registrera dig på webbansvarigas sidor i Mail.ru, Google, Yandex. När du har klarat webbplatsverifieringen kommer du att kunna se indexeringsresultaten och andra sökmotortjänster som skapats för att förbättra prestandan för din resurs.
Varför misslyckas Yandex?
Indexering av en webbplats i Google görs på följande sätt: roboten anger alla sidor på webbplatsen i databasen, låg kvalitet och hög kvalitet, utan att välja. Men bara användbara dokument ingår i rankningen. Och "Yandex" utesluter omedelbart alla webbpapper. Den kan indexera vilken sida som helst, men sökmotorn kommer så småningom att eliminera allt skräp.
Båda systemen har ett inkrementellt index. Båda sidorna av låg kvalitet påverkar rankningen av webbplatsen som helhet. Det finns en enkel filosofi här. Favoritresurser för en vissanvändaren kommer att inta högre positioner i sin emission. Men samma person kommer att ha svårt att hitta en sida som han inte gillade förra gången.
Därför är det först och främst nödvändigt att täcka kopior av webbdokument från indexering, kontrollera om det finns tomma sidor och förhindra att innehåll av låg kvalitet indexeras.
Speed up Yandex
Hur kan jag påskynda webbplatsindexeringen i Yandex? Följ dessa steg:
- Installera Yandex-webbläsaren på din dator och använd den för att bläddra bland sidorna på webbplatsen.
- Bekräfta rättigheterna att hantera resursen i Yandex. Webmaster.
- Lägg upp en länk till artikeln på Twitter. Det är känt att Yandex har samarbetat med detta företag sedan 2012.
- Lägg till sökning från Yandex för webbplatsen. I avsnittet "Indexering" kan du ange dina egna webbadresser.
- Ange "Yandex. Metrica"-koden utan att bocka för "Att skicka in sidor för indexering är förbjudet".
- Producera en webbplatskarta som endast finns för roboten och som inte är synlig för publiken. Verifieringen börjar med honom. Webbplatskartans adress skrivs in i robots.txt eller i lämplig form i "Webmaster" - "Indexeringsinställningar" - "Webbplatskartfiler".
Mellanåtgärder
Vad behöver göras tills webbsidan indexeras av Yandex? Den inhemska sökmotorn bör betrakta webbplatsen som den primära källan. Det är därför som redan före publiceringen av artikeln är det absolut nödvändigt att lägga till dess innehåll i formen av "Specifika texter". Annatplagiatörer kommer att kopiera posten till sin resurs och kommer att vara den första i databasen. Som ett resultat kommer de att erkännas som författarna.
Google Database
För Google är samma rekommendationer som vi beskrev ovan lämpliga, bara tjänsterna kommer att vara annorlunda:
- Google+ (ersätter Twitter);
- Google Chrome;
- Google Tools for Programmers - "Scan" - "Look like Googlebot" - alternativet "Scan" - alternativet "Index";
- sök i en resurs från Google;
- Google Analytics (istället för Yandex. Metrics).
Förbud
Vad är ett förbud mot webbplatsindexering? Du kan lägga över den både på hela sidan och på en separat del av den (länk eller textbit). Faktum är att det finns både ett glob alt indexeringsförbud och ett lok alt. Hur implementeras det?
Låt oss överväga förbudet mot att lägga till en webbplats i sökmotordatabasen i Robots.txt. Genom att använda robots.txt-filen kan du utesluta indexering av en sida eller en hel resursrubrik så här:
- Användaragent:
- Disallow: /kolobok.html
- Disallow: /foto/
Den första punkten säger att instruktionerna är definierade för alla PS:er, den andra indikerar att indexering av filen kolobok.html är förbjuden, och den tredje tillåter inte att lägga till hela fotomappen i mappen databas. Om du behöver utesluta flera sidor eller mappar, vänligen ange dem alla i Robots.
För att förhindra indexering av ett visst internetark kan du använda robotens metatagg. Det skiljer sig från robots.txtdet faktum att det ger instruktioner till alla PS på en gång. Denna metatagg följer de allmänna principerna för html-formatet. Den ska placeras i rubriken på sidan mellan taggarna. En post för ett förbud kan till exempel skrivas så här:.
Ajax
Hur indexerar Yandex Ajax-webbplatser? Idag används Ajax-teknik av många webbutvecklare. Självklart har hon stor potential. Med den kan du skapa snabba och produktiva interaktiva webbsidor.
Sökmotorroboten "ser" dock webblistan annorlunda än användaren och webbläsaren. Till exempel tittar en person på ett bekvämt gränssnitt med rörligt laddade Internetark. För en sökrobot kan innehållet på samma sida vara tomt eller presenteras som resten av det statiska HTML-innehållet, för vilket skript inte fungerar.
Du kan använda en URL medför att skapa Ajax-webbplatser, men sökmotorn använder den inte. Vanligtvis separeras den del av URL:en efter. Detta måste beaktas. Därför, istället för en URL som https://site.ru/example, gör han en ansökan till huvudsidan för resursen som finns på https://site.ru. Detta innebär att innehållet i Internetarket kanske inte kommer in i databasen. Som ett resultat kommer det inte att visas i sökresultaten.
För att förbättra indexeringen av Ajax-webbplatser stödde Yandex ändringar i sökroboten och reglerna för bearbetning av webbadresserna till sådana webbplatser. Idag kan webbansvariga indikera för Yandex sökmotor behovet av indexering genom att skapa ett lämpligt schema i resursstrukturen. För detta behöver du:
- Byt ut symboleni webbadressen till sidornapå !. Nu kommer roboten att förstå att den kan ansöka om HTML-versionen av innehållet i detta internetark.
- HTML-version av innehållet på en sådan sida bör placeras på en URL där ! ersatt med ?_escaped_fragment_=.