Conținut duplicat - află cât de mult rău poate crea pentru un site

Este crucial ca toți proprietarii unui site să înțeleagă că republicarea unor postări, descrieri de produs, comunicate de presă sau știri preluate duplicat pot face ca paginile site-ului propriu să lupte serios pentru o poziționare înaltă în rezultatele Google.

Regula de bază în situația preluării unui conținut deja-existent de pe alte site-uri este de zero așteptări în poziționări înalte în motorul Google și nici un fel de clasare în cazul în care se utilizează conținut copiat, fără nici un pic de valoare adăugată.

Pentru a înțelege mai bine toate acestea este important să se cunoască ce înseamnă cu exactitate conținutul duplicat.

Duplicate content, în traducere liberă conținut duplicat se referă la acea situație când un conținut apare în mai mult de un singur loc pe internet, în interiorul altui site, sau altei pagini. Aici este vorba de o locație cu o adresă unică de web (URL).

Conținutul duplicat dă bătăi de cap motoarelor de căutare deoarece nu se știe pe care dintre versiuni să includă sau să excludă din indici, sau pe care dintre variantele duplicate să direcționeze link metrics (autoritate, încredere, textul ancoră - anchor text, link equity etc.). Cel mai greu este să se găsească versiunea cea mai relevantă pentru clasarea în căutările online, având în vedere că toate versiunile sunt aproape identice.

În concluzie, conținutul duplicitar este văzut ca fiind problematic și pentru SEO (Search Engine Optimization) deoarece motoarele de căutare încearcă să evite similaritatea conținutului în rezultatele de căutare pentru a nu compromite experiența utilizatorului.

Și astfel proprietarii de site-uri pot suferi pierderi de trafic și de poziționare în rezultatele online datorită încercării motoarelor de căutare de a oferi cea mai bună experiență utilizatorilor, prin alegerea acelei versiuni care este considerată ca fiind cel mai bun rezultat. Rar se oferă versiuni multiple ale aceluiași conținut, ceea ce duce la diluarea vizibilității celorlalte duplicate, printre care se poate afla chiar și conținutul original.

Tipuri de conținut duplicat

Variații ale URL-ului:

Aici se poate lua ca exemplu migrația unui site HTTP către HTTPS. Dacă versiunea veche HTTP este încă indexată înseamnă că pentru Google există deja un duplicat, paginile vechi și cele migrate. Trebuie redirecţionate toate paginile de la HTTP la HTTPS pentru a elimina conținutul duplicat.

Este comun ca pentru un site public să existe mai multe tipuri de pagini sau conținut duplicat care au ca și cauze tehnice următoarele aspecte:

paginile www comparativ cu cele non-www. Trebuie optat pentru afișarea URL-urilor cu sau fără www. Oricare variantă este optimă doar să fie una.

paginile care generează URL unic atunci când sunt vizitate (URL-uri generate dinamic)

Pagini cu parametrii de variație ex: /produse?filtru=rosu

Tăieturi finale (Trailing slashes) ex: /produse sau /produse/

Pagini Printer-friendly, pagini care afișează doar textul unei pagini destinat imprimării

Conținut fragmentat:

Există un număr ridicat de site-uri care utilizează aceleași paragrafe sau blocuri de text pe multiple pagini. Aici avem ca exemplu site-urile eCommerce în care pentru un produs de o culoare diferită se utilizează același text ca și pentru celălalt produs (de exemplu o piesă de mobilier pe alb și alta pe verde). Iar atunci când Google scanează întreg site-ul va vedea mai multe tipuri de pagini cu același conținut. Este recomandat să particularizăm textele fiecărui produs.

Conținut furat:

Este numele dat situației în care un site fură, copiază același conținut de pe un alt site. În momentul când Google încearcă să indexeze două pagini diferite, dar care au același conținut devine foarte confuz. O astfel de situație se poate întâmpla în cazul blog-urilor, dar și altor tipuri de texte apărute în online.

Efectele negative ale conținutului duplicat

Din orice perspectivă este privit, un conținut duplicat nu are deloc beneficii. Consecințele unui conținut duplicat duc la final către aceleași rezultate: crawl budget și link-uri echitabile diluate (dilute link equity).

Crawl budget poate fi definit ca numărul de URL-uri scanate de Googlebot pe o durată de timp. Asta înseamnă că Google scanează doar o anumită cantitate de pagină de fiecare dată când se uită peste site. Într-o asemenea circumstanță Google poate să piardă bugetul de scanare pe multiplele versiuni ale aceleiași pagini în loc să scaneze de la început paginile valoroase pentru clasificare în rezultatele căutărilor. Un astfel de scenariu poate deveni problematic pentru site, orice site are reală nevoie de crawl budget pentru a-şi poziționa paginile cât mai sus.

Link-urile echitabile ajung să fie diluate pentru că și alte site-uri ajung să aleagă din mai multe variante de conținuturi duplicate. Când un site are probleme de conținut duplicat asta poate însemna că acolo pot fi mai multe versiuni ale aceleiași pagini care primesc link-uri înapoi.

În situația în care un conținut dintr-un site reușește să atragă atenția utilizatorilor din care să câștige 20 de link-uri de legătură (backlinks), din cauză că alte trei site-uri au preluat același conținut, duce la împărțirea numărului de link-uri de legătură între toate patru. Astfel, în loc să primească echitabil toate cele 20 de link-uri articolul original, acum totul se împarte și cu celelalte trei pagini care au copiat articolul.

Sfaturi tehnice despre cum se pot remedia problemele de conținut duplicat

Prin intermediul scanner-ului COPYSCAPE se poate afla conținutul preluat de pe o pagină din site-ul https://www.copyscape.com/

Și în cazul conținutului duplicat se pot lua câteva măsuri de rezolvare. Vom prezenta câteva dintre cele mai simple și de efect soluții:

301 Redirects

Prin setarea redirecționării 301 de la pagina duplicat spre cea originală, toți vizitatorii sunt returnați spre conținutul original. Un alt avantaj al acestei măsuri este că ajunge să transfere un procent de 90 până la 99% din link-uri echitabile.

Tag-uri canonice

Când o pagină are probleme de conținut duplicat datorate variațiilor de URL-uri, atunci tactica tag-urilor canonice este cea de efect. Un tag canonic spune motorului Google care pagină dintre acele URL-uri este defapt originala, cea care ar trebui să dețină toate link-urile echitabile.

În ceea ce privește tag-urie canonice, acestea nu redirecționează vizitatorii spre URL-ul original, dar din punct de vedere al SEO, îndeplinește scopul de a trece mai departe echitatea link-ului către URL-ul specificat.

Robots.txt/Noindex Tags

Cea mai veche soluție împotriva conținutului duplicat prin care se adaugă URL-ul duplicat către robots.txt file pentru ca Google să vadă care dintre paginile specifice nu se doresc indexate. La fel, noindex tags îndeplinesc un plan similar, singura diferență este dată de faptul că aici sunt adăugate în codul unei pagini specifice. Beneficiul suprem al acestei metode este că înlătură complet URL-urile duplicate din rezultatele Google.

Un dezavantaj care nu poate fi trecut cu vederea este că aceste soluții nu trec peste echitatea linkului paginii originale. Din acest motiv cea mai bună practică rămâne alegerea tag-urilor canonice pentru paginile duplicate.

Indiferent pe ce domeniu se axează un site este indicat să dețină cât mai mult conținut unic și de calitate. Dacă întâmpinați dificultăți la acest capitol, LiveCOM Cluj poate asigura servicii de content şi copywriting specializat în asigurarea conținutului optim pentru site-ul tău sau servicii SEO pentru auditul şi remedierea tehnică a problemelor de optimizare.

< Anterior		Următor >

Articol publicat în Articole și noutăți Miercuri, 18 Aprilie 2018

Conținut duplicat - află cât de mult rău poate crea pentru un site

Tipuri de conținut duplicat

Efectele negative ale conținutului duplicat

Sfaturi tehnice despre cum se pot remedia problemele de conținut duplicat

Ai aflat informații interesante?

Abonează-te la newsletter şi îți vom trimite noutățile.