Duplicate Content – jak Google rozpoznaje zduplikowane treści?

Przez

Katarzyna Bogucka

17 sierpnia 2023

4161

Google nie lubi duplikatów, treści kopiowanych czy opisów powielanych na wielu stronach. Specjaliści SEO powtarzają to jak mantrę i mają w tym słuszność. Jednak skąd Google wie, która treść jest kopiowana, a która oryginalna, spośród stu stron o tej samej treści? No i dużo ważniejsze pytanie – którą z tych stu stron Google wskaże użytkownikowi na jego zapytanie? Odpowiedź brzmi: nie pierwszą, a najlepszą!

Spis treści

Czym jest duplicate content?

Wyobraź sobie, że jesteś na przyjęciu urodzinowym i dostajesz dwa identyczne prezenty od dwóch różnych osób. Oba prezenty wyglądają dokładnie tak samo i mają te same rzeczy w środku. Wtedy zaczynasz się zastanawiać, który prezent jest prawdziwy i który jest podróbką. To właśnie podobnie działa w świecie wyszukiwarek internetowych, takich jak Google, gdy chodzi o duplikowany content.

Duplicate content to sytuacja, w której ta sama treść lub bardzo podobna treść pojawia się na różnych stronach internetowych. To trochę jakby dwie strony internetowe miały te same słowa i obrazy.

Dlaczego duplicate content jest problemem?

Google i inne wyszukiwarki chcą pokazywać użytkownikom różnorodne i wartościowe wyniki. Jeśli wiele stron ma dokładnie taką samą treść, to może być mylące dla użytkowników. Wyszukiwarki chcą uniknąć pokazywania tych samych informacji w wielu wynikach.

Aby znaleźć powieloną treść na swojej stronie www, możesz wykorzystać jeden z poniższych sposobów:

Narzędzia do sprawdzania podobieństwa treści – skorzystaj z narzędzi online dostępnych do sprawdzania podobieństwa tekstu, np. Copyscape. Takie narzędzia porównują treść witryny do innych stron internetowych, pomagając zlokalizować potencjalne przypadki zduplikowanej zawartości.
Wyszukiwarki internetowe – skorzystaj z wyszukiwarek internetowych, wpisując fragmenty tekstu ze swojej strony w cudzysłowach. W ten sposób możesz sprawdzić, czy inne strony zawierają tę samą lub bardzo podobną treść.
Google Search Console – jeśli masz zarejestrowane swoje strony w Google Search Console, możesz użyć tego narzędzia do zidentyfikowania potencjalnych problemów zduplikowanej treści na Twojej stronie. Wejdź w zakładkę Strony, a następnie odnajdź błędy związane z duplikatami w sekcji “Dlaczego strony nie są zindeksowane“.

Przeczytaj również: SEO, a opinie klientów. Dlaczego warto o nie zadbać?

Co może się stać, jeśli mam powielony content na swojej stronie?

Jeśli twoja strona ma dużo powtarzającej się treści, Google może mieć problem z określeniem, która strona jest “oryginalna” i w którą warto kierować użytkowników. To może spowodować, że twoja strona będzie gorzej widoczna w wynikach wyszukiwania lub nawet zostanie całkowicie pominięta.

Czy to oznacza, że nie można mieć żadnych podobnych treści na stronie?

Nie do końca. Trochę podobieństwa między stronami nie jest problemem. Chodzi o to, aby unikać dosłownego kopiowania całych bloków tekstu lub stron w 100%. Lepiej jest tworzyć unikalne treści i prezentować informacje w swój sposób.

Jak uniknąć problemów z duplicate content?

Tworzenie oryginalnych treści to klucz. Jeśli masz podobne treści na różnych stronach, postaraj się dostosować je tak, aby były wyjątkowe i dodawały wartość dla użytkowników. Możesz też korzystać z odpowiednich oznaczeń, takich jak kanoniczne linki, aby wskazać, która wersja strony jest główna.

Jeśli jednak znalazłeś duplikaty zewnętrzne lub wewnętrzne na swojej stronie, powinieneś podjąć odpowiednie kroki:

Usuwanie lub redagowanie – jeśli zauważysz, że twoja strona zawiera zduplikowaną treść, najlepiej jest ją usunąć lub zmienić tak, aby była unikalna. Możesz też rozważyć połączenie różnych wersji zduplikowanych stron w jedną, bardziej kompleksową stronę.
Skorzystanie z kanonicznego tagu – w przypadku, gdy nie możesz usunąć zduplikowanej treści (np. na stronach e-commerce z produktami o podobnym opisie), możesz dodać tag kanoniczny (canonical). Jest to wskazanie dla wyszukiwarek, która wersja strony jest główna i powinna być preferowana w wynikach wyszukiwania.
Odmowa indeksowania – w pliku robots.txt możesz zadeklarować, że niektóre części strony nie powinny być indeksowane przez wyszukiwarki. To przydatne, gdy chcesz uniknąć indeksowania zduplikowanej treści, np. na stronach z wersjami językowymi.
Wniosek o usunięcie – jeśli inna strona internetowa zawiera twoją zduplikowaną treść i jest to naruszenie praw autorskich, możesz poprosić właściciela witryny o usunięcie treści. W skrajnych przypadkach możesz skorzystać z narzędzi do zgłaszania naruszeń w wyszukiwarkach.
Ustalenie priorytetów – jeśli masz wiele przypadków zduplikowanej treści, zidentyfikuj te o największym znaczeniu dla witryny i najpierw zajmij się nimi.

Przeczytaj również: Ranking stron internetowych – luty 2023

Oryginalność i unikalność w cenie!

Po pierwsze Google zawsze chętniej podpowie stronę, która ma treść unikalną i oryginalną – to wiemy od zawsze. Czyli samodzielnie stworzona treść opisująca np. usługę jest chętniej pokazywana w wynikach wyszukiwania, niż treść skopiowana z czyichś materiałów marketingowych. Widzimy jednak w Internecie, szczególnie w e-sklepach treści skopiowane, które mimo wszystko pojawiają się w wynikach wyszukiwania. Google woli treści oryginalne, ale na strony i content kopiowany również znalazł sposób.

Kto jeszcze stosuje kopiowane treści?

W kontekście prowadzenia bloga, czy strony WWW firm – kopiowanie treści od innych narusza prawo autorskie i prawa pokrewne, dlatego też nie jest często spotykane. Wróćmy jednak do przykładu z e-sklepami. Wszystkie księgarnie internetowe otrzymują te same materiały marketingowe z opisem książki, którą mają wprowadzić do swojej oferty. Kilka księgarń napisało własny autorski opis książki, a pozostałe skopiowały całą treść lub fragment, z otrzymanych materiałów. W efekcie tego na kilkudziesięciu podstronach pojawia się ta sama treść. Co więc Google bierze pod uwagę, by zadecydować, którą z tych niemalże identycznych stron zaprezentować na zapytanie użytkownika o konkretną książkę?

Przeczytaj również: November Core Update, czyli kolejne aktualizacje Google

Wybór najlepszej “kopii”

Google ocenia najpierw wiarygodność każdej kopii: źródła, prawa do publikacji, licencje, informacje o zawartych w treści cytatach, słowa kluczowe, ranking strony, autorstwo treści, tytuł, wydawcę, miejsce opublikowania, datę opublikowania, język i wiele innych. Drugim krokiem jest ocena różnych wersji tej samej treści i pomiar długości oryginalnego tekstu. Na podstawie tych dwóch wskaźników Google jest w stanie zróżnicować i ocenić kilkadziesiąt stron z niemalże identyczną treścią a nawet więcej: wybrać najlepszą, która jego zdaniem cechuje się największą wiarygodnością i użytecznością dla użytkownika.

Google nie chce, żeby użytkownik w wynikach wyszukiwania trafił na kilka wyników z rzędu, które zawierają tę samą treść i przedzierał się przez nie, dlatego też wykonuje tę pracę za niego. Serwuje najpierw wyniki niekopiowane, a potem najlepsze strony z tych skopiowanych. Warto zauważyć, że data publikacji jest tylko jednym z wielu wyznaczników wyboru najlepszej kopii, dlatego często to nie pierwszy tekst jest wyświetlany przez Google w wynikach wyszukiwania.

Koniec końców kopiowanie treści – poza tym, że jest nieetyczne i nie sprzyja optymalizacji strony – szkodzi zarówno kopiującym jak i kopiowanym.

Po więcej informacji zapraszam na SeobytheSea: http://www.seobythesea.com/2018/10/how-google-might-identify-primary-versions-of-duplicate-pages/