Kopya İçerik: Sebepleri ve Çözümleri

Google gibi arama motorlarında sık yaşanan bir probleme değinmek istiyoruz. Bir çok kişi gibi biz de ona “kopya içerik” diyoruz. Dünya ise bu problem “duplicate content” olarak isimlendirilmiş. Kopya içeriğin anlamı ise aynı içeriğin birden fazla yerde (URL’de) barınıyor olması. Kopya içeriklerden yüzünden arama motorlar alakalı arama sonuçlarında hangi URL’e yer vermesi gerektiğini anlamakta zorluk çekiyor. Bu problem web sitenizin arama sonuçlarındaki potansiyelini öldürürken, kopya içeriklerinize verilen farklı farklı backlinkler ise sorunu daha büyük bir boyuta taşıyor.

Kopya içerik mevzusunu bir yol ayrımına benzetebiliriz. Geldiğiniz yolun sonunda bir yol ayrımındasınız ve aklınız da tek bir soru var: hangi yoldan gitmeliyim? Bir okuyucu olarak bu problemi direkt olarak yaşamayabilirsiniz. Çünkü siz oraya bir içeriği okumaya geldiniz ve kopya da olsa hangi içeriğe giderseniz gidin istediğinizi elde edebilirsiniz. Fakat bir arama motoru sonuçlarında hangisini göstereceğini seçmek zorunda ve aynı içeriği iki defa göstermeye genelde pek yanaşmaz.

Diyelim ki “kelime x” ile alakalı bir makaleniz siteadi.com/kelime-x adresinde yayınlanıyor. Daha sonra farkediyorsunuz ki aynı içeriğin kopyası bir de siteadi.com/kategori/kelime-x adresinde de yayında. Olmaz demeyelim, çünkü modern içerik yönetim sistemlerinde (CMS) böyle sorunlarla çok sık karşılaşılıyor. Şimdi işi biraz daha karmaşıklaştıralım. Kelime X hakkındaki makaleniz çok beğenildi ve insanlar bu makaleyi sosyal hesaplarından veya kendi bloglarından paylaşarak size backlinkler kazandırıyorlar. Fakat aynı içerik sitede iki farklı URL’de barındığı için bazıları ilk makaleye, bazıları da ikinci makaleye link veriyor. İşte bu nokta da arama motorları bildikleri en doğal yönteme başvuruyor: bu sizin probleminiz! Bu kopya içerik sizin probleminiz çünkü bu backlinkler farklı URL’lere yönlendiriliyor ve hepsinde aynı içerik barınıyor. Eğer bu backlinkleri tek bir URL’e almış olsaydınız, kelime-x aramasında çok daha sağlam bir yere sahip olabilirdiniz.

Kopya İçerik Oluşmasının Sebepleri

Web sitenizde kopya içerik problemi yaşamanızın binlerce sebebi olabilir. Bunların çoğu ise teknik sebepler: aynı içeriği iki defa farklı URL’lerde yayınlamak gibi bir hatayı yapmadığımızı varsayıyoruz. Problemlerin çoğu, genelde geliştiricilerin bir kullanıcı, web tarayıcısı ya da arama motoru örümceği gibi düşünmüyor olması. Az önceki örnekte olduğu gibi aynı makale hem siteadi.com/kelime-x hem de siteadi.com/kategori/kelime-x altında görüntüleniyor fakat web geliştiricinize sorduğunuzda panelde makalenin bir kez girildiğini ve problem olmadığını söylüyor. Bu sebeple web sitelerinde kopya içerik problemleri sık sık kontol edilmeli ve içerik yönetim sistemlerinde oluşacak hatalar için tetikte olunmalı.

URL Konseptini Yanlış Anlamak

Web geliştiriciniz delirdi mi? Hayır, yalnızca sizden farklı bir dil konuşuyor. Sahip olduğunuz web sitesini muhtemelen bir veri tabanı sistemi ile çalışıyor. Bu veri tabanında o makaleden yalnızca bir tane var fakat web sitesinin içerik yönetim sistemi makaleleri iki farklı URL’de yayınlıyor. Web geliştiricinize göre bu makalenin tanımlayıcısı sahip olduğu ID numarası, URL değil. Fakat arama motorları için URL, bir içeriği tanımlayan tek eşsiz şeydir. Eğer bunu web geliştiricinize açıklarsanız, problemi yavaş yavaş anlamaya başlayacaktır. Tabii bu makaleyi okumaya devam ederseniz, kendisine bir de çözüm önerebilirsiniz.

Oturum ID’leri

Hepiniz sürekli ziyaretçilerinizin hareketlerini takip etmek istiyorsunuz. Örneğin bir e-ticaret sitesi sahibi ziyaretçilerinin sepetine eklediği ürünleri takibe almak istiyor. Bir çoğunuz bunu biliyor olabilirsiniz ama bunu yapmak için onlara birer “oturum” vermeniz gerekiyor. Oturum, basit olarak ziyaretçinin siteizde yaptıklarının bir özeti ve bu özetin içinde sepetine eklediği ürünler de yer alıyor. Bu oturumları tanımlamak için onlara birer oturum ID’si verilirve bu ID’lerin bir yerde tutulması gereklidir. Oturum ID’lerini saklamanın en iyi yollarından biri çerezlerdir fakat arama motorları genellikle çerezleri tutmazlar.

Bu noktada bazı sisitemler oturum ID’lerini URL’de tutmayı tercih ederler. Bu, sitedeki her URL’in onu gezen kullanıcıya göre sonuna bir oturum ID’si parametresi eklenmesi anlamına geliyor. Yani siteadi.com/kelime-x makalesini görüntüleyen bir kullanıcı adres çubuğunda siteadi.com/kelime-x?=SessionID=394753 benzeri bir URL görüyor. Bu farklı parametreler arama motorları tarafından indexlendiğinde ise nur topu gibi bir probleminiz oluyor: kopya içerik!

Kendinizin de yanlışlıkla kopya içerik oluşturabileceğini unutmayın!

Takip ve Sıralama İçin Kullanılan URL Parametreleri

Kopya içerik oluşmasında etkili olan bir başka şey ise takip linklerinde vesaire kullanılan ve sayfa içeriğini değiştirmeyen URL parametreleri. Tahmin edebileceğiniz gibi siteadi.com/kelime-x ve siteadi.com/kelime-x/?source=rss arama motorları tarafından aynı URL olarak algılanmamaktadır. İkinci URL, web sitenize gelen kullanıcıların nereden geldiğini gösteriyor olabilir, fakat bu yapı Google tarafından indexlendiği takdirde arama sonuçlarındaki sıranızı olumsuz anlamda etkileyecektir. Bu da hiç görmek istemeyeceğimiz bir yan etki olur.

Bu yalnızca takip parametleri için geçerli değil. Sayfa üzerindeki içeriği değiştirmeyen her türlü parametre sitenizde aynı sorunu yaratabilir.

Kopyalayıcılar & İçerik Çekenler

Genellikle kopya içerik oluşmasının ana sebebi sizin veya sitenizin yaptığı hatalar olur. Fakat bu madde de durum biraz değişik. Bazı web siteleri, ürettiğiniz içerikleri alıp kendi sitelerinde de yayınlamak isteyebilirler. Bundan sizi haberdar etmeyebilecekleri gibi, kaynak olarak sitenize link de vermeyebilirler. Genellikle içeriğin orjinal sahibi daha güçlü olsa da, arama motorları bazen bu konuda garip durumlar oluşturabilirler. Çalıntı içerik sizden önde yer edinebilir, veya sizin sıralamanızı kötü etkileyebilir.

Web siteniz büyüdükçe daha fazla kişi sizden içerik çalmak isteyeceği için bu da dikkatli olunması gereken bir konu.

Parametrelerin Sırası

Web sitelerinin içerik yönetim sistemlerinin yaptığı en büyük hatalardan biri de temiz parametreli URL’ler yerine /?id=1&cat=2 gibi karmaşık parametreler kullanmalarıdır. Bu örnekte ID makaleyi, cat ise kategoriyi temsil etmekte. Bu sıralı parametre kullanım şeklinde /?id=1&cat=2 linkini /?cat=2&id=1 şeklinde değiştirsek de aynı sayfayı görüntüleriz. Fakat arama motorları bunları aynı içeriğe sahip iki farklı sayfa olarak değerlendirecektir. Bir de farklı sıralı parametreler ile farklı sitelerden linkler alırsak… İşte o zaman işimiz çok zorlaşacak.

Yorum Sayfalama

Çok sevdiğimiz içerik yönetim sistemi WordPress başta olmak üzere bir çok farklı CMS’de yorumları sayfalama opsiyonu bulunmakta. Bu, kullanılırken çok dikkat edilmesi gereken bir özellik. Nedeni ise şu: Bir makaleyi açıp okuduktan sonra yorumlar bölümünde ilk 10 yorumu gördüğümüzü varsayalım. Şuanda URL’imiz siteadi.com/kelime-x olarak adres çubuğunda gözüküyor. Ardından yorumların devamını okumak için ikinci yorum sayfasına tıklıyoruz ve bir 10 yorum daha geliyor. Ama o da ne? Aynı makale sayfada gözüküyor fakat URL şu şekle büründü: siteadi.com/kelime-x/comment-page-2. Buradan sonrasını herhalde tahmin edebiliyorsunuz. Nur topu gibi bir kopya içerik sorunumuz daha oldu.

Yazıcı Dostu Sayfalar

Türkiye’de çok görünmese de yazıcı dostu sayfalar bir dönem internete damga vurduğundan, onu da bahsetmeden geçmeyelim dedik. Eğer içerik yönetim sisteminiz yazıcı dostu sayfalar oluşturuyor ve sizlerde bu sayfalara içeriğinizde link veriyorsanız bir çok durumda Google bir şekilde bu sayfalara ulaşacaktır. Tamamen aynı içeriğe sahip olduklarından yeni bir kopya içerik problemine yol açabilirler.

WWW’lu vs. WWW’suz

Kitaptaki en eski kopya içerik numarası bu olsa gerek. Web sitenize hem WWW’lu, hem de WWW olmadan erişilebiliyor ve hepsi de kendi spesifik URL’inde siteyi görüntülüyorsa probleminiz çok büyük. Çünkü bir içerik değil, bütün sitenizin bir kopyası bulunmakta. Bunun daha az görüleni ise http hep https şeklinde yapılan ayrımdır.

Konsept Çözüm: Canonical URL

Yukarıda saydığımız bir çok maddede olduğu gibi aynı içeriğin farklı URL’lerde blunması büyük bir problem, fakat çözülmeyecek kadar büyük değil. Bu yolda öncelikle hangisinin doğru URL olduğuna karar vermeniz gerekiyor. Bunu herhalde kendiniz de anlayabilirsiniz. Ardında kopya olan sayfanın kaynak koduna doğru sayfanın URL’ini canonical etiketi olarak eklerseniz problemi kısa yoldan halletmiş olacaksınız.

Bildiğiniz gibi Google şuanda bu blogda da aktif olan AMP (Accelerated Mobile Pages) projesini yayınlamakta. Projenin amacı sitelere mobilden girildiğinde daha sade, hafif ve makaleye odaklı içeriğin görüntülendiği bi sayfayı google.com altında getirerek daha hızlı açılmasını sağlamak. Peki AMP ile oluşan hafif sayfa ile normal sayfamız kopya içerik olmuyor mu? Olmuyor, çünkü Google AMP ile oluşan her sayfaya canonical etiketini yerleştirerek doğru URL’in sitemizdeki URL olduğunu söylüyor.

Kopya İçerik Problemlerini Tespit Etmek

Web sitenizde kopya içerik sorunu yaşıyor fakat farketmiyor olabilirsiniz. Bu yüzden sizlere bu problemi tespit etmenizi kolaylaştıracak bir kaç yöntem göstermek istiyoruz.

Google Arama Konsolu

Google Arama Konsolu bir çok şey de olduğu gibi kopya içerikleri tespit etmede de oldukça faydalı bir araç. Google Search Console’da sol tarafta bulunan menüden Arama Görünümü > HTML Geliştirmeleri bölümüne giriş yaparasnız aşağıdaki tabloyla karşılaşacaksınız:

Eğer sitenizdeki bazı sayfalar için yenilenen başlık ya da yenilenen açıklama uyarıları varsa bunun iyi bir şey olmadığını bilmeniz gerekiyor. Bu uyarılara tıklamak yinelenen etiketlerin bulunduğu sayfaları görüntüleyeceğinden yüksek ihtimalle kopya içerik oluşturmuş sonuçları da elde edebileceksiniz. SEO Rehberi yazımızda da daha önce bahsettiğimiz gibi içerik kopya olmasa bile yinelenen başlık ve açıklamalarla da ayrıca ilgilenmelisiniz ama bu başka bir konu.

Başlık ve Kartlar ile Arama Yapmak

Kopya içerik gibi durumlarda size yardımcı olacak bir takım Google Arama Komutları bulunuyor. Eğer sitenizde “kelime x” anahtar kelimesini geçiren başlıkları bulmak isterseniz, Google üzerinde aşağıdaki aramayı gerçekleştirmeniz yeterli:

site:siteadi.com intitle:"kelime x"

Google size siteadi.com adresinde bulunan ve sayfa başlığında “kelime x” anahtar kelimesini geçiren bütün sayfaları getirecektir. Intitle kısmını ne kadar spesifikleştirirseniz, sonuçlarınızda o kadar garanti olacaktır. Aynı yöntemi sitenizden içerik alan siteleri tespit etmek için de kullanabilirsiniz. Diyelim ki makalenizin konusu “Kelime X Ne Demek” olsun. Bütün web de bu içeriği alanları bulmak için yapacağınız arama şu şekilde olmalı:

intitle:"kelime x ne demek"

Sonuç olarak Google size bu başlığı içeren bütün sitelerdeki sayfaları getirecektir. Daha kesin sonuçlar için yine tırnak işaretinin içerisine alarak yazınızdan spesifik cümleleri arayabilirsiniz. Bazı durumlarda arama sonuçlarının alt kısmında Google tarafından eklenmiş şöyle bir uyarı görebilirsiniz:

Bu, Google’in kopya içerikleri tespit ediğ, içerik hırsızlarını sonuçlardan kaldırmaya başladığının göstergesidir.

Kopya İçerik İçin Pratik Çözümler

Hangi URL’in içeriğinizin kanonik URL’i olduğuna karar verdiğinizde kanonikleştirme (Evet, söylemesi biraz zor.) sürecine başlayabilirsiniz. Bu basit olarak arama motorlarına doğru içeriğimizin hangisi olduğunu göstermek ve hızlıca bulunmasını sağlamak. Problemleri çözmenin dört yolu var:

Kopya İçerikten Kaçınmak

Yukarıda bahsettiğimiz bazı kopya içerik sebeplerinin çok basit çözümleri bulunmakta:

  • URL’de Oturum ID’si mi var?
    Bu durum genellikle sistem ayarlarından kapatılabilir.
  • Yazıcı dostu sayfalar konusu nasıl çözülür?
    Tamamen gereksiz bir özellik. Ya kapatın, ya da yazıcı stili sayfasından faydalanın.
  • WordPress’de yorum sayfaları nasıl kapatılır?
    WordPress panelinde bulunan Ayarlar > Tartışma bölümünden bu özelliği kapatabilirsiniz.
  • Parametre sıralama problemleri?
    Diğerlerine göre biraz daha uğraştıcı olan bu problemi çözmek için web geliştiricinizden parametreleri her daim aynı sırada oluşturacak bir script geliştirmesini isteyin.
  • Takip linki problemleri?
    Bir çok durumda parametre bazlı takip yerine hashtag bazlı kampanya takibinden faydalanabilirsiniz.
  • WWW’lu vs WWW’suz URL?
    Hangisini kullanacağınıza karar verdikten sonra birini diğerine 301 ile yönlendirin. Ayrıca Google Arama Konsolu üzerinden hangisini tercih ettiğinizi Google’a bildirebilirsiniz. Bunun için iki URL’i de doğrulamanız gerekmektedir.

Hedef kopya içeriğin tekrar oluşmasını engellemek olmalı. Böylece bunların hiç biriyle uğraşmak zorunda kalmayacaksınız.

Kopya İçeriği 301 ile Yönlendirme

Bazı durumlarda kullandığınız sistem kopya içerik oluşmasını engellemeye yetmeyebilir. Fakat onları her zaman doğru adrese yönlendirebilirsiniz. Web sitenizin htaccess dosyasına ekleyeceğiniz 301 yönlendirme kodları ile kopya içeriği kanonik olan doğru URL’e yönlendirirseniz hem siz, hemde Google baya rahatlayacaktır. Hatta .htaccess dosyasına eklenecek kod satırına da bir örnek verelim:

Redirect 301 /kopya-icerik www.siteadi.com/orijinal-icerik

Aynı kodu URL’ini değiştirdiğiniz sayfaların SEO değerini yenisine aktarmak için de kullanabilirsiniz.

Sayfada rel=”canonical” Link Kullanımı

Bazen kopya olarak oluşturulmuş içeriği silmek istemez ya da silemezsiniz. Bu gibi durumlar için arama motorları canonical URL isimli bi sistem geliştirdiler. Sayfanın <head> kısmına yerleştirilen bu kod şöyle gözüküyor:

<link rel="canonical" href="http://siteadi.com/kelime-x">

Bu kod yapısının href kısmına orijinal olan gerçek kanonik URL’i yazmamız gerekiyor. Ardından bu kodu kopya içeriğin bulunduğu sayfanın header bölümüne ekleyebiliriz. Bu aynı zamanda sayfada bulunan bütün SEO değerini kanonik sayfaya aktaracaktır.

Alternatife göre biraz daha yavaş olacak bu işlem yerine Google’dan John Mueller, 301 yönlendirmesinin tercih edilmesi konusunda insanları cesaretlendiriyor.

Orijnal İçeriğe Link Vermek

Eğer yukarıdaki işlemlerden hiç birini gerçekleştiremiyorsanız, kopya içeriğin içine orijinal sayfaya giden bir link yerleştirmek her zaman iyi bir fikirdir. Bu aynı zamanda RSS beslemelerinizde de kullanmak isteyeceğiniz bir yöntemdir. Böylece içeriklerinizi otomatik olarak çeken diğer siteler istemsizce size birer backlink kazandırmış olurlar. Ek olarak Google’ın hangi içeriğin orijinal olduğunu anlamasını da kolaylaştıracaktır.

Sonuç

Kopya içerik düzeltilebilir ve düzeltilmelidir.

Kopya içeriklerinizin tespit edilmesi ve düzeltilmesi konusunda yardıma ihtiyacınız olduğunu hissediyorsanız, bize ulaşmaktan çekinmeyin!

Yorumları Gör (1)

  • Makaleyi baştan sonra okudum. Teknik olarak çok faydalandığımı söylemek istiyorum. Teşekkürler.