آموزش وردپرس
خانه / سئو و بهینه سازی سایت / آموزش گام به گام / چالش ها و راهکارهای محتوای تکراری
seo-panda-duplicate-content

چالش ها و راهکارهای محتوای تکراری

مشکلی که اکثر وب سایتها با آن مواجه هستند محتوای تکراری است. وب سایتهای بزرگ با صدها صفحه بیشتر در معرض این مشکل هستند. اما تعریف دقیق محتوای تکراری چیست؟ و چرا مشکل ساز میشوند و چگونه از بروز این مشکل جلوگیری کنیم؟ در این مقاله سعی خواهیم کرد تا به این پرسشها پاسخ دهیم.

چالش-ها-و-راهکارهای-محتوای-تکراری

منظور از محتوای تکراری چیست؟

منظور از محتوای تکراری دو یا چند صفحه وب یکسان با URL های گوناگون میباشد. گوگل هر URL را یک صفحه جداگانه در نظر میگیرد. به طور مثال از نظر گوگل دو آدرس زیر که هر دو به یک صفحه وب اشاره میکنند، دو صفحه جداگانه محسوب میشوند:

  • http://website.com/shirts/red
  • http://website.com/shirts/red?order=asc

آدرس اول فهرستی از تمامی تی شرتهای قرمز رنگ یک فروشگاه پوشاک آنلاین میباشد و آدرس دوم همان صفحه میباشد اما آیتم های آن بر اساس قیمت طبقه بندی شده اند. متاسفانه از دید گوگل این دو آدرس با وجود اینکه محتوای آنها یکسان میباشد دو صفحه جداگانه محسوب میشوند.

چگونه محتوای تکراری به سئو سایت آسیب می رساند؟

محتوای تکرار موتورهای جستجو را گیج می کنند. زیرا تشخیص اینکه کدام صفحه با عبارت جستجو ارتباط بیشتری دارد مشکل میباشد. برای بالا نگه داشتن کیفیت نتایج جستجو گوگل هیچگاه دو صفحه یکسان را در SERP فهرست نمیکند.

مشکل دیگری که محتوای تکراری ایجاد میکنند در رتبه بندی صفحات با محتوای تکراری است. به این صورت که امتیازی که گوگل باید به صفحه اصلی بدهد بین صفحات تکراری تقسیم میشود که خود باعث پایین آمدن ترافیک صفحه از طریق موتورهای جستجو خواهد شد.

محتوای تکراری چگونه ایجاد میشوند؟

محتوای تکراری چه به صورت اتفاقی و چه به صورت هدفمند ایجاد شده باشند نتیجه یکسان خواهد بود. کاهش ترافیک ورودی از موتورهای جستجو. به طور مثال فرض کنید صفحه ای در رابطه با مشخصات فنی یک محصول داریم، همچنین این صفحه دارای یک نسخه چاپی میباشد. زمانی که نسخه چاپی توسط گوگل ایندکس شود مشکل محتوای تکراری ایجاد میشود. زیرا دو صفحه با محتوای یکسان داریم که یکی مناسب برای صفحه مانیتور میباشد و دیگری مناسب برای چاپ.

به طرق مختلفی محتوای تکراری به صورت اتفاقی ایجاد میشوند، که مهمترین آنها در زیر فهرست شده اند:

  • Session IDs
  • گزینه های سورت
  • پارامترهای URL
  • نام دامنه ها

Session IDs

Session Id ها متغییرهایی هستند که از آنها برای پیگیری رفتار بازدید کنندگان استفاده میشود و معمولا حاوی اعداد و کاراکترهایی است که به صورت تصادفی و یکتا ایجاد میشوند. بیشترین کاربرد آنها در فروشگاه های اینترنتی برای ذخیره محتوای سبد خرید کاربران میباشد. Session Id های به دو طریق حفظ میشوند یا با استفاده از cookie ها و یا با استفاده از پارامترهای URL که روش دوم به علت اینکه کاربران میتوانند با تغییر تنظیمات بروزر خود از ذخیره cookie ها جلوگیری کنند، بیشتر مورد استفاده قرار میگیرد. به طور مثال:

http://website.com/?sessionid=5678476

مشکل Session ID ها کاملا واضح هست شاید در یک روز بتوانند صدها و یا هزارها صفحه کاملاً جداگانه از نظر گوگل با محتوای تکراری ایجاد کنند. راه حل استفاده ذخیره Session Id ها در cookie میباشد و بهتر است که در صفحه ورودی وب سایت به کاربران اعلام شود که سایت برای عملکرد درست نیاز به ذخیره cookie در بروزر آنها دارد.

پارامتراهای رشته ای

معمولاً برای عملیات سورت از پارامترهای رشته ای در URL صفحه استفاد میشود به طور مثال:

http://website.com/category?sort=asc

در مثال بالا محتویات صفحه یکسان میباشند و تنها سورت آنها متفاوت میباشد. اما راه حل جلوگیری از ایجاد محتوای تکراری از طریق پارامترها چیست؟ برای حل این مشکل چند روش وجود دارد روش اول ذخیره پارامترهای در cookie میباشد. روش دوم ارسال پارامترها در request header میباشد که هر دو روش باید با استفاده از اسکریپت در کد کلاینت پیاده سازی شوند. راه سوم استفاده از فن آوری AJAX میباشد که به طور مثال اگر فهرستی از محصولات را میخواهید سورت کنید request را با استفاده از AJAX به سرور بفرستید و نتایج دریافتی از سرور را با استفاده از اسکریپتها در صفحه جایگزین کنید.

نام دامنه

شاید در وحله اول عجیب به نظر برسد و این سوال در ذهن شما ایجاد شود که نام دامنه چگونه میتواند باعث ایجاد محتوای تکراری شود؟ به مثال زیر توجه کنید:

  • http://website.com
  • http://www.website.com

در مثال بالا هر دو URL به صفحه اصلی سایت اشاره میکنند اما از نظر موتورهای جستجو دو آدرس جداگانه هستند. همین وضعیت برای تمامی صفحات سایت نیز صادق هست. تکنیکهای حل این نوع مشکل محتوای تکراری در پایان این مقاله بررسی میشوند.

روشهای شناسایی محتوای تکراری

با چگونگی پیدایش محتوای تکراری آشنا شدیم حال به معرفی ابزارهای موجود برای شناسایی آنها خواهیم پرداخت.

یکی از ساده ترین ابزارهای موجود برای شناسایی محتوای تکراری استفاده از Google Webmaster Tools میباشد. به این صورت که با استفاده از منوی سمت چپ در قسمت Optiomization گزنیه HTML Improvements را انتخاب کنید. در این بخش فهرستی از صفحات با عنواین تکراری ارائه میشوند که به احتمال زیاد همان صفحات با محتوای تکراری میباشند.

google-webmaster

راه دیگر برای فهمیدن اینکه سایتی دارای محتوای تکراری است استفاده از فرمان site:-search command در فرم جستجو گوگل میباشد. به این صورت که شما در فرم جستجو گوگل نام دامین سایت خود را با استفاده از فرمان site: جستجو میکنید (site:psi-co.net) و در صورتی که پیغام زیر در صفحه نتایج آمد این احتما وجود دارد که سایت شما دارای محتوای تکراری است.

In order to show you the most relevant results, we have omitted some entries…

از دیگر ابزار موجود برای پیدا کردن محتوای تکراری میتوان به Xenu و Screaming Frog اشاره کرد.

حل مشکلات ناشی از محتوای تکراری

برای هر مشکلی راه حلی هست. خوشبختانه برای رفع مشکلات ناشی از محتوای تکراری چند راه حل وجود دارد که بررسی آنها می پردازیم.

301 Redirect

ساده ترین راه برای جلوگیری از ایندکس شدن محتوای تکراری توسط موتورهای جستجو استفاده از 301 Redirect میباشد. به این ترتیب کاربران و کرالرهای موتورهای جستجو به صفحه اصلی هدایت میشوند و در نتیجه تمامی Link juice به صفحه اصلی تعلق میگیرد.

توجه داشته باشید که با پیاده سازی این روش در IIS و یا Apache کپی های صفحه قابل دسترس نخواهند بود. اگر میخواهید نسخه های تکراری همچنان در دسترس باشند بهتر است از روش زیر استفاده کنید.

Rel=canonical

راه دیگر برای مشخص کردن محتوای تکراری برای موتورهای جستجو استفاده از canonical در head فایل html میباشد. فرض کنید صفحه B دارای محتوای یکسان با صفحه A میباشد. برای اینکه این مطلب را به موتورهای جستجو اعلام کنیم باید در بخش head فایل html صفحه B کد زیر را قرار دهیم:

code-duplicate-content-seo
 

متا تگ های Robots

این کد به موتورهای جستجو اعلام میکند که صفحه B کپی URL ایست که در کد بالا آورده شده است. بعد از پیاده سازی این روش بیشتر Link juice صفحه B به صفحه A اختصاص داده خواهد شد و صفحه B همچنان هم برای کاربران و هم موتورهای جستجو در دسترس خواهند بود.

مثال بالا را در نظر بگیرید برای حل مشکل محتوای تکراری با استفاده از متا تگ روباتها کافی است در صفحه B متا تگ روبات با مقدار noindex را قرار دهید.

URL Rewriting

همانطور که اشاره شد نام دامنه با www و بدون آن میتواند منجر به ایجاد صفحات تکراری شود. برای جلوگیری با این مشکل میتوان تنظیمات IIS و یا Apache را تغییر داد تا به صورت اتوماتیک آدرسهایی که با www شروع میشوند را به آدرسهای بدون www ریدایرکت کند. اما بسیاری از سرویس های هاستینگ اجازه دسترسی به تنظیمات IIS را در اختیار مشتریان خود قرار نمیدهند لذا برای پیاده سازی این روش دو راه وجود دارد. اول استفاده از فایل web.config به صورت زیر میباشد:

code-for-duplicate-content-seo

 

تنظیمات بالا آدرسهای بدون www را به آدرسهای با www ریدایرکت میکند. با توجه به تجربه شخصی کد بالا برای نسخه های مختلف IIS ممکن است فرق داشته باشد و در برخی موارد هم با وجود هماهنگی تنظیمات بالا با نسخه IIS هاست همچنان مشکل پا برجا بود. لذا توصیه میکنم علاوه بر تنظیمات بالا در کلاس global پروژه نیز کد زیر را پیاده سازی کنید:

 

duplicate-content-seo
Google Webmaster Toolsکد بالا کلیه URL های با www را به URL های بدون www ریدایرکت میکند.

در بخش گذشته در رابطه با URL-rewriting برای نام دامنه ها صحبت کردیم. راه ساده تری نیز برای حل مشکلات ناشی از www نیز وجود دارد و آن مشخص کردن نام دامنه اصلی در Google Webmaster Tools میباشد. به این صورت که پس ورود به سایت و انتخاب وب سایت به تنظیمات وب سایت رفته و گزنیه preferred domain را انتخاب کنید.

محتوای تکراری-سئو-گوگل وبمستر

توجه داشته باشید که برای اینکه بتوانید از این بخش استفاده کنید در فهرست وب سایتهای شما باید هر دو نسخه با www و بدون www موجود باشند.

در صورتی که URL های شما دارای پارامتر هستند شما میتوانید برای گوگل نحوه برخورد با آنها را مشخص کنید. به این طریق شما میتوانید مشخص کنید که کدام پارامترها باید نادیده گرفته شوند و کدام پارامترها باید ایندکس شوند. برای اینکار به بخش Configuration و URL Parameters بروید.

نتیجه گیری

پیشگیری بهتر از درمان هست. استفاده از یک روش در لینکهای داخلی میتواند به کاهش احتمال محتوای تکراری کمک کند. اگر نام دامین مورد علاقه شما با www شروع میشود در لینکهای داخلی نیز همیشه از www استفاده کنید همچنین اگر سایتی به شما لینک داده است مطمئن شوید که در URL از نام دامین مورد نظر شما استفاده شده باشد. از کپی کردن محتوا از دیگر سایتها و استفاده از آن در سایت خود برای ایجاد محتوا و بالا بردن بازدید جداً خودداری کنید زیرا الگوریتمهای جدید گوگل به خوبی محتوای تکراری و یا حتی با تفاوت جزئی را تشخیص میدهند و بازخورد گوگل با شما نتیجه مطلوبی در بر نخواهد داشت.

منبع : http://psi-co.net/

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *