آموزش وردپرس
خانه / سئو و بهینه سازی سایت / موتورهای جستجو چگونه کار می کنند؟
seo - آموزش سئو
seo - آموزش سئو

موتورهای جستجو چگونه کار می کنند؟

چرا باید بدانیم ؛ موتورهای جستجو چگونه کار می کنند؟ ما به عنوان یک سئو کار ، قبل از هر چیز باید به شناخت کافی نسبت به search engines برسیم تا بتوانیم در گامهای بعدی وبسایت خود را با معیار های آنها وفق دهیم و رنک بالایی بگیریم ، پس با ما در این مقاله همراه باشید :

وقتی جستجویی در یک موتور جستجوگر انجام و نتایج جستجو ارایه می شود، کاربران در واقع نتیجه کار بخش های متفاوت موتور جستجوگر را می بینند. موتور جستجو قبلا” پایگاه داده اش را آماده کرده است و این گونه نیست که درست در همان لحظه جستجو، تمام وب را بگردد. بسیاری از خود می پرسند که چگونه ممکن است گوگل در کمتر از یک ثانیه تمام سایت های وب را بگردد و میلیون ها صفحه را در نتایج جستجوی خود ارایه کند؟
گوگل و هیچ موتور جستجوگر دیگری توانایی انجام این کار را ندارند. همه آنها در زمان پاسخ گویی به جستجوهای کاربران، تنها در پایگاه داده ای که در اختیار دارند به جستجو می پردازند و نه در وب! موتور جستجوگر به کمک بخش های متفاوت خود، اطلاعات مورد نیاز را قبلا” جمع آوری، تجزیه و تحلیل می کند، آنرا در پایگاه داده اش ذخیره می نماید و به هنگام جستجوی کاربر تنها در همین پایگاه داده می گردد.

Search Engine,seo
موتورهای جستجو چگونه کار می کنند؟

بخش های مجزای یک موتور جستجوگر عبارتند از:

  • Spider  یا عنکبوت

  • Crawler  یا خزنده

  • Indexer یا بایگانی کننده

  • Database  یا پایگاه داده

  • Ranker  یا سیستم رتبه بندی

همچنین می توان با ادغام کردن اسپایدر با کراولر و همچنین ایندکسر با پایگاه داده، موتور جستجوگر را شامل سه بخش زیر دانست که این گونه تقسیم بندی هم درست می باشد:

  • کراولر

  • بایگانی

  • سیستم رتبه بندی


spider

اسپایدر یا روبوت ( Robot )، نرم افزاری است که کار جمع آوری اطلاعات مورد نیاز یک موتور جستجوگر را بر عهده دارد. اسپایدر به صفحات مختلف سر می زند، محتوای آنها را می خواند، لینکها را دنبال می کند، اطلاعات مورد نیاز را جمع آوری می کند و آنرا در اختیار سایر بخش های موتور جستجوگر قرار می دهد. کار یک اسپایدر، بسیار شبیه کار کاربران وب است. همانطور که کاربران، صفحات مختلف را بازدید می کنند، اسپایدر هم درست این کار را انجام می دهد با این تفاوت که اسپایدر کدهای HTML صفحات را می بیند اما کاربران نتیجه حاصل از کنار هم قرار گرفتن این کدها را. Index.html صفحه ای است که کاربران آنرا می بینند.

  • اسپایدر ها رنگ ها را نمی بینند پس درکی از اسپایدر رنگی در تصویر سمت چپ ندارند. آنها حتی نوشته سیاه و سفید گوگل در بالای تصویر رو هم نمیبینند. متاسفانه آنها حتی تصویر سمت راست را هم نمی بینند.

seo- آموزش بهینه سازی سایت

  • اسپایدر ها تنها زمانی که طراحان صفحه Alt tag تصاویر را اضافه می کنند متوجه میشوند که در تصویر چیست !

  • اسپایدرها اهمیتی به طراحی فانتزی صفحات نمی دهند بلکه تنها متن و کدهای HTML را می بینند.

  • بات های موتور جستجو متن های داخل تصاویر را نمی بینند بنابراین اگر سایتتان پراست از تصاویر حاوی متن های کوتاه ، شما در نتایج جستجو خوب نخواهید بود.

  • اسپایدر، به هنگام مشاهده صفحات، بر روی سرورها رد پا برجای می گذارد. شما اگر اجازه دسترسی به آمار دید و بازدیدهای صورت گرفته از یک سایت و اتفاقات انجام شده در آن را داشته باشید، می توانید مشخص کنید که اسپایدر کدام یک از موتورهای جستجوگر صفحات سایت را مورد بازدید قرار داده است.

  • اسپایدرها کاربردهای دیگری نیز دارند، به عنوان مثال عده ای از آنها به سایت های مختلف مراجعه می کنند و فقط به بررسی فعال بودن لینک های آنها می پردازند و یا به دنبال آدرس ایمیل می گردند.

  • تمامی اسپایدر ها از طریق نام کاربری شان براحتی قابل شناسایی اند در این گزارشات. نام کاربری بعضی اسپایدر ها مانند گوگل  (Googlebot) کاملا مشخص است. بقیه نیز نامهای جالب و گاها خنده داری دارند (مانند ربات Inktomi که نامش   Slurp “صدای خوردن و آشامیدن ! ” است ) که شما با دیدن گزارش آنها را خواهید شناخت و متوجه خواهید شد چه صفحاتی را و چند بار رصد کرده اند.مشاهده این گزارش و شناسایی ربات های منحصر به فرد ، همچنین شما را نسبت به اسپایدر های مهاجم که نمیخواهید از سایتتان بازدید کنند مطلع می کند چرا که بعضی اسپایدرهای بدنام ابزار هرزنامه هستند در دست بازار یابان. این اسپایدر های هرزنامه یکسره در وب گشت زنی کرده و کلیه آدرس ایمیل های موجود در وبسایتتان را می ربایند. حالا شما متوجه می شوید که ترافیک های ایمیل های ناخواسته تان از کجا سرچشمه می گیرد.

  • هر اسپایدر بین 2 تا 12 بار در ماه سایت شما را ملاقات می کند.

  • یک روش برای کمک به کراولر ها تا اینکه بتوانند به تمامی Url های سایت شما دسترسی پیدا کنند ، فعال کردن نقشه سایتتان است.


Crawler

کراولر، نرم افزاری است که به عنوان یک فرمانده برای اسپایدر عمل می کند.

مشخص می کند که اسپایدر کدام صفحات را مورد بازدید قرار دهد. در واقع کراولر تصمیم می گیرد که کدام یک از لینک های صفحه ای که اسپایدر در حال حاضر در آن قرار دارد، دنبال شود. ممکن است همه آنها را دنبال کند، بعضی ها را دنبال کند و یا هیچ کدام را دنبال نکند.
کراولر، ممکن است قبلا” برنامه ریزی شده باشد که آدرس های خاصی را طبق برنامه، در اختیار اسپایدر قرار دهد تا از آنها دیدن کند. دنبال کردن لینک های یک صفحه به این بستگی دارد که موتور جستجوگر چه حجمی از اطلاعات یک سایت را می تواند (می خواهد) در پایگاه داده اش ذخیره کند. همچنین ممکن است اجازه دسترسی به بعضی از صفحات به موتورهای جستجوگر داده نشده باشد.

  • به عمل کراولر ، خزش (Crawling ) می گویند.


Indexer

ایندکس کردن به پروسه ای برمی گردد که در آن ، موتورهای جستجو صفحات وب را در پایگاه داده خود – به منظور تسهیل فرایند بازیابی و اطلاعات سریع و دقیق – ذخیره می کنند. بررسی محتوای صفحات وب به منظور ایندکس کردن خودکار از اهمیت اساسی برای تجارت الکترونیک و دیگر برنامه های کاربردی وب برخوردار است.

  • این کار کاربران را ؛ که شامل مشتریان و صاحبان مشاغل هستند ؛ قادر می سازد تا بهترین منابع را برای نیازهای خود ایجاد کنند.

  • اغلب، به منظور ربط بیشتر نتایج در یک جستجو ، فرایند ایندکسینگ توسط پروسه ای انسانی تعریف می شود.
    پس از اینکه عملیات اسپایدر ها در رابطه با یافتن اطلاعات به اتمام رسید ( عملیات فوق در عمل با توجه به ماهیت وب و استقرار صفحات وب جدید هرگز به پایان نخواهد رسید ، بنابراین همواره عملیات جستجو و یافتن اطلاعات توسط اسپایدر ها انجام می گیرد) ؛ مراکز جستجو می بایست اطلاعات مورد نظر را بگونه ای ذخیره نمایند که قابل استفاده باشند.

  • بمنظور ارائه نتایج مفیدتر توسط مراکز جستجو ، اکثر مراکز جستجو صرفا   کلمه و آدرس URL را ذخیره نمی نمایند . در این حالت مواردی نظیر تعداد تکرار کلمه در صفحه نیز ذخیره خواهد شد.

    مراکز جستجو همچنین به هر entry یک وزن را نسبت خواهند داد. (وزن نسبت داده شده، نشان دهنده جایگاه کلمه در صفحه است ) ؛ ابتدای صفحه ، در لینک ها ، در تگ های متا و یا در عنوان صفحه ( هر یک از مراکز جستجو برای اختصاص یک وزن مناسب به کلمه مورد نظر از یک فرمول استفاده می نمایند.)

    موضوع فوق یکی از دلایلی است که جستجو یک کلمه توسط دو مرکز جستجو ، نتایج مشابه ای را بدنبال نخواهد داشت .

  • ایندکس دارای صرفا  یک هدف است : امکان یافتن اطلاعات با سرعت بالا .


Ranker

بعد از آنکه تمام مراحل قبل انجام شد، موتور جستجو آماده پاسخ گویی به سوالات کاربران است. کاربران چند کلمه را در جعبه جستجوی ( Search Box ) آن وارد می کنند و سپس با فشردن Enter منتظر پاسخ می مانند. برای پاسخگویی به درخواست کاربر، ابتدا تمام صفحات موجود در پایگاه داده که به موضوع جستجو شده، مرتبط هستند، مشخص می شوند. پس از آن سیستم رتبه بندی وارد عمل شده، آنها را از بیشترین ارتباط تا کمترین ارتباط مرتب می کند و به عنوان نتایج جستجو به کاربر نمایش می دهد.
حتی اگر موتور جستجوگر بهترین و کامل ترین پایگاه داده را داشته باشد اما نتواند پاسخ های مرتبطی را ارایه کند، یک موتور جستجوگر ضعیف خواهد بود.

  • در حقیقت سیستم رتبه بندی قلب تپنده یک موتور جستجوگر است و تفاوت اصلی موتورهای جستجوگر در این بخش قرار دارد. سیستم رتبه بندی برای پاسخ گویی به سوالات کاربران، پارامترهای بسیاری را در نظر می گیرد تا بتواند بهترین پاسخ ها را در اختیار آنها قرار دارد.

  • در حال حاضر قدرتمندترین سیستم رتبه بندی را گوگل در اختیار دارد.

  • در جدول زیر بعضی از این پارامتر ها شرح داده شده اند :

SEO Parameters

Description

Title Tag

If query is a term in webpage title

Meta Description

If query term is present in description

Meta Keyword

If query matches keyword

Snippet

Number of times word appears in summary

Meta expires

Recent pages to be given higher rank

Meta content

help to show compatible pages to users (UTF-8, ASCII or ISO)

Image attribute

use of Image alt attribute helps in higher weightage as it provides description to images

Sitemap

use of sitemap increase visibility for dynamic web-pages

Links present

number of in-bound links to the page

یک دیدگاه

  1. مهاجرت به کانادا

    سلام.واقعا وبسایت خوبی دارید

     

پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

WordPress spam blocked by CleanTalk.