جستجوی در اين وبلاگ

۱۳۸۹ دی ۱۴, سه‌شنبه

int eng / q&a / search engine


مهندسی اینترنت
آسان
1.انواع موتور جستجو؟
 (Crawler-Based Search Engine) موتورهای جستجو مبتنی بر وب و درون­کاوی
(Directory-Based Search Engine) جستجو مبتنی بر فهرست
(Hybrid Search Engines) موتورهای جستجو مختلط
2.ماجول درون‌کاو(Crawler) در انتخاب صفحات چه معیارهایی را درنظر میگیرد؟
الف)معیار مبتنی بر گرایشات کاربران
ب)معیار مبتنی بر شهرت صفحات وب
ج)معیار مبتنی بر محل قرارگرفتن صفحات
متوسط
3)شاخص متنی را تعریف کنید؟
شاخص متنی عبارت است از یک پایگاه اطلاعاتی از کل کلمات کلیدی ممکن در ادبیات هر زبان (به همراه مجموعه­ای غنی از  مخفف­ها و استعارات)
 به همراه اندیس صفحاتی که این کلمات در درون آنها یافت میشود.
 4 )ماجول رتبه­دهندی برای مرتب­سازی و رتبه­دهی به صفحات از چه اطلاعاتی استفاده میکند؟
        اطلاعات مندرج در بطن صفحه
   مثال: دفعات تکرارکلمات کلیدی،ترتیب و مجاورت کلمات کلیدی،محل درج کلمات کلیدی،درج کلمات کلیدی درون آدرس صفحه،
پررنگ بودن کلمات کلیدی واندازه ی قلم         
        اطلاعات مندرج در بیرون از صفحه ی وب
مثال: تعداد ارجاعاتی که به صفحه اغازین وب داده شده است.رده بندی جهانی وب سایت از لحاظ طراحی،تعداد بازدیدکننده، جذب ترافیک
5)اجزای معماری موتور جستجو؟
معماری کلی اغلب موتور های جستجو را میتوان چیزی شبیه شکل زیر تصور کرد که اجزای این معماری عبارتند از:
درون­کاو(Crawler)،کنترل درون­کاو Crawl Control))،انباره صفحات(Page Repository)،ماجول شاخص دهی Indexer Module)Collection Analysis Module))،موتور پرس وجوQuery engine))،ماجول رتبه­دهی و..
fp5503-pingali-img2.png
دشوار
6)دو مورد از تفاوت موتور جستجوهای مختلف؟
1)تفاوت موتور های جستجو مختلف در الگوریتم Crawler Control نمود بیشتری پیدا میکند.
در برخی از این الگوریتم ها عملیات ملاقات واستخراج صفحات وب به صورت غیر منقطع انقدر ادامه مییابد تا هیچ صفحه­ی ملاقات نشده­ای باقی نماند.
در برخی دیگر از این الگوریتم­ها عملیات استخراج و ملاقات صفحات یک سایت وب با آدرس خاص به وب سایت هایی با پسوند نام حوزه متفاوت تسری نخواهد یافت.
  2 )ماجول «شاخص دهی» و ماجول « تحلیل مجموعه » انواع شاخص ها و ویژگی هایی را که میتوانند در فرایند جستجو  مفید باشند ،از درون صفحات ذخیره شده در انباره،بیرون  میکشند. یکی از نقاط اختلاف موتور های جستجونیز در همین بخش بروز می کنند.
7) انبار صفحات (page Repository) از چه روش های دسترسی پشتیبانی میکند؟
    انباره صفحات بایستی از دو روش پشتیبانی کند:
   اولین روش دسترسی مستقیم وتصادفی است تا بتوان به سرعت و مستقیما یک صفحه وب سایت خاص را با کمک شناسه اش بازیابی کرد.
  دومین روش دسترسی جویباری است تا بتوان یک مجموعه بزرگ از صفحات وب را به یکباره بازیابی کرد. ( مثال:ماجول های شاخص دهی)

هیچ نظری موجود نیست: