دانلود رایگان نمونه سوالات بازیابی اطلاعات با جواب (استخدامی)
برای دانلود رایگان اینجا کلیک کنیدقسمتی از سوالات بازیابی اطلاعات :
۱- عبارت یک سیستم همیشه باید مشخص ترین قسمت از یک سند را در پاسخ به جستجو برگرداند به کدام اصل اشاره دارد؟
الف. اصل بازیابی سند عام
ب. اصل بازیابی سند تشخیص
ج. اصل بازیابی سند ساخت یافته
د. هر سه مورد
جواب گزینه ج
۲- کلمات بسیار عام که ارزش اندکی در کمک به انتخاب سند منطبق با نیاز کاربر دارند را چه می نامند؟
الف. کلمات توقف
ب. نیاز اطلاعاتی
ج. کلمات کم ارزش
د. هر سه گزینه درست است
جواب گزینه الف
۳- رونداستاندارد سازی نشانه ها به طوری که تطبیق علیرغم تفاوت های صوری در دنباله کارکتری نشانه ها رخ دهد چه نامیده می شود.
الف. تطبیق نشانه ها
ب. قوانین نگاشت
ج. نرمالسازی نشانه ها
د. نگاشت نشانه ها
جواب گزینه ج
۴- برای جستجو در لغت نامه کدامیک از موارد زیر می توان بهره برد؟
الف. درختان جستجو
ب. درهم سازی
ج. جستجوهای جایگزین
د. موارد الف و ب
جواب گزینه د
۵- کدام گزینه عبارات را به جای شناسه های آنها در شاخص گزاری استفاده می کند؟
الف. شاخص گزاری برون حافظه ای
ب. شاخص گزاری بلوکی تک گذره
ج. شاخص گزاری بلوکی مبتنی بر مرتب سازی
د. شاخص گزاری درون حافظه تک گذره
جواب گزینه د
۶- کدامیک از گزینه های زیر از اهداف شاخص گزاری لغت نامه نمی باشد؟
الف. گنجاندن لغت نامه در حافظه
ب. سهولت در شاخص گزاری
ج. حفظ حافظه
د. تسهیل در اشتراک منابع با برنامه های دیگر
جواب گزینه ب
۷- شباهت بین دو سند در فضای برداری را چگونه ارزیابی می کنند؟
الف. تفاوت بین دو بردار سند
ب. شباهت کسینوسی
ج. ضرب نقطه ای بردارها
د. ضرب طول اقلیدسی بردارها
جواب گزینه ب
۸- ایده ی محاسبه کردن ” مجموعه ی r با بالاترین وزن ها برای عبارات t مورد نظر چه نام دارد؟
الف. لیست قهرمان
ب. اسناد برتر
ج. لیست های مورد علاقه
د. هر سه گزینه
جواب گزینه د
۹- برای بازیابی سند XML روش های بازیابی XML متن – محور بر چه اساسی عمل می کنند؟
الف. فیلدهای طولانی متن – تطبیق دقیق- نتایج ربط رتبه بندی شده
ب. فیلدهای طولانی متن – تطبیق نادقیق- نتایج ربط رتبه بندی شده
ج. فیلدهای طولانی متن – تطبیق دقیق- نتایج ربط رتبه بندی نشده
د. فیلدهای طولانی متن – تطبیق نادقیق- نتایج ربط رتبه بندی نشده
جواب گزینه ب
۱۰- چالش بزرگ موتورهای جستجوی وب در شاخص گزاری و بازیابی کدام مورد است؟
الف. توزیع نامتوازن کاربران و تنوع سخت افزارها
ب. تنوع جغرافیایی و توزیع نامتوازن کاربران
ج. انتشار متمرکز محتوا با کنترل مرکزی اعتبار
د. انتشار غیرمتمرکز محتوا بدون کنترل مرکزی اعتبار
جواب گزینه د
۱۱- روش مبارزه با ارسال هرزنامه که متن صفحات وب خود را دستکاری می کند با چه عنوان شناخته می شود؟
الف. تحلیل پیوند
ب. تحلیل متن
ج. تحلیل seo
د. تحلیل پوشاندن
جواب گزینه الف
۱۲- کدامیک از روش های زیر برای تشخیص صفحات وب دو نسخه ای نزدیک استفاده می شود؟
الف. روش پوشاندن
ب. روش تحلیل پیوند
ج. روش SEO
د. روش اثر انگشت
جواب گزینه الف
۱۳- کدامیک از موارد زیر جزو ویژگی های کدهای گاما Y می باشد؟
الف. جهانی بودن
ب. پیشوند آزاد
ج. بدون پارامتر
د. هر سه مورد صحیح است
جواب گزینه د
۱۴- در کد گذاری بایت متغییر هفت بیت آخر یک بایت که بخشی از فاصله را کد گزاری می کند چه می نامند
الف. بیت توازن
ب. بیت ادامه
ج. بار
د. تیبل
جواب گزینه ج
۱۵- ایده اصلی الگوریتم های soundex چیست؟
الف. تولید الگوریتم های تبدیل صوت
ب. تولید الگوریتم های تبدیل متن به صوت
ج. تولید یک درهم سازی آوایی
د. تولید الگوریتم های مقاوم سازی صورت
جواب گزینه ج
۱۶- چه زمانی بازخورد ربط به تنهایی کافی نمی باشد؟
الف. املای غلط
ب. بازیابی اطلاعات بین زبانی
ج. پرس و جوهایی که مجموعه پاسخ ذاتا فصلی دارند
د. همه موارد
جواب گزینه د
۱۷- مقدار kappa …………………خواهد بود اگر دو داور همیشه موافق باشند و ………..خواهد بود اگر آنها در نرخ داده شود توسط شانس به توافق برسند.
الف. یک – منفی
ب. منفی – صفر
ج. یک – صفر
د. صفر – منفی
جواب گزینه ج
۱۸- «…………………………….به موصعی است که کاربران علاقه مندند تا درباره آن بیشتر بدانند»
الف. پرس و جو
ب. سند
ج. نیاز اطلاعاتی
د. عبارت
جواب گزینه ج
۱۹- توصیف زیر در مورد نتایج بازگشتی به کدام گزینه اشاره دارد؟
الف. شاخصی
ب. صحت
ج. بازخوانی
د. فرهنگ واژگان
جواب گزینه ب
۲۰- …………سازماندهی کار پاسخگویی به پرس و جو است به طوریکه حداقل مقدار کار توسط سیستم انجام شود؟
الف. پردازش پرس و جو
ب. بهینه سازی پرس و جو
ج. اشتراک پرس و جو
د. شاخص گذاری
جواب گزینه ب
۲۱-…………………. معمولاً به فرآیند مکاشفه ای خاصی اشاره دارد که اکثر اوقات انتهای کلمات را به امید دستیابی به یک صورت پایه متعارف قطع می کند وگاهی شامل حذف ضمیمه های نحوی است.
الف. مدخل گیری
ب. ریشه گیری
ج. هم ارزش
د. نرمالسازی
جواب گزینه ب
۲۲- حذف بخش انتهایی کلمه چه نام دارد؟
الف. مدخل گیری
ب. حذف ریشه
ج. ریشه گیری
د. همه موارد
جواب گزینه ج
۲۳- در لغت نامه از چه نوع درخت جستجو استفاده می کنیم؟
الف. درخت جستجوی دودویی
ب. درخت جستجو دودویی بهینه
ج. درخت سیاه قرمز
د. B-Tree
جواب گزینه د
۲۴- گاهی اوقات کلمات بسیار عام که ظاهراً ارزش اندکی در کمک به انتخاب اسناد منطبق با نیاز کاربر دارند باید از مجموعه واژگان مستنثنی شوند این کلمات ……………..نامیده می شوند.
الف. کلمات زاید
ب. کلمات اصلی
ج. کلمات ناقص
د. کلمات توقف
جواب گزینه د
۲۵- ……………………….به فرآیند مکاشفه ای خاصی اشاره دارد که اکثر اوقات انتهای کلمات را به امید دستیابی به هدف قطع میکند و گاهی شامل حذف ضمیمه های نحوی است
الف. مدخل گیری
ب. ریشه گیری
ج. حذف
د. شاخص گذاری
جواب گزینه ب
۲۶- کدام الگوریتم ها مجموعاً به عنوان الگوریتم های Soundcx معروف هستند.
الف. الگوریتم های تشخیص صوت
ب. الگوریتم های تبدیل متن به صوت
ج. الگوریتم های درهم سازی آوائی
د. الگوریتم های مقاوم سازی
جواب گزینه ج
۲۷- بخشی از حافظه اصلی را که در بلوک خوانده شده یا نوشته شده در آن ذخیره می شود……………….می نامیم.
الف. کش
ب. پیگرد
ج. میانگیر
د. گذرگاه
جواب گزینه ج
۲۸- در کدگذاری بایت متغیر ۷ بیت آخر یک بایت ………….نامیده می شود و بخشی از فاصله را کدگذاری می کند.
الف. توازن
ب. بار
ج. ادامه
د. تیبل
جواب گزینه ب
۲۹- یک کد با این ویژگی که برای توزیع دلخواه P فاکتوری از کد بهینه باشد ………نامیده می شود.
الف. کد بهینه
ب. آنتروپی
ج. کد جهانی
د. کد پیشوندی
جواب گزینه ج
۳۰- جمله ” می توان از منابع غایر مستقیم به جای بازخورد صریح ربط به عنوان مبنای بازخورد ربط استفاده کرد تعریف چیست؟
الف. شبه بازخورد ربط
ب. بازخورد کور
ج. بازخورد ربط روی وب
د. بازخورد ضمنی
جواب گزینه د