دانلود رایگان نمونه سوالات داده کاوی با جواب (استخدامی)
برای دانلود رایگان اینجا کلیک کنیدقسمتی از سوالات داده کاوی :
۱- کدام گزینه فرآیند کشف دانش را نشان می دهد؟
الف. پالایش داده ها انتخاب داده ها داده کاوی ارائه دانش
ب. پالایش داده ها- یکپارچه سازی داده ها – انتخاب داده ها – تبدیل داده ها – کاوی – ارزیابی الگو – ارائه دانش
ج. پالایش داده ها- یکپارچه سازی داده ها – انتخاب داده ها – داده کاوی – کاهش الگوها زائد – ارائه دانش
د. جمع آوری – انتخاب داده ها – داده کاوی – پیش پردازش داده ها – ارائه دانش
جواب گزینه الف
۲- کدام گزینه صحیح است؟
الف. در داده های با چولگی منفی – مقدار میانگین کمتر از مقدار میانه است
ب. مقدار میانگین همیشه بین میانه و مد است
ج. میانه مقداری یکتا است
د. IQR به تفاضل چارک اول و دوم اشاره دارد
جواب گزینه الف
۳- نمودار جعبه به ترتیب چه مقادیر را نشان میدهد؟
الف. چارک اول – چارک دوم – چارک سوم
ب. میانه – میانگین – مد
ج. کمترین – میانه – میانگین – بزرگترین
د. کمترین – چارک اول – میانه – چارک سوم – بزرگترین
جواب گزینه د
۴- با استفاده از روش هموار سازی با مقدار کرانی بسته ………..
الف. ابتدا کرانها مشخص و سپس مقادیر بسته به نزدیکترین مقدار کران جایگزین می شود
ب. هر مقدار در بسته با مقدار میانگین بسته جایگزین می شود
ج. کوچکترین و بزرگترین مقدار مشخص و هر بسته با نزدیکترین مقدار به کوچکترین یا بزرگترین مقدار جایگزین می شود
د. هر مقدار در بسته با مقدار میانه بسته جایگزین می شود
جواب گزینه الف
۵- اگر مقادیر یک صفت خاصهی A در بازهی ۹۸۶- تا ۹۱۷ باشد مقدار ۹۰۰ با استفاده از مقیاس گذاری دهدی به چه مقداری تبدیل می شود؟
الف. ۹%۰
ب. ۱۷
ج. ۹۰
د. ۰۹/۰
جواب گزینه الف
۶- کدام طراحی پایگاه داده در OLAO استفاده نمی شود؟
الف. مبتنی بر ER
ب. ستاره ای
ج. برفگونه (دانه برفی)
د. موضوع گرا
جواب گزینه الف
۷- …………..داده هایی در مورد داده هستند؟
الف. انبار داده
ب. متا دیتا
ج. دیتا مارت
د. مکعب داده ها
جواب گزینه ب
۸- …………….شامل یک جدول بزرگ مرکزی و مجموعه ای از جد اول که هر یک بعد اشاره می کنند.
الف. شماری ستاری
ب. شمای برفگنونه
ج. شمای صور فلکی
د. دیتا مارت
جواب گزینه الف
۹- …………..داده ها را به صورت مفصل تر و جزئی تر نشان می دهد؟
الف. roll – up
ب. drill – down
ج. Slicc
د. Pivot
جواب گزینه ب
۱۰- یک مجموعه اقلام X در مجموعه داده هایD …………………..است چناچه هیچ یک از مجموعه اقلام بزرگتر از X مانند Y دارای پشتیبان برابرX نباشد.
الف. مکرر
ب. کاندید
ج. بسته
د. ماکسیمال
جواب گزینه ج
۱۱- محدودیتهای …………… شامل تعیین آستانه برای سنجه های جالب بودن نظیر پشتیبان اطمینان و همبستگی می باشد.
الف. مربوط به نوع دانش
ب. مربوط بعد یا سطح
ج. مربوط به داده ها
د. مربوط به جالب بودن
جواب گزینه د
۱۲- در کدام تکنیک بر چسب کلاس ها مشخص نیست؟
الف. خوشه بندی
ب. دسته بندی بیز
ج. بردار ماشین
د. نزدیکترین همسایه
جواب گزینه الف
۱۳- صف خاصه ای شغل چه نوعی است؟
الف. نسبی Ratio
ب. بازه ای Interval
ج. ترتیبی Ordinal
د. اسمی Nominal
جواب گزینه د
۱۴- چارک سوم به چه اشاره می کند؟
الف. نقطه ای که ۲۵ درصد از داده های ابتدایی را جدا می کند
ب. نقطه ای که ۵۰ درصد از داده های ابتدایی را جدا می کند
ج. نقطه ای که ۳۰ درصد از داده های ابتدایی را جدا می کند
د. نقطه ای که ۷۵ درصد از داده های ابتدایی را جدا می کند
جواب گزینه د
۱۵- فرض کنید در یک دیتاست افراد زیر ۱۰ سال در دیتاست کم باشند اگر بخواهیم در نمونه گیری حتما از افراد زیر ۱۰ سال هم در نمونه باشد کدام روش نمونه گیری مناسب است؟
الف. نمونه گیری تصادفی ساده بدون جایگزینی
ب. نمونه گیری تصادفی ساده با جایگزینی
ج. نمونه گیری خوشه ای
د. نمونه گیری طبقه ای
جواب گزینه د
۱۶- کدام یک از مراحل فرآیند کسب دانش جزو مراحل پیش پردازش داده ها محسوب نمی شود؟
الف. تبدیل داده ها
ب. یکپارچه سازی داده ها
ج. انتخاب داده ها
د. ارزیابی الگو
جواب گزینه د
۱۷- کدام یک از گزینه های زیر در دسته بندی داده ها مورد استفاده قرار نمی گیرد؟
الف. درخت تصمیم
ب. شبکه عصبی
ج. خوشه بندی
د. قوانین IF- Thcn
جواب گزینه ج
۱۸- کلاه برداری در استفاده از کارت های اعتباری نمونه ای از مسائلی است که عموما کدام یک از روش های زیر به تحلیل و کشف ان می پردازد؟
الف. تحلیل داده های پرت
ب. رگرسیون جمله ای
ج. رگرسیون غیر خطی
د. تحلیل سبد خرید
جواب گزینه الف
۱۹- کدام یک از مواردزیر جزو چالش های مطرح شده از سوی موتورهای جستجو برای داده کاوی نیست؟
الف. کنترل مقدار حجیم داده ها توسط موتور های جستجو
ب. بهنگام سازی افزایشی
ج. روبرو بودن موتورهای جستجو با پرسش هایی که به دفعات زیاد توسط هر کاربر پرسیده می شود
د. مشارکت هزارات ایر کامپیوتر برای کاوش در میان داده ها
جواب گزینه ج
۲۰- در کدام یک از انواع مجموعه داده ها مقادیر میانه میانگین و مد با هم منطبق بوده و دارای مقادیر یکسانی هستند؟
الف. در مجموعه داده های متقارن
ب. در مجموعه داده ای با چولگی مثبت
ج. در مجموعه داده های با چولگی منفی
د. در مجموعه داده های نامتقارن
جواب گزینه الف
۲۱- کدامیک از سنجه های شاخص مرکزی زیر برای داده ای اریب نامتقارن سنجه بهتری محسوب می شود؟
الف. مد
ب. میانه
ج. میانگین
د. انحراف معیار
جواب گزینه ب
۲۲- در کدام یک از حالات زیر در یک نمودار پراکنشی داده ها همبستگی دارند؟
الف. نقاط بی هیچ نظمی در فضای دو بعدی پخش شده باشد
ب. نقاط در حول و حوش خطی موازی محور افقی قرار داشته باشند
ج. نقاط در حول و حوش خطی به صورت قطری در فضای دو بعدی قرار داشته باشند
د. نقاط در حول و حوش خطی موازی محور عمودی قرار داشته باشند
جواب گزینه ج
۲۳- این تکنیک مصوسازی می تواند بالغ بر ۱۸ بعد را نشان داده ونمونه نامتقارن آن در جهت تکنیک اولیه قادر به نمایش ۳۶ بعد می باشد
الف. صورتک های چرنف
ب. تکنیک قطعه بندی دایره
ج. تکنیک دنیاهای تودرتو
د. ابر برچسب
جواب گزینه الف
۲۴- کدام یک از گزینه های زیر در مورد خصوصیات ریاضی فاصله اقلیدسی و فاصله مانهاتان صحیح نیست؟
الف. برقرار بودن نامعادله مثلثی بین فواصل
ب. نامتقارن بودن تابع فاصله
ج. هویت غیر قابل تشخیص
د. غیر منفی بودن فاصله
جواب گزینه ب
۲۵- از کدام یک از روش های زیر برای تشخیص همبستگی بین داده های عددی استفاده می شود؟
الف. آزمون خی دو چی اسکوآر تست
ب. تحلیل کوواریانس
ج. تحلیل مولفه ای اصلی
د. تبدیل موجک
جواب گزینه ب
۲۶- هار دو دبوشی چهار مثال هایی از کدام یک از روش های کاهش داده محسوب می شوند؟
الف. نمونه برداری
ب. تحلیل مولفه های اصلی
ج. تبدیل موجک
د. هیستوگرام
جواب گزینه ج
۲۷- در کدام یکاز روش های نمونه برداری اگر ۱۰۰ داده داشته باشیم در ده بسته ده تایی قرار داده شده باشند به عنوان مثال قادر به انتخاب سه بسته کامل از بین آنها خواهیم بود؟
الف. نمونه برداری خوشه ای
ب. نمونه برداری طبقه ای
ج. نمونه برداری تصادفی ساده با جایگزینی
د. نمونه برداری ساده بدون جایگزینی
جواب گزینه الف
۲۸- کدام یک از انواع نمودارهای زیر در طراحی یک سیستم OLAP مورد استفاده قرار نمی گیرد؟
الف. نمودارهای ER
ب. نمودارهای ستاره ای
ج. نمودارهای برفگونه
د. نمودارهای صور فلکی
جواب گزینه الف
۲۹- در کدام یک از نمودارهای زیر از چند جدول حقیقت (Fact Table) استفاده می شود؟
الف. صورفلکی
ب. ستاره ای
ج. برفگونه
د. ER
جواب گزینه الف
۳۰- کدام یک از گزینه های زیر در مورد الگوریتم star – cubing صحیح نیست؟
الف. این الگوریتم در محاسبه مکعب کوه یخی به ترتیب ابعاد حساس است
ب. در زمانی که با داده های اریب سروکار داشته باشد سریع تر از BUC عمل می کند
ج. افزایش حداقل پشتیبان باعث افزایش سرعت این الگوریتم می شود
د. در محاسبه مکعب کامل در صورتی که داده ها متراکم باشند عملکرد الگوریتم قابل مقایسه Way Multi است
جواب گزینه ج