دانلود پاورپوینت Data Mining چيست؟
دسته بندي :
علوم پایه »
دانلود پاورپوینت های علمی
لینک دانلود و خرید پایین توضیحات
دسته بندی : پاورپوینت
نوع فایل : powerpoint (..ppt) ( قابل ويرايش و آماده پرينت )
تعداد اسلاید : 21 اسلاید
قسمتی از متن powerpoint (..ppt) :
بنام خدا
Data Mining چيست؟
Data Mining عبارت است از اقتباس يا استخراج دانش از مجموعه ای از داده ها ، به بيان ديگر ، Data Mining فرايندی است که با استفاده از تکنيکهای هوشمند، دانش را از مجموعه ای از داده ها استخراج می کند.
Data Mining از ساخت مدل های تحليلی ، دسته بندی و پيش بينی اطلاعات و ارائه نتايج با استفاده از ابزارهای مرتبط استفاده می کند.
برای اينکه الگوريتم Data Mining بتواند عمل استخراج دانش را بخوبی انجام دهد، نياز به يک سری پيش پردازش ها بر روی مجموعه آموزشی و يک سری پس پردازش ها بر روی الگوهای استخراج شده دارد.
مراحل Data Mining
پاک سازی داده ها : در اين مرحله داده های غير معتبر از مجموعه داده های آموزشی خارج می شوند. داده های دارای نويز، اطلاعات ناکامل و ... نمونه هايی از داده هايی هستند که با يد پاکسازی در مورد آنها انجام گردد.
يکپارچه سازی داده ها : در اين مرحله، منابع چندگانه داده ای با هم ترکيب می شوند.
انتخاب داده ها : داده های مرتبط به فرايند Data Mining از ساير داده ها جدا می شود. اين مبحث را می توان بخشی از فرايند کاهش اطلاعات نيز دانست.
تبديل داده ها : داده ها به قالبی قابل استفاده برای Data Mining در می آيند. از اعمالی که در اين مرحله صورت می گيرد ، می توان به خلاصه سازی و يا محاسبه مقادير تجمعی اشاره کرد.
Data Mining : بخش اصلی فرايند که در آن با استفاده از روش ها و تکنيکهای خاص ، استخراج الگو های دانش صورت می گيرد.
ارزيابی الگوها : تشخيص الگو های صحيح مورد نظر ، از ساير الگو ها در اين مرحله انجام می شود. صحت الگوها بر اساس يک سری معيار های جذابيت سنجيده می شود.
بازنمايی دانش : در اين بخش به منظور ارائه دانش استخراج شده به کاربر ، از يک سری ابزارهای بصری سازی استفاده می گردد.
کاهش اطلاعات
کاهش اطلاعات عبارت است از توليد يک مجموعه کوچکتر از داده های اوليه که تحت عمليات Data Mining نتايج تقريبا يکسانی با نتايج Data Mining روی اطلاعات اوليه به دست می دهد.
اين عمل را می توان از طريق حذف خصيصه های غير مرتبط با نوع عمليات Data Mining مورد نظر انجام داد.
حذف خصيصه های مرتبط که در اثر اشتباه در ارزيابی ميزان ارتباط آنها با عمليات Data Mining انجام می گيرد، می تواند منجر به ناکارآمدی فرايند Data Mining و استخراج قوانين ناقص و در نتيجه بی ارزش شود.
عدم حذف خصايص غير مرتبط می تواند زمان انجاخم عمليات Data Mining را به طرز قابل ملاحظه ای افزايش دهد.
سه روش کلی برای انتخاب خصايص مرتبط با Data Mining وجود دارد:
انتخاب پيش رونده: در هر مرحله خصيصه ای که بيشترين ارتباط را دارد، برگزيده می شود.
انتخاب عقب رونده: در هر مرحله خصيصه ای که کمترين ارتباط را دارد، انتخاب و حذف می شود.
روش ترکيبی : ترکيب هر دو روش پيش رونده و پس رونده
سلسله مراتب مفهومی: روشی برای کاهش تعداد مقادير ممکن برای يک خصيصه ارائه می دهد، اگر چه داده های خروجی کلی تر بوده و فاقد برخی جزئيات هستند، اما اين داده ها بسيار ساده تر بوده و در سطح تجريدی بالاتری نسبت به داده های اوليه قرار دارند.