گیگاداک

گیگاداک

Gigadoc
گیگاداک

گیگاداک

Gigadoc

دانلود فایل ورد Word نقش داده کاوی در تجارت الکترونیک


دانلود فایل ورد Word نقش داده کاوی در تجارت الکترونیک

مشخصات مقاله عنوان کاربرد داده کاوی در تجارت الکترونیک فرمت فایل WORD (قابل ویرایش) تعداد صفحات ۱۵۱ از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (۱۹۵۰) پس از حدود ۲۰ سال، حجم داده ها در پایگاه داده ها دو برابر شد

دانلود دانلود فایل ورد Word نقش داده کاوی در تجارت الکترونیک

نقش داده کاوی در تجارت الکترونیک
دانلود فایل ورد Word نقش داده کاوی در تجارت الکترونیک
دانلود فایل ورد نقش داده کاوی در تجارت الکترونیک
دانلود فایل Word نقش داده کاوی در تجارت الکترونیک
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 531 کیلو بایت
تعداد صفحات فایل 151

مشخصات مقاله:

عنوان : کاربرد داده کاوی در تجارت الکترونیک
فرمت فایل: WORD (قابل ویرایش)
تعداد صفحات: ۱۵۱

 

از هنگامی که رایانه در تحلیل و ذخیره سازی داده ها بکار رفت (۱۹۵۰) پس از حدود ۲۰ سال، حجم داده ها در پایگاه داده ها دو برابر شد. ولی پس از گذشت دو دهه و همزمان با پیشرفت فن آوری اطلاعات(IT) هر دو سال یکبار حجم داده ها، دو برابر شده و همچنین تعداد پایگاه داده ها با سرعت بیشتری رشد نمود. این در حالی است که تعداد متخصصین تحلیل داده ها با این سرعت رشد نکرد. حتی اگر چنین امری اتفاق می افتاد، بسیاری از پایگاه داده ها چنان گسترش یافته‌اند که شامل چندصد میلیون یا چندصد میلیارد رکورد ثبت شده هستند.
امکان تحلیل و استخراج اطلاعات با روش های معمول آماری از دل انبوه داده ها مستلزم چند روز کار با رایانه های موجود است.[۳]حال با وجود سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی و تجارت الکترونیک، لحظه به لحظه به حجم داده ها در پایگاه داده های مربوط اضافه شده و باعث به وجود آمدن حانبارهای عظیمی از داده ها شده است.

چکیده

تکنیکهای داده کاوی و متدلوژیهای ان

مقدمه

عناصر داده کاوی

پردازش تحلیلی پیوسته:

قوانین وابستگی:

شبکه های عصبی :

الگوریتم ژنتیکی:

نرم افزار

کاربردهای داده کاوی

داده کاوی و کاربرد آندر کسب و کار هوشمند بانک

داده کاوی درمدیریت ارتباط بامشتری

کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی

مدیریت موسسات دانشگاهی

داده کاوی آماری و مدیریت بهینه وب سایت ها

داده کاوی در مقابل پایگاه داده Data Mining vs database

ابزارهای تجاری داده کاوی

منابع اطلاعاتی مورد استفاده

انبار داده

مسائل کسب و کار برای داده‌کاوی

چرخهتعالیداده کاویچیست؟

متدلوژی داده‌کاوی و بهترین تمرین‌های آن

یادگیری چیزهایی که درست نیستند

الگوهایی که ممکن است هیچ قانون اصولی را ارائه نکنند

چیدمان مدل ممکن است بازتاب دهنده جمعیت وابسته نباشد

ممکن است داده در سطح اشتباهی از جزئیات باشد

یادگیری چیزهایی که درست ولی بلااستفاده‌اند

مدل‌ها، پروفایل‌سازی، و پیش‌بینی

پیش بینی

متدلوژی

مرحله 1: تبدیل مسئله کسب و کار به مسئله داده‌کاوی

مرحله 2: انتخاب داده مناسب

مرحله سوم: پیش به سوی شناخت داده

مرحله چهارم: ساختن یک مجموعه مدل

مرحله پنجم: تثبیت مسئله با داده‌ها

مرحله ششم: تبدیل داده برای آوردن اطلاعات به سطح

مرحله هفتم: ساختن مدلها

مرحله هشتم: ارزیابی مدل ها

مرحله نهم: استقرار مدل ها

مرحله 10: ارزیابی نتایج

مرحله یازدهم: شروع دوباره

وظایف داده‌کاوی‌

1- دسته‌بندی

2- خوشه‌بندی

3- تخمین

4- وابستگی

5- رگرسیون

6- پیشگویی

7- تحلیل توالی

8- تحلیل انحراف

9- نمایه‌سازی

 

تجارت الکترونیک

 

فصل اول: مقدمه ای بر تجارت الکترونیکی

1- طبقه‌های مختلف تجارت الکترونیکی

2- تفاوت تجارت الکترونیکی با تجارت سنتی

3- نقش دولت در تجارت الکترونیک

فصل دوم : شکل دهی موقعیت بازار

1- چار چوبی برای تحلیل موقعیت بازار

1-1- پرورش موقعیت :

1-2-کشف هسته اصلی موقعیت :

1-3- شناسایی مشتریان هدف :

1-4- مطالعه توانمندیها و منابع شرکت :

1-5- اندازه گیری جذابیت موقیت :

2 ) ویژگی های تحلیل موقعیت بازار در اقتصاد جدید:

3_ دو نوع ارزش ( value type ) عمده

3_2_ ارزش های جدید ( New-To-The-World value ) :

4 – شناسایی نیاز های برآورده شده و برآورده نشده

4-1_ فرآیند تصمیم گیری مشتری

4-2_ آشکارسازی نیازهای برآورده شده و برآورده نشده

5- تعیین مشتریان ویژهای که شرکت قصد متقاعد کردن آنهارا دارد.

5-1- روشهایی برای تقسم بندی بازار:

5-2- تقسیم بندی قابل اجرا و معنی دار

_ تقسیم بندی قابل اجرا(Actionable Segmentation)

_ تقسیم بندی معنی دار

5-3-ترکیب مناسبی از متغیر ها

5-4-تناظر بازار و مشتریان هدف

۶- تأمین منابع

6-1- منابع شرکت :

6-2- شرکاﺀ :

٧- جذابیت یک موقعیت :

7-1- شدت رقابت

رقبای نزدیک (Adjacent competitors) :

بررسی رقبا : (competitor Map)

7-2- پویایی های مربوط با مشتریان :

7-3- فناوری :

7-4- سود دهی مالی :

8-ارزیابی نهایی(go/No-go)

مدلهای کسب و کار

آیا شرکت قادر است در مورد ارزش یا ارزشهای ارائه شده با دیگران رقابت کند؟

چگونه یک شرکت یک سرویس آنلاین را توسعه می دهد؟

یک سیستم منابع مناسب و موفق چگونه است؟

معیارهایی برای ارزیابی کیفیت یک سیستم منبع:

مشارکت (Partnership):

مدلهای سوددهی برای شرکتهای آنلاین چه هستند؟

2-1- مدلهای مبتنی بر کاربر و شرکت:

مدلهای مبتنی بر خلق ارزش توسط شرکت:

واسط مشتری

1- هفت عنصر طراحی برای واسط مشتری

2- چه چیز تعیین کننده جلوه یک وب سایت است؟

3- محتویات وب سایت

4- تشکل ها در سایت

5- اهرمهای مورد استفاده برای سفارشی کردن یک سایت

6- یک سایت چگونه با مشتریان خود ارتباط بر قرار می کند؟

7- اتصال یک وب سایت با وب سایتهای دیگر

8- اشکال مختلف تجارت در وب سایت

تبادل الکترونیکی داده ها (EDI)

1- انواع خرید یک شرکت

2- خرید مواد مستقیم

3- تبادل الکترونیکی داده ها (EDI)

EDI های نسل آینده

منابع

دانلود دانلود فایل ورد Word نقش داده کاوی در تجارت الکترونیک

دانلود فایل ورد Word مقاله استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray


دانلود فایل ورد Word مقاله استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک

عنوان استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک تعداد صفحات 92 چکیده شبکه های تنظیم کننده ژنتیکی مجموعه ای از ارتباطات ژنژن هستند که رابطه علت و معلولی را در فعالیت های ژنی ایجاد می کنند دانش ما در مورد این شبکه ها نقش بسیار موثری در شناخت فرآیندهای زیستی ایفا می کند و می تواند باع

دانلود دانلود فایل ورد Word مقاله استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک

استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 660 کیلو بایت
تعداد صفحات فایل 92

عنوان : استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک

تعداد صفحات : 92

چکیده

شبکه های تنظیم کننده ژنتیکی مجموعه ای از ارتباطات ژن-ژن هستند که رابطه علت و معلولی را در فعالیت های ژنی ایجاد می کنند. دانش ما در مورد این شبکه ها نقش بسیار موثری در شناخت فرآیندهای زیستی ایفا می کند و می تواند باعث کشف روش های جدید برای درمان بیماری های پیچیده و تولید داروهای اثر گذار گردد.

روش های زیادی برای تشخیص شبکه های تنظیم کننده ژنتیکی پیشنهاد شده است. در این میان، شبکه های بیزین دینامیک مزایای ویژه ای دارا می باشند که باعث شده تا توجه زیادی را به خود جلب کنند.

با وجود تحقیقات انجام شده در این زمینه، مهندسی معکوس شبکه های تنظیم کننده ژن به وسیله شبکه های بیزین دینامیک به هیچ عنوان امری بدیهی نیست. غالباً تعداد نمونه های موجود برای آموزش مدل از تعداد مجهولات مسئله بسیار کمتر است. همچنین میزان پیچیدگی زیاد این مدل ها و دقت آنها از مهم ترین نواقص آن ها می باشند.

یکی از عمده ترین روش هایی که برای بالا بردن دقت شبکه های استنتاج شده به کار گرفته می شود استفاده از دانش اولیه در مورد شبکه های تنظیم کننده ژنی است. یکی از منابع عمده این دانش اولیه اطلاعات ما در مورد ساختار کلی شبکه های تنظیم کننده ژنی است. تحقیقات انجام شده نشان می دهند که تعداد یال های موجود در این شبکه ها کم است. همچنین شواهد بسیاری بدست آمده اند که نشان می دهند توزیع درجه خروجی در شبکه های تنظیم ژنی از قانون توانی پیروی می کنند. در واقع این شبکه ها در درجه خروجی scale-free هستند.

علیرغم این شواهد، روش های یادگیری شبکه های بیزین دینامیک این گونه شبکه ها را شبکه هایی با ساختار تصادفی در نظر می گیرند و یا تنها پیچیدگی شبکه را کنترل می کنند.

در این تحقیق روشی برای یاد گیری شبکه های بیزین دینامیک ارائه می شود که به طور مشخص بر این فرض شکل گرفته که شبکه واقعی ساختاری scale-free در توزیع درجه خروجی دارد. روش ارائه شده پیچیدگی زمانی چند جمله ای دارد و می تواند برای استنتاج شبکه هایی با تعداد گره های زیاد مورد استفاده قرار گیرد.

آزمایش هایی که برای مقایسه توانایی الگوریتم ارائه شده با متدهای قبلی یادگیری شبکه انجام شده اند نشان می دهند که الگوریتم ارائه شده، زمانی که برای استنتاج شبکه هایی استفاده می شود که scale-free هستند، قادر است کیفیت شبکه استنتاج شده را به خصوص زمانی که داده های آموزشی ناکافی هستند به صورت قابل توجهی افزایش دهد.

 

فهرست مطالب:

فصل اول: مقدمه

  • ضرورت انجام کار
  • نگاه کلی به فصول رساله

 

فصل دوم: پیشینه تحقیق

2-1- مقدمه

2-2- مقدمات زیستی

2-2-1- ژن

2-2-2- بیان ژن

2-2-3- شبکه های تنظیم کننده ژنی

2-3- روش های یاد گیری شبکه های تنظیم کننده ژنی

2-3-1- روش های مبتنی بر خوشه بندی

2-3-2- روش های مبتنی بر رگرسیون

2-3-3- روش های مبتنی بر اطلاعات متقابل

2-3-4- روش های تابعی

2-3-5- روش های مبتنی بر تئوری سیستم

2-3-6- روش های بیزین

فصل سوم: روش پیشنهادی

3-1- مقدمه

3-2- شبکه های بیزین دینامیک
3-3- یادگیری شبکه های بیزین دینامیک
3-3-1- روش های امتیازدهی بیزین
3-3-1-1- امتیازدهی به روش K2
3-3-1-2- امتیازدهی به روش BDe

3-3-2- روش های امتیازدهی بر اساس تئوری اطلاعات

3-3-2-1- امتیازدهی به روش log-likelihood (LL) 3-3-2-2- امتیازدهی به روش BIC

3-3-2-3- امتیازدهی به روش AIC 3-3-2-4- امتیازدهی به روش MIT 3-3-3پیچیدگی زمانی یادگیری شبکه های بیزین دینامیک

3-4- شبکه های تصادفی و شبکه های Scale-free

3-5- روش پیشنهادی

 

فصل چهارم: نتایج تجربی

4-1- مقدمه

4-2- روش های تولید شبکه های Scale-free 4-3- روش های سنجش دقت برای شبکه های استنتاج شده

4-4- آزمایش اول: استفاده از روش جستجوی کامل

4-5- آزمایش دوم: نگاهی دقیق تر به عملکرد روش ارائه شده

4-6- آزمایش سوم: استفاده از جستجوی حریصانه

4-7- آزمایش چهارم: بازیابی قسمتی از شبکه تنظیمات ژنی در Yeast

4-8- آزمایش پنجم: : عملکرد روش ارائه شده در بازیابی شبکه های تصادفی

 

فصل پنجم: جمع بندی

5-1- نتیجه گیری

5-2- پیشنهاد برای کارهای آتی

 

منابع تحقیق

چکیده به زبان انگلیسی

 

پروژه دارای فهرست جداول و اشکال می باشد

دانلود دانلود فایل ورد Word مقاله استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک

دانلود متن کامل ورد Word داده کاوی پویا با استفاده از عامل


دانلود متن کامل ورد Word داده کاوی پویا با استفاده از عامل

تعداد صفحات 157 چکیده امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره ­گیری از روشهایی همچون داده ­کاوی برای استخراج دانش و اطلاعات نهفته در داده­ها، امری غیرقابل اجتناب می­باشد بدلیل حجم بسیار بالای داده­ ها در بسیاری از کاربردها و اهمیت بیشتر داده­ های جدید، ذخیره ­سازی این داده ­ها امری مقرون به صرفه نیست

دانلود دانلود متن کامل ورد Word داده کاوی پویا با استفاده از عامل

دانلود متن ورد Word داده کاوی پویا با استفاده از عامل
دانلود متن کامل Word داده کاوی پویا با استفاده از عامل
دانلود متن کامل ورد داده کاوی پویا با استفاده از عامل
دانلود داده کاوی پویا با استفاده از عامل
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 447 کیلو بایت
تعداد صفحات فایل 157

 

 تعداد صفحات : 157

چکیده

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره ­گیری از روشهایی همچون داده ­کاوی برای استخراج دانش و اطلاعات نهفته در داده­ها، امری غیرقابل اجتناب می­باشد. بدلیل حجم بسیار بالای داده­ ها در بسیاری از کاربردها و اهمیت بیشتر داده­ های جدید، ذخیره ­سازی این داده ­ها امری مقرون به صرفه نیست، لذا داده ­هایی که باید مورد پردازش قرار گیرند، همواره بصوت پویا در حال تغییر و تحول هستند. مساله دیگری که امروزه در بحث داده ­کاوی وجود دارد، بحث توزیع شدگی ذاتی داده­ها است. معمولا پایگاه هایی که این داده­ ها را ایجاد یا دریافت می­کنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود می­باشند و حاضر نیستند دانش خود را بطور رایگان در اختیار دیگران قرار دهند.

با توجه به قابلیتهای عامل و سیستمهای چندعامله و مناسب بودن آنها برای محیطهای پویا و توزیع شده بنظر می­رسد که بتوان از قابلیت های آنها برای داده­کاوی در محیطهای پویا و محیطهای توزیع شده بهره برد. اکثر کارهایی که تاکنون در زمینه بهره­گیری از عامل و سیستمهای چندعامله انجام شده است خصوصیتهایی همانند خودآغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، یادگیری، قابلیت استدلال، هدف گرایی و قابلیت های اجتماعی عاملها مورد بررسی قرار نگرفته است. در این تحقیق ما قصد داریم تا ضمن بررسی کارهای موجود در زمینه کاربرد عامل و سیستم های چندعامله در داده­کاوی، بحث طبقه­ بندی جریان داده­ها را در یک محیط پویا مورد بررسی قرار دهیم. ما مساله خود را در دو فاز مورد بررسی قرار خواهیم داد. در فاز اول خصوصیت های یک عامل تنها مورد بررسی قرار خواهد گرفت و در فاز دوم قابلیت های اجتماعی عاملها مانند مذاکره، دستیابی به توافق و … برای داده­ کاوی در یک محیط پویا و توزیع­ شده رقابتی مورد استفاده قرار خواهد گرفت. بطور کلی دستاوردهای اصلی این تحقیق عبارتند از

1) ارائه یک رویکرد مبتنی بر عامل برای مساله طبقه­ بندی جریان داده­ های دارای تغییر مفهوم و پویا با استفاده از قابلیتهای هدف گرایی، هوشمندی، یادگیری و استدلال

2) ارائه یک رویکرد مبتنی بر سیستمهای چندعامله برای طبقه­بندی جریان داده­های توزیع­شده در یک محیط رقابتی با استفاده از قابلیتهای اجتماعی عاملها و دستیابی به توافق.

نتایج حاصل از آزمایشات انجام شده در این پایان­ نامه نشان­ دهنده برتری استفاده از عاملها و سیستم های چندعامله برای بحث طبقه­ بندی و داده ­کاوی در محیطهای پویا و توزیع شده می­باشد.

فهرست مطالب

 

  1. فصل اول – معرفی و آشنایی با مفاهیم اولیه

1-1- مقدمه­ ای بر داده­ کاوی

1-1-1- خوشه­ بندی

1-1-2- کشف قواعد وابستگی

1-1-3- طبقه­ بندی

1-1-3-1- طبقه­ بندی مبتنی بر قواعد

1-2- داده­ کاوی توزیع­ شده

1-3- عاملها و سیستم های چندعامله

1-3-1- عامل

1-3-1-1- مقایسه عامل با شی

1-3-1-2- معماری عامل ها

1-3-1-3- معماری BDI

1-3-2- سیستم ­های چندعامله

1-3-2-1- مذاکره

1-4- بهره ­گیری از عامل برای داده کاوی

1-4-1- سیستم­ های چندعامله، بستری برای داده­ کاوی توزیع شده

1-5- جمع ­بندی

  1. فصل دوم – داده­ کاوی پویا

2-1- مقدمه­ ای بر داده­ کاوی پویا

2-2- جریان داده

2-3- طبقه­ بندی جریان داده

2-3-1- موضوعات پژوهشی

2-4- جمع­ بندی

  1. فصل سوم – مروری بر کارهای انجام شده

3-1- مقدمه

3-2- داده­ کاوی توزیع­ شده ایستا

3-2-1- روشهای غیرمتمرکز

3-2-2- روشهای مبتنی بر توزیع ذاتی داده ­ها

3-3- کارهای مهم انجام شده در زمینه داده ­کاوی با استفاده از عامل 

3-4- کارهای انجام شده در زمینه طبقه­ بندی جریان داده ­ها

3-4-1- روشهای طبقه­ بندی Ensemble-based

3-4-2- درختهای تصمیم بسیار سریع

3-4-3- طبقه­ بندی On-Demand

3-4-4- OLIN

3-4-5- الگوریتم های LWClass

3-4-6- الگوریتم ANNCAD

3-4-7- الگوریتم SCALLOP

3-4-8- طبقه ­بندی جریان داده ­ها با استفاده از یک روش Rule-based

3-5- جمع­ بندی

  1. فصل چهارم – تعریف مساله

4-1- مقدمه

4-2- تعریف مساله برای فاز اول

4-2-1- جریان داده

4-2-2- مفهوم یا مدل موجود در جریان داده

4-2-3- مساله طبقه­ بندی جریان داده­ های دارای تغییر مفهوم

4-3- تعریف مساله برای فاز دوم

  1. فصل پنجم – رویکردهای پیشنهادی

5-1- مقدمه

5-2- رویکرد پیشنهادی برای فاز اول پروژه

5-2-1- عامل و ویژگی های آن در این مساله

5-2-2- عملکرد کلی عامل

5-2-3- معماری عامل

5-2-3-1- حسگرها

5-2-3-2- پایگاه دانش عامل

5-2-3-3- تابع ارزیابی محیط

5-2-3-3-1- نحوه تشخیص اطلاعات و نگهداری الگوهای recur در جریان داده  

5-2-3-3-2- نحوه استخراج الگوهای recur

5-2-3-3-3- نحوه بروزرسانی اطلاعات مربوط به الگوهای recur

5-2-3-3-4- نحوه محاسبه وقوع احتمال وقوع یک الگوی خاص

5-2-3-4- تابع سودمندی

5-2-3-5- بخش تصمیم­ گیری و Planning

5-2-3-5-1- بخش تصمیم­ گیری

5-2-3-5-2- Planning

5-2-3-6- بخش Action

5-3- رویکرد پیشنهادی برای فاز دوم مساله

5-3-1- عاملهای مشتری

5-3-2- عامل صفحه زرد

5-3-3- عاملهای داده­ کاو

5-3-3-1- معماری عاملهای داده­ کاو

5-3-3-1-1- تابع BRF

5-3-3-1-2- تابع Generate Options

5-3-3-1-3- تابع فیلتر

5-3-3-1-4- بخش Actions

5-3-3-1-5- Plan های عامل

5-3-3-1-5- 1- Plan مربوط به طبقه­ بندی

5-3-3-1-5-2- Plan مربوط به تطبیق طبقه ­بند

5-3-3-1-5-3- Plan مربوط به خرید و فروش قواعد با استفاده از مذاکره  

5-4- جمع ­بندی

  1. فصل ششم – آزمایشات و نتایج

6-1- مقدمه

6-2- محیط عملیاتی

6-3- مجموعه داده­ های مورد استفاده

6-3-1- مجموعه داده­ های استاندارد

6-3-2- مجموعه داده­ های واقعی

6-4- معیارهای ارزیابی و روشهای مورد استفاده برای مقایسه

6-5- آزمایشات انجام شده

6-5-1- آزمایشات مربوط به فاز اول

6-5-2- آزمایشات مربوط به فاز دوم

6-6- جمع ­بندی

  1. فصل هفتم- جمع­بندی و نتیجه­ گیری

 فهرست مراجع

 

فهرست اشکال

 

  1. شکل 1-1- معماری BDI در عامل
  2. شکل 3-1- درخت تحقیق مربوط به طبقه­بندی در مبحث داده­کاوی
  3. شکل 3-2- طبقه­ بندی مبتنی بر Ensemble. Error! Bookmark not defined
  4. شکل 3-3- چارچوب روش On-Demand
  5. شکل 3-4- نمایی از سیستم OLIN
  6. شکل 3-5- پروسه SCALLOP
  7. شکل 5-1- نمودار ترتیب عملکرد عامل پیشنهادی
  8. شکل 5-2- معماری عامل پیشنهادی
  9. شکل 5-3- پنجره نظاره بر روی جریان داده­ها
  10. شکل 5-4- گراف ایجاد شده از روی رشته مفهوم­ها
  11. شکل 5-5- محل تجمع الگوهای استخراج شده از رشته مفهوم­ها
  12. شکل 5-6- میزان محاسبه شده احتمالها به ازای مقادیر مختلف K
  13. شکل 5-7- شبه کد Plan کلی عامل
  14. شکل 5-8- نسبت واریانس به حاصلضرب 50 متغیر دارای مجموع ثابت
  15. شکل 5-9- وزن دهی چند داده مختلف
  16. شکل 5-10- نمایی کلی از سیستم چندعامله ایجاد شده
  17. شکل 5-11- معماری BDI عامل داده­کاو
  18. شکل 5-12- بخشی از جریان داده و قواعد استخراج شده از آن
  19. شکل 5-13- بخشی از جریان داده و قواعد استخراج شده از آن
  20. شکل 6-1- کد نمونه برای استفاده از بسته نرم افزاری weka
  21. شکل 6-2- زمان لازم بر حسب میلی ثانیه برای داده ­های Stagger
  22. شکل 6-3- زمان مصرف شده برای تطبیق طبقه­بند
  23. شکل 6-4- نمودار مربوط به زمان پردازش روشهای مختلف برای داده­ های HyperPlan
  24. شکل 6-5- زمان مصرف شده برای تطبیق طبقه ­بند
  25. شکل 6-6- نمودار مربوط به زمان پردازش روشهای مختلف برای داده ­های Nursery
  26. شکل 6-7- زمان مصرف شده برای تطبیق طبقه­بند برای داده ­های Nursery
  27. شکل 6-8- عملکرد روشهای مختلف بر روی مجموعه داده HyperPlan
  28. شکل 6-9- نمودار عملکرد روشهای مختلف بر روی مجموعه داده HyperPlan در یک بازه کوچکتر
  29. شکل 6-10- نمودار عملکرد روشهای مختلف بر روی مجموعه داده HyperPlan در یک بازه کوچکتر
  30. شکل 6-11- زمان مصرف شده برای تطبیق طبقه­ بند برای داده­های HyperPlan
  31. شکل 6-12- عملکرد روشهای مختلف بر روی مجموعه داده Stagger
  32. شکل 6-13- زمان مصرف شده برای تطبیق طبقه­بند برای داده­های Stagger
  33. شکل 6-14- عملکرد روشهای مختلف بر روی مجموعه داده Nursery
  34. شکل 6-15- زمان مصرف شده برای تطبیق طبقه­ بند برای داده­های Nursery
  35. شکل 6-16- نمودار نتایج حاصل از طبقه­ بندی توزیع ­شده مجموعه داده Nursery

 

فهرست جدولها

 

  1. جدول 1-1- ویژگیهای یک عامل
  2. جدول 3-1- ماتریس حاصل از روش LWClass
  3. جدول 3-2- مقایسه تکنیک های ذکر شده
  4. جدول 5-1- ساختار اطلاعاتی ذخیره شده برای هر مفهوم و الگو
  5. جدول 5-2- ساختار اطلاعاتی مربوط به وقوع الگوی “CFDA”
  6. جدول 5-3- نمونه ای از خروجی تابع سودمندی عامل
  7. جدول 5-4- اطلاعات مورد استفاده برای تخمین سودمندی یک قاعده
  8. جدول 6-1- دقت طبقه­ بندی روشهای مختلف
  9. جدول 6-2- نتایج حاصل از طبقه­ بندی توزیع شده مجموعه داده Nursery در سه مفهوم مختلف

دانلود دانلود متن کامل ورد Word داده کاوی پویا با استفاده از عامل

دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی


دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی

عنوان کامل داده کاوی در بانکداری الکترونیکی دسته مهندسی کامپیوتر فرمت فایل WORD (قابل ویرایش) تعداد صفحات 95

دانلود دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی

دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی
دانلود فایل Word داده کاوی در بانکداری الکترونیکی
دانلود فایل ورد داده کاوی در بانکداری الکترونیکی
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 725 کیلو بایت
تعداد صفحات فایل 90
عنوان کامل: داده کاوی در بانکداری الکترونیکی
دسته: مهندسی کامپیوتر
فرمت فایل: WORD (قابل ویرایش)
تعداد صفحات: 95

 

چکیده:

امروزه داده ها قلب تپنده فرایند تجاری بیشتر شرکت ها تلقی می شوند،آن ها فارغ از خرد و کلان بودن نوع صنعت در تمامی صنایع نظیر ارتباطات، تولید ،بیمه، کارت اعتباری و بانکداری از طریق تعاملات در سیستم های عملیاتی شکل می گیرند. لذا نیازی به ابزاری است که بتوان داده های ذخیره شده را پردازش کرده و اطلاعات حاصل از آن را در اختیار کاربران قرار دهد. در این راستا سازمان های بسیاری در حال استفاده از داده کاوی برای کمک به مدیریت تمام فازهای ارتباط با مشتری هستند.این سازمان ها می تواند با برسی ویژگی ها و علت استفاده برخی از مشتریان از کالا ها و یا خدمات خود یا برسی علل عدم استقبال برخی از مشتریان از برخی کالاها نقاط قوت و ضعف خود را بیابند و در راستای بهبود کیفیت گام بردارند.امروزه به دلیل وجود بانکداری الکترنیکی ثبت اطلاعات تراکنشی راحت تر صورت می گیرد و همین امر موجب شده است روش های کمی جایگزین روش های کیفی شود.در این تحقیق به منظور شناسایی مشتریان بانک و تدوین استراتژی مناسب برای برخورد با آنها از داده کاوی و ابزار استفاده می شود. وهمچنین تقلبهای صورتهای مالی به شکل چشمگیری توجه عموم جامعه ،رسانه ها،سرماگذاران را به خود جلب کرده است و موسسات مالی و پولی به شدت به دنبال تسریع و سرعت عمل در شناخت فعالیت کلاهبرداران و متقلبان می باشند.لذا بکارگیری تکنیکهای شناسایی تقلب به منظور جلوگیری از اقدامات متقلبانه درسیستم های بانکداری الکتزونیک لازم است،عموما روش های شناسایی تقلب به دو دسته اصلی تشخیص ناهنجاری و تشخیص سوء استفاده تقسیم می شوند.در روش تشخیص ناهنجاری ،تاریخچه رفتار مشتری به عنوان یک ناهنجاری یا تقلب ثبت شود.روش سوء استفاده بر رفتارهای خاص مشتری تمرکز دارد و دقیقا رفتارهای شناخته شده را تقلب فرض می کند.در این تحقیق علاوه بر مقایسه روش های فوق و تشریح چگونگی عملکرد سازوکارهای مبتنی بر آن ،انواع تکنیکهای تشخیص تقلب در بانکداری الکترونیک ارائه و روشهای داده کاوی مورد استفاده در کشف تقلب مزایا و معایب هریک به تفصیل شرح داده خواهد شد.

فهرست مطالب:
چکیده
فصل اول: مقدمه
۱٫۱٫ مقدمه
۱٫۲٫ تعریف مسائله و بیان سوال های اصلی تحقیق
۱٫۳٫ سابقه و ضرورت انجام تحقیق
۱٫۴٫ هدف
۱٫۵٫ کاربرد
فصل دوم: مفاهیم واصطلاحات
۲٫۱٫ مقدمه
۲٫۲٫ تاریخچه ی داده کاوی
۲٫۳٫ تعریف داده کاوی
۲٫۴٫ روش های داده کاوی
۲٫۴٫۱٫ خوشه بندی
۲٫۴٫۱٫۱٫ روش تقسیم بندی
۲٫۴٫۱٫۲٫ روش سلسه مراتبی
۲٫۴٫۱٫۳٫ روش مبتنی بر چگالی
۲٫۴٫۲٫ کشف قواعد وابستگی
۲٫۴٫۳٫ طبقه بندی
۲٫۵٫ مراحل داده کاوی
۲٫۶٫ اندازه گیری نتایج
۲٫۷٫ آمار و داده کاوی
۲٫۸٫ بانکداری الکترونیک
۲٫۹٫ تاریخچه بانکداری الکترونیک در ایران
۲٫۱۰٫ سیستم های بانکداری الکترونیکی
۲٫۱۱٫ شاخه های بانکداری الکترونیک برحسب نیازهای بازار بانکداری الکترونیک
۲٫۱۲٫ مزایای بانکداری الکترونیک
۲٫۱۳٫ پول الکترونیکی
۲٫۱۴٫ انواع پول الکترونیکی
۲٫۱۴٫۱٫ پول الکترونیکی شناسایی شده
۲٫۱۴٫۲٫ پول الکترونیکی غیرقابل شناسایی (بی‌نام و نشان)
۲٫۱۵٫ نتیجه گیری
فصل سوم: مدیریت ارتباط با مشتری در صنعت بانکداری الکترونیکی
۳٫۱٫ مقدمه
۳٫۲٫ مدیریت ارتباط با مشتری
CRM
۳٫۳٫ ارتباط
۳٫۴٫ هرم ارزش مسشتری
۳٫۵٫ خوشه بندی مشتریان بانک ملت با استفاده از داده کاوی
۳٫۶٫ استخراج داده های مربوط به شاخص ها
۳٫۷٫ بررسی وضعیت داده و آماده سازی آن
۳٫۸٫ برسی عدم همبستگی فیلدها با استفاده از آنالیز واریانس
۳٫۹٫ تقسیم بندی مشتریان در گروه به صورت غیر فازی
۳٫۹٫۱٫ تقسیم بندی مشتریان به ۵ گروه به صورت فازی
۳٫۹٫۲٫ تحلیل خوشه ها
۳٫۱۰٫ استخراج قواعد
۳٫۱۱٫ ایجاد نرم افزار های داده کاوی برای مدیریت روابط مشتری
۳٫۱۱٫۱٫ تقسیم بندی مشتری
۳٫۱۱٫۲٫ پیش بینی رویگردانی
۳٫۱۲٫ پیشنهادات
۳٫۱۳٫ نتیجه گیری
فصل چهارم: روش ها و راهکارهای شناسایی تقلب در بانکداری الکترونیک
۴٫۱٫ مقدمه
۴٫۲٫ تقلب
۴٫۳٫ شناسایی تقلب
۴٫۴٫ انواع تقلب در بستر بانکداری الکترونیک
۴٫۴٫۱٫ تشخیص سو استفاده
۴٫۴٫۲٫ تشخیص ناهنجاری
۴٫۵٫ تکنیک تشخیص تقلب
۴٫۵٫۱٫ سیستم خبره
۴٫۵٫۲٫ برون هشته ای
۴٫۵٫۳٫ شبکه عصبی
۴٫۵٫۴٫ استدلال بر پایه مدل
۴٫۵٫۵٫ رویکرد میتنی بر قواعد
۴٫۵٫۶٫ تجزیه و تحلیل حالت گذار
۴٫۵٫۷٫ تکنیک ها
۴٫۵٫۸٫ داده کاوی
۴٫۶٫ وظایف داده کاوی
۴٫۶٫۱٫ طبقه بندی
۴٫۶٫۲٫ خوشه بندی
۴٫۶٫۳٫ پیش بینی
۴٫۶٫۴٫ کشف نقاط پرت
۴٫۶٫۵٫ رگرسیون
۴٫۶٫۶٫ تصویرسازی
۴٫۷٫ روشهای داده کاوی در مورد استفاده در تحقیقات کشف تقلبهای مالی
۴٫۷٫۱٫ مدل رگرسیون
۴٫۷٫۲٫ شبکه های عصبی مصنوعی
۴٫۷٫۳٫ شبکه استنباط بیزین
۴٫۷٫۴٫ درختان تصمیم
۴٫۸٫ یک چارچوب کلی برای الگورتیم های داده کاوی
۴٫۹٫ راه آینده چالشهای پیش رو
۴٫۱۰٫ نتیجه گیری
منابع و مراجع
واژه نامه فارسی به انگلیسی
واژه نامه انگلیسی به فارسی
فهرست اشکال و نمودارها:
شکل ۱-۲٫ مراحل داده کاوی
شکل۱-۳ . مدیریت فرایند کسب و کار
شکل ۲-۳٫ هرم ارزش مشتری براساس ۵ خوشه بدست آمده
شکل ۳-۳٫ تلفیق رفتار داده های دموگرافیک
شکل ۴-۳٫ دلایل برای رویگردانی داوطلبانه
شکل ۱-۴٫ چرخه حیات مالی
نمودار ۱-۴٫ چگونگی دسته بندی داده ها براساس رفتارعادی
نمودار ۲-۴٫ ناهنجاری متنی
نمودار ۳-۴٫ ناهنجاری انبوه
شکل ۲-۴٫ روشهای داده کاوی استفاده شده برای کشف انواع تقلبهای مالی (
Ngai et,al.2010)
شکل ۵-۴٫ چارچوب کلی کشف تقلبهای مالی با استفاده از کارایی (
Yue et,al .2007 )
فهرست جداول:
جدول۱-۳ . مراکز ۵ خوشه به روش غیر فازی
جدول۲-۳ . نمونه ای از خروجی نرم افزار
Spss
جدول ۳-۳٫نمونه ای از خروجی نرم افزار
DataEngin
جدول ۴-۳٫ تراکم خوشه ها با استفاده از روش غیر فازی و فازی
جدول ۵-۳٫مقادیر بدست آمده برای
µ با تعداد خوشه های مختلف
جدول ۶-۳ . مقادیر محاسبه شده برای ارزیابی خوشه ها با استفاده از معادلات ذکر شده
جدول۱-۴ . طبقه بندی تقلبهای مالی (
Ngai et,al.2010)
جدول ۲- ۴٫ جدول زیان های حاصل از تقلب های مالی از طریق کارت های اعتباری بانکی در انگلستان (۲۰۰۴ تا ۲۰۰۷)-منبع
APAGS سال ۲۰۰۶ (آمار به میلیون پوند)
جدول ۳-۴ .جمع زیان های حاصل از تقلب های مالی از طریق سیستم های بانکداری الکترونیکی در انگلستان (۲۰۰۴ تا ۲۰۰۷)- منبع
APAGS سال ۲۰۰۶ (آمار به میلیون پوند)
جدول ۴-۴٫اهداف اصلی تحقیقتهای انجام شده در مورد کشف تقلبهای شزکتی از سال ۱۹۹۷ تا ۲۰۰۸ (
Ngai et.al ,2010)

دانلود دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی

دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان


دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

عنوانپیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان تعداد صفحات 115 چکیده برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریمپیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش استروش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرداما این روش ها برای داده های نامتوازن منا

دانلود دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 1927 کیلو بایت
تعداد صفحات فایل 115

عنوان:پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

تعداد صفحات :115

چکیده:

برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.پیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش است.روش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرد.اما این روش ها برای داده های نامتوازن مناسب نیستند. اصطلاح “مجموعه داده نامتوازن” عموما به مجموعه داده‌ای گفته می‌شود که در آن تعداد نمونه‌هایی که نمایانگر یک کلاس هستند از نمونه‌های دیگر در کلاس‌های متفاوت کمتر است مشکل عدم توازن کلاس در بسیاری از برنامه های کاربردی جهان واقعی به رسمیت شناخته شده است و موضوع تحقیقات یادگیری مبتنی بر ماشین قرار گرفته است از این رو اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی داده کاوی قرار گرفته است.آنها به دنبال کشف روش هایی بودند که با اعمال بر روی داده های نامتوازن به نتایج مطلوبی دست یابند.

در این پروژه روش های گوناگون پیش پردازش داده های نامتوازن مورد بحث قرار گرفته و الگوریتم جدیدی برای بهبود نتایج طبقه بندی ارائه می­شود، به گونه ای که کارایی و دقت آن مورد توجه باشد.

 

 

 

فصل اول: مقدمه و کلیات تحقیق

1-1- مقدمه

کشف دانش و داده کاوی یک حوزه جدید میان رشته ای و در حال رشد است که حوزه های مختلفی همچون پایگاه داده، آمار، یادگیری ماشین و سایر زمینه های مرتبط را با هم تلفیق کرده تا اطلاعات و دانش ارزشمند نهفته در حجم بزرگی از داده ها را استخراج کند.هدف کشف دانش و داده کاوی یافتن الگوها در پایگاه داده است که در میان حجم عظیمی از داده ها مخفی هستند]1[ .کشف دانش شامل مراحل متعددی است که در این تحقیق به مرحله پیش پردازش توجه می­کنیم.

 

مرحله آماده سازی داده ها مهم ترین و زمانبرترین مرحله در پروژه های داده کاوی است.از آنجا که داده ها در این پروژه ها ورودی پروژه هستند هر قدر این ورودی دقیق تر باشد، خروجی کار دقیق تر خواهد بود.یعنی ما از پدیده “ورودی نامناسب، خروجی نامناسب ” دور می­شویم]1[.داده های خام معمولا دچار مشکلاتی مانند نویز، داده پرت، تغییرات در نمونه برداری هستند و استفاده از آنها به همین صورت موجب تضعیف نتایج مورد انتظار میشود.بنابراین باید از روشی برای بهبود نتایج استفاده کرد.پیش پردازش داده ها جهت بهبود کیفیت داده های واقعی برای داده کاوی لازم است.بنابراین پردازش اولیه ای مورد نیاز است تا مقادیر مفقوده، انحرافات و مسائلی از این دست را در داده های اولیه بیابد. پیش پردازش داده ها شامل همه تبدیلاتی است که بر روی داده های خام صورت می­گیرد وآنها را به صورتی در می­آورد که برای پردازشهای بعدی نظیر استفاده در دسته بندی و خوشه بندی، ساده تر و موثرتر می­سازد.

در حال حاضر سازمانها نیاز دارند تا بتوانند داده ها را به صورت کاراتر دسته بندی کنند و از تحلیل نتایج آن برای بهبود روند پیشرفت کسب و کار استفاده نمایند.ممکن است که داده های در دسترس ، داده هایی مبهم و مغشوش باشند و یا کلاس های داده نامتوازن باشند. بنابراین نیاز به پیش پردازش دقیق داده ها رو به افزایش است. برای پاسخ به این نیاز رو به افزایش ، افراد همواره سعی در ارائه روش های نوین و موثرتری دارند.

1-2بیان مساله

هرچند که روشهای مختلفی برای پیش پردازش داده ها موجود است ولی عملکرد و دقت این روش ها متفاوت است و تلاش در جهت ارائه روشی کارامد امری ضروری است.با توجه به اهمیت داده ها در جهان کنونی و افزایش حجم داده ها مساله پیش پردازش مناسب داده ها، بخصوص داده های نامتوازن یک چالش به نظر می­رسد.اغلب روش های موجود در پیش پردازش داده های ناتوازن به سمت کلاس اکثریت تمایل دارند و این امر باعث می شود که داده های کلاس اقلیت به صورت نویز در نظر گرفته شود.

همانطور که پیش از این نیز گفته شد برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.میتوان ادعا کرد که اگر مرحله آماده سازی داده ها به خوبی صورت نپذیرد، نتایجی بدست می­آید که نمی­تواند مورد استفاده قرار گیرد و ممکن است که هزینه و زمان به کار رفته برای دست یابی به نتیجه موثر هدر رود و نتایج حاصل به دلیل عدم پیش پردازش مناسب داده غیر قابل استفاده و نادرست باشد.

اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی داده کاوی قرار گرفته است. در موارد متعددی کلاسی که از نقطه نظر دامنه ی کاربردی اهمیت زیادی دارد(کلاس اصلی) شامل تعداد حالات کمتری نسبت به کلاسی است که کلاس اکثریت می­باشد. این مجموعه ی داده ها نامتوازن نامیده می­شود. رویکرد سنتی داده کاوی توانایی خوبی برای پیش بینی نمونه های اقلیت که مورد توجه است ندارند. متأسفانه در اکثر موارد داده های واقعی دارای این خصوصیت هستند. به عنوان مثال در تشخیص بیماری­های نادر، حملات شبکه، متنکاوی و … معمولاً توزیع داده­ها نامتوازن می باشد.

در واقع مساله این است که چگونه میتوان داده های نامتوازن را به گونه ای پیش پردازش کرد که در خوشه های مناسب و درست طبقه بندی شوند.بنابراین مساله این تحقیق ارائه روشی جهت پیش پردازش داده های نا متوازن است به گونه ای که کارایی و دقت آن در مقایسه با روش های دیگر بیشتر باشد.

در روش ارائه شده در این تحقیق برای ارتقای روش ماشین بردار پشتیبان از تکنیک حداقل مربعات با متر اقلیدسی استفاده نمودیم.این روش بهبود یافته را M-SVM می­نامیم.بنابراین مساله را بدین شکل طرح می نماییم، چگونه می­توان در روش پیش پردازش داده های نامتوازن به دقت بالاتری دست یافت و از پیش پردازش صحیح داده برای دست یابی به نتایج صحیح در حوزه کاربردی استفاده نمود.از انجا که داده های متفاوتی وجود دارد ما پیش پردازش بر روی مجموعه داده های نامتوازن را انتحاب کردیم.

3-1- اهداف تحقیق

هدف از این تحقیق ارائه راهکاری به منظور افزایش دقت متعادل سازی داده و غلبه بر مشکل عدم توازن کلاس است.سعی کرده ایم تا متعادل سازی داده که در مرحله پیش پردازش داده صورت می­گیرد باعث بهبود نتایج طبقه بندی نمونه ها شود.بدین منظور اثربخشی و کارایی روش ارائه شده با سایر روش های موجود مورد مقایسه و ارزیابی قرار می­گیرد.امید است که نتایج الگوریتم نهایی امیدوار کننده باشد و نشان دهنده پیشرفت الگوریتم باشد.این تحقیق بر اساس نیاز به دسته بندی دقیق داده ها و استفاده از تحلیل نتایج داده ها در بهبود شرایط مرجع مورد استفاده کننده داده ها شکل گرفته است.

فهرست مطالب:

فصل اول مقدمه و کلیات تحقیق

1-1مقدمه

1-2بیان مساله

1-3 اهداف تحقیق

1-4 پرسش های اصلی تحقیق

1-5فرضیه های تحقیق

1-6 نوآوری تحقیق

1-7 تعریف واژگان کلیدی

1-8 ساختار پروژه

فصل دوم ادبیات و پیشینه تحقیق

2-1 مقدمه

2-2 مفاهیم داده کاوی

2-2-1 تعاریف داده کاوی

2-2-2 فرایند کشف دانش

2-2-3 حوزه ها و عملکردهای داده کاوی

2-3 کاربردهای داده کاوی و کشف دانش

2-4 چالش هایی برای KDD

2-5 پیش پردازش و آماده سازی داده ها

2-5-1اجزای اصلی پیش پردازش داده ها

2-5-1-1 پاکسازی داده ها

2-5-1-2یکپارچه سازی داده ها

2-5-1-3 تبدیل داده ها

2-5-1-3-1هموار سازی

2-5-1-3-2 تجمیع

2-5-1-3-3 تعمیم

2-5-1-3-4 ساخت ویژگی

2-5-1-3-5 نرمال سازی

2-5-1-4 کاهش داده ها

2-5-1-4-1 تجمیع مکعبی داده

2-5-1-4-2 انتخاب زیر مجموعه مشخصه ها

2-5-1-4-3 کاهش تعدد نقاط

2-5-1-5 تصویر کردن برای کاهش بعد

2-6 روش های ارزیابی دسته بندی

2-6-1 ارزیابی صحت روشهای دسته بندی

2-7 تکنیک حداقل مربعات

2-7-1 تقریب کمترین مربعات گسسته چند جمله ای

2-8 ماشین بردار پشتیبان

2-8-1مقدمه

2-8-2دلایل استفاده از SVM

2-8-3 کاربردهای SVM

2-8-4 مزایا و معایب SVM

2-8-5 تعاریف کلی

2-8-5-1تابع تصمیم مسائل دو کلاسی

2-8-5-2 تعیین تابع تصمیم(ابر صفحه جداکننده)

2-8-5-3 بعد VC

2-8-5-4حداقل سازی ریسک تجربی

2-8-5-5حداقل سازی ریسک ساختاری

2-8-6 ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا شدنی به طور خطی

2-8-7ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا نشدنی به طور خطی

2-8-8 ماشین بردار پشتیبان غیر خطی

2-8-9 انواع کرنل ها

2-8-9-1 کرنل چند جمله ای

2-8-9-2 کرنل های شبکه عصبی

2-8-9-3 کرنل های گوسی

2-9 تکنیک های پیش پردازش نامتوازن

2-9-1 ماشین بردار پشتیبان و مشکل عدم توازن کلاس

2-9-1-1 عیب مشکل بهینه سازی با ناحیه مرزی نرم

2-9-1-2 نسبت بردار پشتیبان نامتوازن

2-9-2 روشهای یادگیری عدم توازن خارجی برای SVM (روشهای پیش پردازش داده)

2-9-2-1 روشهای نمونه برداری دوباره

2-9-2-1-1زیر نمونه برداری

2-9-2-1-2بیش نمونه برداری

2-9-2-1-3 SCM

2-9-2-1-4 نمونه برداری پیشرفته

2-9-2-1-5 تکنیک بیش نمونه برداری اقلیت مصنوعی

2-9-2-1-6 نزدیک ترین همسایه فشرده(CNN)

2-9-2-1-7 نزدیک ترین همسایه تغییر یافته(ENN)

2-9-2-1-8 Tomek-Link

2-9-2-2 روشهای یادگیری جمعی

2-9-2-2-1الگوریتم آموزشی Bagging

2-9-2-2-2 الگوریتم آموزشی Boosting

2-9-3 روشهای یادگیری عدم تعادل داخلی برای ماشین بردار پشتیبان

2-9-3-1 هزینه خطای متفاوت

2-9-3-2 یادگیری یک کلاس

2-9-3-3zSVM

2-9-3-4 روشهای اصلاح کرنل

2-9-3-5 یادگیری فعال

2-9-3-6 روش های ترکیبی

فصل سوم:روش تحقیق

3-1مقدمه

3-2 ماشین بردار پشتیبان فازی برای یادگیری عدم توازن کلاس

3-2-1 روش SVMFuzzy

3-2-2متد FSVM-CIL

3-3 ماشین بردار پشتیبان حداقل مربعات (LS-SVM)

3-4 الگوریتم پیشنهادی

فصل چهارم: محاسبات و یافته های تحقیق

4-1 مقدمه

4-2 مجموعه داده ها

4-3 نتایج کارایی روش های مختلف بر روی مجموعه داده ها

فصل پنجم:نتیجه گیری و پیشنهادات

5-1 جمع بندی و نتیجه گیری

5-2 کارهای آتی

منابع و مآخذ

چکیده انگلیسی

دانلود دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان