گیگاداک

گیگاداک

Gigadoc
گیگاداک

گیگاداک

Gigadoc

دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی


دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی

عنوان کامل داده کاوی در بانکداری الکترونیکی دسته مهندسی کامپیوتر فرمت فایل WORD (قابل ویرایش) تعداد صفحات 95

دانلود دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی

دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی
دانلود فایل Word داده کاوی در بانکداری الکترونیکی
دانلود فایل ورد داده کاوی در بانکداری الکترونیکی
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 725 کیلو بایت
تعداد صفحات فایل 90
عنوان کامل: داده کاوی در بانکداری الکترونیکی
دسته: مهندسی کامپیوتر
فرمت فایل: WORD (قابل ویرایش)
تعداد صفحات: 95

 

چکیده:

امروزه داده ها قلب تپنده فرایند تجاری بیشتر شرکت ها تلقی می شوند،آن ها فارغ از خرد و کلان بودن نوع صنعت در تمامی صنایع نظیر ارتباطات، تولید ،بیمه، کارت اعتباری و بانکداری از طریق تعاملات در سیستم های عملیاتی شکل می گیرند. لذا نیازی به ابزاری است که بتوان داده های ذخیره شده را پردازش کرده و اطلاعات حاصل از آن را در اختیار کاربران قرار دهد. در این راستا سازمان های بسیاری در حال استفاده از داده کاوی برای کمک به مدیریت تمام فازهای ارتباط با مشتری هستند.این سازمان ها می تواند با برسی ویژگی ها و علت استفاده برخی از مشتریان از کالا ها و یا خدمات خود یا برسی علل عدم استقبال برخی از مشتریان از برخی کالاها نقاط قوت و ضعف خود را بیابند و در راستای بهبود کیفیت گام بردارند.امروزه به دلیل وجود بانکداری الکترنیکی ثبت اطلاعات تراکنشی راحت تر صورت می گیرد و همین امر موجب شده است روش های کمی جایگزین روش های کیفی شود.در این تحقیق به منظور شناسایی مشتریان بانک و تدوین استراتژی مناسب برای برخورد با آنها از داده کاوی و ابزار استفاده می شود. وهمچنین تقلبهای صورتهای مالی به شکل چشمگیری توجه عموم جامعه ،رسانه ها،سرماگذاران را به خود جلب کرده است و موسسات مالی و پولی به شدت به دنبال تسریع و سرعت عمل در شناخت فعالیت کلاهبرداران و متقلبان می باشند.لذا بکارگیری تکنیکهای شناسایی تقلب به منظور جلوگیری از اقدامات متقلبانه درسیستم های بانکداری الکتزونیک لازم است،عموما روش های شناسایی تقلب به دو دسته اصلی تشخیص ناهنجاری و تشخیص سوء استفاده تقسیم می شوند.در روش تشخیص ناهنجاری ،تاریخچه رفتار مشتری به عنوان یک ناهنجاری یا تقلب ثبت شود.روش سوء استفاده بر رفتارهای خاص مشتری تمرکز دارد و دقیقا رفتارهای شناخته شده را تقلب فرض می کند.در این تحقیق علاوه بر مقایسه روش های فوق و تشریح چگونگی عملکرد سازوکارهای مبتنی بر آن ،انواع تکنیکهای تشخیص تقلب در بانکداری الکترونیک ارائه و روشهای داده کاوی مورد استفاده در کشف تقلب مزایا و معایب هریک به تفصیل شرح داده خواهد شد.

فهرست مطالب:
چکیده
فصل اول: مقدمه
۱٫۱٫ مقدمه
۱٫۲٫ تعریف مسائله و بیان سوال های اصلی تحقیق
۱٫۳٫ سابقه و ضرورت انجام تحقیق
۱٫۴٫ هدف
۱٫۵٫ کاربرد
فصل دوم: مفاهیم واصطلاحات
۲٫۱٫ مقدمه
۲٫۲٫ تاریخچه ی داده کاوی
۲٫۳٫ تعریف داده کاوی
۲٫۴٫ روش های داده کاوی
۲٫۴٫۱٫ خوشه بندی
۲٫۴٫۱٫۱٫ روش تقسیم بندی
۲٫۴٫۱٫۲٫ روش سلسه مراتبی
۲٫۴٫۱٫۳٫ روش مبتنی بر چگالی
۲٫۴٫۲٫ کشف قواعد وابستگی
۲٫۴٫۳٫ طبقه بندی
۲٫۵٫ مراحل داده کاوی
۲٫۶٫ اندازه گیری نتایج
۲٫۷٫ آمار و داده کاوی
۲٫۸٫ بانکداری الکترونیک
۲٫۹٫ تاریخچه بانکداری الکترونیک در ایران
۲٫۱۰٫ سیستم های بانکداری الکترونیکی
۲٫۱۱٫ شاخه های بانکداری الکترونیک برحسب نیازهای بازار بانکداری الکترونیک
۲٫۱۲٫ مزایای بانکداری الکترونیک
۲٫۱۳٫ پول الکترونیکی
۲٫۱۴٫ انواع پول الکترونیکی
۲٫۱۴٫۱٫ پول الکترونیکی شناسایی شده
۲٫۱۴٫۲٫ پول الکترونیکی غیرقابل شناسایی (بی‌نام و نشان)
۲٫۱۵٫ نتیجه گیری
فصل سوم: مدیریت ارتباط با مشتری در صنعت بانکداری الکترونیکی
۳٫۱٫ مقدمه
۳٫۲٫ مدیریت ارتباط با مشتری
CRM
۳٫۳٫ ارتباط
۳٫۴٫ هرم ارزش مسشتری
۳٫۵٫ خوشه بندی مشتریان بانک ملت با استفاده از داده کاوی
۳٫۶٫ استخراج داده های مربوط به شاخص ها
۳٫۷٫ بررسی وضعیت داده و آماده سازی آن
۳٫۸٫ برسی عدم همبستگی فیلدها با استفاده از آنالیز واریانس
۳٫۹٫ تقسیم بندی مشتریان در گروه به صورت غیر فازی
۳٫۹٫۱٫ تقسیم بندی مشتریان به ۵ گروه به صورت فازی
۳٫۹٫۲٫ تحلیل خوشه ها
۳٫۱۰٫ استخراج قواعد
۳٫۱۱٫ ایجاد نرم افزار های داده کاوی برای مدیریت روابط مشتری
۳٫۱۱٫۱٫ تقسیم بندی مشتری
۳٫۱۱٫۲٫ پیش بینی رویگردانی
۳٫۱۲٫ پیشنهادات
۳٫۱۳٫ نتیجه گیری
فصل چهارم: روش ها و راهکارهای شناسایی تقلب در بانکداری الکترونیک
۴٫۱٫ مقدمه
۴٫۲٫ تقلب
۴٫۳٫ شناسایی تقلب
۴٫۴٫ انواع تقلب در بستر بانکداری الکترونیک
۴٫۴٫۱٫ تشخیص سو استفاده
۴٫۴٫۲٫ تشخیص ناهنجاری
۴٫۵٫ تکنیک تشخیص تقلب
۴٫۵٫۱٫ سیستم خبره
۴٫۵٫۲٫ برون هشته ای
۴٫۵٫۳٫ شبکه عصبی
۴٫۵٫۴٫ استدلال بر پایه مدل
۴٫۵٫۵٫ رویکرد میتنی بر قواعد
۴٫۵٫۶٫ تجزیه و تحلیل حالت گذار
۴٫۵٫۷٫ تکنیک ها
۴٫۵٫۸٫ داده کاوی
۴٫۶٫ وظایف داده کاوی
۴٫۶٫۱٫ طبقه بندی
۴٫۶٫۲٫ خوشه بندی
۴٫۶٫۳٫ پیش بینی
۴٫۶٫۴٫ کشف نقاط پرت
۴٫۶٫۵٫ رگرسیون
۴٫۶٫۶٫ تصویرسازی
۴٫۷٫ روشهای داده کاوی در مورد استفاده در تحقیقات کشف تقلبهای مالی
۴٫۷٫۱٫ مدل رگرسیون
۴٫۷٫۲٫ شبکه های عصبی مصنوعی
۴٫۷٫۳٫ شبکه استنباط بیزین
۴٫۷٫۴٫ درختان تصمیم
۴٫۸٫ یک چارچوب کلی برای الگورتیم های داده کاوی
۴٫۹٫ راه آینده چالشهای پیش رو
۴٫۱۰٫ نتیجه گیری
منابع و مراجع
واژه نامه فارسی به انگلیسی
واژه نامه انگلیسی به فارسی
فهرست اشکال و نمودارها:
شکل ۱-۲٫ مراحل داده کاوی
شکل۱-۳ . مدیریت فرایند کسب و کار
شکل ۲-۳٫ هرم ارزش مشتری براساس ۵ خوشه بدست آمده
شکل ۳-۳٫ تلفیق رفتار داده های دموگرافیک
شکل ۴-۳٫ دلایل برای رویگردانی داوطلبانه
شکل ۱-۴٫ چرخه حیات مالی
نمودار ۱-۴٫ چگونگی دسته بندی داده ها براساس رفتارعادی
نمودار ۲-۴٫ ناهنجاری متنی
نمودار ۳-۴٫ ناهنجاری انبوه
شکل ۲-۴٫ روشهای داده کاوی استفاده شده برای کشف انواع تقلبهای مالی (
Ngai et,al.2010)
شکل ۵-۴٫ چارچوب کلی کشف تقلبهای مالی با استفاده از کارایی (
Yue et,al .2007 )
فهرست جداول:
جدول۱-۳ . مراکز ۵ خوشه به روش غیر فازی
جدول۲-۳ . نمونه ای از خروجی نرم افزار
Spss
جدول ۳-۳٫نمونه ای از خروجی نرم افزار
DataEngin
جدول ۴-۳٫ تراکم خوشه ها با استفاده از روش غیر فازی و فازی
جدول ۵-۳٫مقادیر بدست آمده برای
µ با تعداد خوشه های مختلف
جدول ۶-۳ . مقادیر محاسبه شده برای ارزیابی خوشه ها با استفاده از معادلات ذکر شده
جدول۱-۴ . طبقه بندی تقلبهای مالی (
Ngai et,al.2010)
جدول ۲- ۴٫ جدول زیان های حاصل از تقلب های مالی از طریق کارت های اعتباری بانکی در انگلستان (۲۰۰۴ تا ۲۰۰۷)-منبع
APAGS سال ۲۰۰۶ (آمار به میلیون پوند)
جدول ۳-۴ .جمع زیان های حاصل از تقلب های مالی از طریق سیستم های بانکداری الکترونیکی در انگلستان (۲۰۰۴ تا ۲۰۰۷)- منبع
APAGS سال ۲۰۰۶ (آمار به میلیون پوند)
جدول ۴-۴٫اهداف اصلی تحقیقتهای انجام شده در مورد کشف تقلبهای شزکتی از سال ۱۹۹۷ تا ۲۰۰۸ (
Ngai et.al ,2010)

دانلود دانلود فایل ورد Word داده کاوی در بانکداری الکترونیکی

دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان


دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

عنوانپیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان تعداد صفحات 115 چکیده برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریمپیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش استروش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرداما این روش ها برای داده های نامتوازن منا

دانلود دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 1927 کیلو بایت
تعداد صفحات فایل 115

عنوان:پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

تعداد صفحات :115

چکیده:

برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.پیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش است.روش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرد.اما این روش ها برای داده های نامتوازن مناسب نیستند. اصطلاح “مجموعه داده نامتوازن” عموما به مجموعه داده‌ای گفته می‌شود که در آن تعداد نمونه‌هایی که نمایانگر یک کلاس هستند از نمونه‌های دیگر در کلاس‌های متفاوت کمتر است مشکل عدم توازن کلاس در بسیاری از برنامه های کاربردی جهان واقعی به رسمیت شناخته شده است و موضوع تحقیقات یادگیری مبتنی بر ماشین قرار گرفته است از این رو اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی داده کاوی قرار گرفته است.آنها به دنبال کشف روش هایی بودند که با اعمال بر روی داده های نامتوازن به نتایج مطلوبی دست یابند.

در این پروژه روش های گوناگون پیش پردازش داده های نامتوازن مورد بحث قرار گرفته و الگوریتم جدیدی برای بهبود نتایج طبقه بندی ارائه می­شود، به گونه ای که کارایی و دقت آن مورد توجه باشد.

 

 

 

فصل اول: مقدمه و کلیات تحقیق

1-1- مقدمه

کشف دانش و داده کاوی یک حوزه جدید میان رشته ای و در حال رشد است که حوزه های مختلفی همچون پایگاه داده، آمار، یادگیری ماشین و سایر زمینه های مرتبط را با هم تلفیق کرده تا اطلاعات و دانش ارزشمند نهفته در حجم بزرگی از داده ها را استخراج کند.هدف کشف دانش و داده کاوی یافتن الگوها در پایگاه داده است که در میان حجم عظیمی از داده ها مخفی هستند]1[ .کشف دانش شامل مراحل متعددی است که در این تحقیق به مرحله پیش پردازش توجه می­کنیم.

 

مرحله آماده سازی داده ها مهم ترین و زمانبرترین مرحله در پروژه های داده کاوی است.از آنجا که داده ها در این پروژه ها ورودی پروژه هستند هر قدر این ورودی دقیق تر باشد، خروجی کار دقیق تر خواهد بود.یعنی ما از پدیده “ورودی نامناسب، خروجی نامناسب ” دور می­شویم]1[.داده های خام معمولا دچار مشکلاتی مانند نویز، داده پرت، تغییرات در نمونه برداری هستند و استفاده از آنها به همین صورت موجب تضعیف نتایج مورد انتظار میشود.بنابراین باید از روشی برای بهبود نتایج استفاده کرد.پیش پردازش داده ها جهت بهبود کیفیت داده های واقعی برای داده کاوی لازم است.بنابراین پردازش اولیه ای مورد نیاز است تا مقادیر مفقوده، انحرافات و مسائلی از این دست را در داده های اولیه بیابد. پیش پردازش داده ها شامل همه تبدیلاتی است که بر روی داده های خام صورت می­گیرد وآنها را به صورتی در می­آورد که برای پردازشهای بعدی نظیر استفاده در دسته بندی و خوشه بندی، ساده تر و موثرتر می­سازد.

در حال حاضر سازمانها نیاز دارند تا بتوانند داده ها را به صورت کاراتر دسته بندی کنند و از تحلیل نتایج آن برای بهبود روند پیشرفت کسب و کار استفاده نمایند.ممکن است که داده های در دسترس ، داده هایی مبهم و مغشوش باشند و یا کلاس های داده نامتوازن باشند. بنابراین نیاز به پیش پردازش دقیق داده ها رو به افزایش است. برای پاسخ به این نیاز رو به افزایش ، افراد همواره سعی در ارائه روش های نوین و موثرتری دارند.

1-2بیان مساله

هرچند که روشهای مختلفی برای پیش پردازش داده ها موجود است ولی عملکرد و دقت این روش ها متفاوت است و تلاش در جهت ارائه روشی کارامد امری ضروری است.با توجه به اهمیت داده ها در جهان کنونی و افزایش حجم داده ها مساله پیش پردازش مناسب داده ها، بخصوص داده های نامتوازن یک چالش به نظر می­رسد.اغلب روش های موجود در پیش پردازش داده های ناتوازن به سمت کلاس اکثریت تمایل دارند و این امر باعث می شود که داده های کلاس اقلیت به صورت نویز در نظر گرفته شود.

همانطور که پیش از این نیز گفته شد برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.میتوان ادعا کرد که اگر مرحله آماده سازی داده ها به خوبی صورت نپذیرد، نتایجی بدست می­آید که نمی­تواند مورد استفاده قرار گیرد و ممکن است که هزینه و زمان به کار رفته برای دست یابی به نتیجه موثر هدر رود و نتایج حاصل به دلیل عدم پیش پردازش مناسب داده غیر قابل استفاده و نادرست باشد.

اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینه ی داده کاوی قرار گرفته است. در موارد متعددی کلاسی که از نقطه نظر دامنه ی کاربردی اهمیت زیادی دارد(کلاس اصلی) شامل تعداد حالات کمتری نسبت به کلاسی است که کلاس اکثریت می­باشد. این مجموعه ی داده ها نامتوازن نامیده می­شود. رویکرد سنتی داده کاوی توانایی خوبی برای پیش بینی نمونه های اقلیت که مورد توجه است ندارند. متأسفانه در اکثر موارد داده های واقعی دارای این خصوصیت هستند. به عنوان مثال در تشخیص بیماری­های نادر، حملات شبکه، متنکاوی و … معمولاً توزیع داده­ها نامتوازن می باشد.

در واقع مساله این است که چگونه میتوان داده های نامتوازن را به گونه ای پیش پردازش کرد که در خوشه های مناسب و درست طبقه بندی شوند.بنابراین مساله این تحقیق ارائه روشی جهت پیش پردازش داده های نا متوازن است به گونه ای که کارایی و دقت آن در مقایسه با روش های دیگر بیشتر باشد.

در روش ارائه شده در این تحقیق برای ارتقای روش ماشین بردار پشتیبان از تکنیک حداقل مربعات با متر اقلیدسی استفاده نمودیم.این روش بهبود یافته را M-SVM می­نامیم.بنابراین مساله را بدین شکل طرح می نماییم، چگونه می­توان در روش پیش پردازش داده های نامتوازن به دقت بالاتری دست یافت و از پیش پردازش صحیح داده برای دست یابی به نتایج صحیح در حوزه کاربردی استفاده نمود.از انجا که داده های متفاوتی وجود دارد ما پیش پردازش بر روی مجموعه داده های نامتوازن را انتحاب کردیم.

3-1- اهداف تحقیق

هدف از این تحقیق ارائه راهکاری به منظور افزایش دقت متعادل سازی داده و غلبه بر مشکل عدم توازن کلاس است.سعی کرده ایم تا متعادل سازی داده که در مرحله پیش پردازش داده صورت می­گیرد باعث بهبود نتایج طبقه بندی نمونه ها شود.بدین منظور اثربخشی و کارایی روش ارائه شده با سایر روش های موجود مورد مقایسه و ارزیابی قرار می­گیرد.امید است که نتایج الگوریتم نهایی امیدوار کننده باشد و نشان دهنده پیشرفت الگوریتم باشد.این تحقیق بر اساس نیاز به دسته بندی دقیق داده ها و استفاده از تحلیل نتایج داده ها در بهبود شرایط مرجع مورد استفاده کننده داده ها شکل گرفته است.

فهرست مطالب:

فصل اول مقدمه و کلیات تحقیق

1-1مقدمه

1-2بیان مساله

1-3 اهداف تحقیق

1-4 پرسش های اصلی تحقیق

1-5فرضیه های تحقیق

1-6 نوآوری تحقیق

1-7 تعریف واژگان کلیدی

1-8 ساختار پروژه

فصل دوم ادبیات و پیشینه تحقیق

2-1 مقدمه

2-2 مفاهیم داده کاوی

2-2-1 تعاریف داده کاوی

2-2-2 فرایند کشف دانش

2-2-3 حوزه ها و عملکردهای داده کاوی

2-3 کاربردهای داده کاوی و کشف دانش

2-4 چالش هایی برای KDD

2-5 پیش پردازش و آماده سازی داده ها

2-5-1اجزای اصلی پیش پردازش داده ها

2-5-1-1 پاکسازی داده ها

2-5-1-2یکپارچه سازی داده ها

2-5-1-3 تبدیل داده ها

2-5-1-3-1هموار سازی

2-5-1-3-2 تجمیع

2-5-1-3-3 تعمیم

2-5-1-3-4 ساخت ویژگی

2-5-1-3-5 نرمال سازی

2-5-1-4 کاهش داده ها

2-5-1-4-1 تجمیع مکعبی داده

2-5-1-4-2 انتخاب زیر مجموعه مشخصه ها

2-5-1-4-3 کاهش تعدد نقاط

2-5-1-5 تصویر کردن برای کاهش بعد

2-6 روش های ارزیابی دسته بندی

2-6-1 ارزیابی صحت روشهای دسته بندی

2-7 تکنیک حداقل مربعات

2-7-1 تقریب کمترین مربعات گسسته چند جمله ای

2-8 ماشین بردار پشتیبان

2-8-1مقدمه

2-8-2دلایل استفاده از SVM

2-8-3 کاربردهای SVM

2-8-4 مزایا و معایب SVM

2-8-5 تعاریف کلی

2-8-5-1تابع تصمیم مسائل دو کلاسی

2-8-5-2 تعیین تابع تصمیم(ابر صفحه جداکننده)

2-8-5-3 بعد VC

2-8-5-4حداقل سازی ریسک تجربی

2-8-5-5حداقل سازی ریسک ساختاری

2-8-6 ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا شدنی به طور خطی

2-8-7ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا نشدنی به طور خطی

2-8-8 ماشین بردار پشتیبان غیر خطی

2-8-9 انواع کرنل ها

2-8-9-1 کرنل چند جمله ای

2-8-9-2 کرنل های شبکه عصبی

2-8-9-3 کرنل های گوسی

2-9 تکنیک های پیش پردازش نامتوازن

2-9-1 ماشین بردار پشتیبان و مشکل عدم توازن کلاس

2-9-1-1 عیب مشکل بهینه سازی با ناحیه مرزی نرم

2-9-1-2 نسبت بردار پشتیبان نامتوازن

2-9-2 روشهای یادگیری عدم توازن خارجی برای SVM (روشهای پیش پردازش داده)

2-9-2-1 روشهای نمونه برداری دوباره

2-9-2-1-1زیر نمونه برداری

2-9-2-1-2بیش نمونه برداری

2-9-2-1-3 SCM

2-9-2-1-4 نمونه برداری پیشرفته

2-9-2-1-5 تکنیک بیش نمونه برداری اقلیت مصنوعی

2-9-2-1-6 نزدیک ترین همسایه فشرده(CNN)

2-9-2-1-7 نزدیک ترین همسایه تغییر یافته(ENN)

2-9-2-1-8 Tomek-Link

2-9-2-2 روشهای یادگیری جمعی

2-9-2-2-1الگوریتم آموزشی Bagging

2-9-2-2-2 الگوریتم آموزشی Boosting

2-9-3 روشهای یادگیری عدم تعادل داخلی برای ماشین بردار پشتیبان

2-9-3-1 هزینه خطای متفاوت

2-9-3-2 یادگیری یک کلاس

2-9-3-3zSVM

2-9-3-4 روشهای اصلاح کرنل

2-9-3-5 یادگیری فعال

2-9-3-6 روش های ترکیبی

فصل سوم:روش تحقیق

3-1مقدمه

3-2 ماشین بردار پشتیبان فازی برای یادگیری عدم توازن کلاس

3-2-1 روش SVMFuzzy

3-2-2متد FSVM-CIL

3-3 ماشین بردار پشتیبان حداقل مربعات (LS-SVM)

3-4 الگوریتم پیشنهادی

فصل چهارم: محاسبات و یافته های تحقیق

4-1 مقدمه

4-2 مجموعه داده ها

4-3 نتایج کارایی روش های مختلف بر روی مجموعه داده ها

فصل پنجم:نتیجه گیری و پیشنهادات

5-1 جمع بندی و نتیجه گیری

5-2 کارهای آتی

منابع و مآخذ

چکیده انگلیسی

دانلود دانلود فایل ورد Word پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

فایل Word پژوهش معرفی داده کاوی در پایگاه داده ها


فایل Word پژوهش معرفی داده کاوی در پایگاه داده ها

عنوان کامل بررسی و داده کاوی در پایگاه داده ها دسته فناوری اطلاعات وکامپیوتر فرمت فایل WORD (قابل ویرایش) تعداد صفحات پژوهش 77

دانلود فایل Word پژوهش معرفی داده کاوی در پایگاه داده ها

فایل Word پژوهش معرفی داده کاوی در پایگاه داده ها
دسته بندی کامپیوتر و IT
فرمت فایل doc
حجم فایل 1831 کیلو بایت
تعداد صفحات فایل 77
 

عنوان کامل: بررسی و داده کاوی در پایگاه داده ها.

دسته: فناوری اطلاعات وکامپیوتر

فرمت فایل: WORD (قابل ویرایش)
تعداد صفحات پژوهش : ۷۷

 چکیده ای از مقدمه آغازین ”  بررسی داده کاوی در پایگاه داده ها ” بدین شرح است:

در دو دهه‌ی قبل توانایی‌های فنی بشر برای تولید و جمع آوری داده‌ها به سرعت افزایش یافته است. عواملی نظیراستفاده گسترده از بارکد برای تولیدات تجاری، به خدمت گرفتن کامپیوتر در کسب و کار، علوم، خدمات دولتی و پیشرفت در وسایل جمع آوری داده، از اسکن کردن متون و تصاویر تا سیستم های سنجش از دور ماهواره ای، در این تغیرات نقش مهمی دارند.بطور کلی استفاده همگانی از وب و اینترنت به عنوان یک سیستم اطلاع رسانی جهانی، ما را مواجه با حجم زیادی از داده و اطلاعات می کند. این رشد انفجاری در داده های ذخیره شده، نیاز مبرم وجود تکنولوژی های جدید و ابزارهای خودکاری را ایجاد کرده که به صورت هوشمند به انسان یاری می رسانند تا این حجم زیاد داده را به اطلاعات و دانش تبدیل کند. داده کاوی بعنوان یک راه حل برای این مسائل مطرح می باشد. در یک تعریف غیر رسمی، داده کاوی فرآیندی است خودکار برای استخراج الگوهایی که دانش را بازنمایی می کنند که این دانش به صورت ضمنی در پایگاه داده های عظیم، انبار داده و دیگر مخازن بزرگ اطلاعات ذخیره شده است. داده کاوی بطور همزمان از چندین رشته علمی بهره می برد. نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه های عصبی، آمار، شناسایی الگو، سیستم های مبتنی بر دانش، حصول دانش، بازیابی اطلاعات، محاسبات سرعت بالا و بازنمایی بصری داده. داده کاوی در اواخر دهه ی ۱۹۸۰ پدیدار گشته، در دهه ی ۱۹۹۰ گام های بلندی در این شاخه از علم برداشته شده و انتظار می رود در این قرن به رشد و پیشرفت خود ادامه دهد.واژه های «داده کاوی» و «کشف دانش در پایگاه داده» اغلب به صورت مترادف یکدیگر مورد استفاده قرار می گیرند.

تکامل تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف، سبب جمع آوری حجم فراوانی از داده ها شده است. این داده های فراوان باعث ایجاد نیاز برای ابزارهای قدرتمند برای تحلیل داده ها گشته زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می باشیم. ابزارهای داده کاوی داده ها را آنالیز می کنند و الگوهای داده ای را کشف می کنند که می توان از آن در کاربردهایی نظیر: تعیین استراتژی برای کسب و کار، پایگاه دانش و تحقیقات علمی و پزشکی استفاده کرد. شکاف موجود بین داده ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده کاوی شده است تا داده های بی ارزشی را به دانشی ارزشمند تبدیل کنیم.

امروزه نامگذاری داده کاوی بسیار عمومیت پیدا کرده است، البته اسامی دیگری نیز برای این فرآیند پیشنهاد شده که بعضا بسیاری متفاوت با واژه ی داده کاوی است نظیر: استخراج دانش از پایگاه داده، آنالیز داده/الگو، باستان شناسی داده و لایروبی داده ها. کشف دانش در پایگاه داده فرآیند شناسایی درست، ساده، مفید و نهایتا الگوها و مدل های قابل فهم در داده ها می باشد. داده کاوی مرحله ای از فرآیند کشف دانش می باشد و شامل الگوریتم های مخصوص داده کاوی است بطوریکه تحت محدودیت های مؤثر محاسباتی قابل قبول، الگوها و یا مدل ها را در داده کشف می کند. به بیان ساده تر، داده کاوی به فرآیند استخراج دانش ناشناخته، درست و بالقوه مفید از داده اطلاق می شود. تعریف دیگر اینست که داده کاوی گونه ای از تکنیکها برای شناسایی اطلاعات و یا دانش تصمیم گیری از قطعات داده می باشد به نحوی که با استخراج آنها در حوزه های تصمیم گیری، پیش بینی، پیشگویی و تخمین مورد استفاده قرار می گیرد. داده ها اغلب حجیم اما بدون ارزش می باشند، داده به تنهایی قابل استفاده نیست بلکه دانش نهفته در داده ها قابل استفاده می باشد. به این دلیل اغلب به داده کاوی، تحلیل داده ای ثانویه گفته می شود.

————-

 

 

فهرست مطالب

 

فصل اول مقدمه ای بر داده کاوی

1-1- مقدمه

1-2- علت پیدایش داده کاوی

1-3- وی‍‍ژگی های داده کاوی

1-4- مراحل کشف دانش

1-5- جایگاه داده کاوی در علوم مختلف

1-6- داده کاوی و OLAP

1-7- کاربرد یادگیری ماشین و آمار در داده کاوی

1-8- تکنیک های داده کاوی

1-9- عملیات های داده کاوی

1-9-1- مدلسازی پیشگویی کننده

1-9-2- تقطیع پایگاه داده ها

1-9-3- تحلیل پیوند

1-10- چه نوع اطلاعاتی مناسب داده کاوی است؟

1-11- بررسی نرم افزارهای داده کاوی

فصل دوم پیش پردازش و آماده سازی داده ها

2-1- انواع داده های مورد استفاده در داده کاوی

2-1-1- ویژگی های کمی و کیفی

2-1-2- ویژگی های گسسته و پیوسته

2-1-3- ویژگی های نامتقارن

2-2- آماده سازی داده ها

2-2-1- جایگاه آماده سازی داده ها در داده کاوی

2-2-2- علت آماده سازی داده ها

2-2-3- تلخیص توصیفی داده ها

2-2-4- نمایش گرافیکی داده های توصیفی

2-2-5- اجزای اصلی پیش پردازش داده ها

2-3- پاکسازی داده ها

2-3-1- وظایف پاکسازی داده ها

فصل سوم انباره داده ها

3-1- داده کاوی و انباره داده ها

3-2- مفاهیم انباره داده

3-2-1- ساختار انباره داده

3-2-2- مدل های مفهومی انباره داده

3-2-3- فرآیند طراحی انباره داده

3-2-4- معماری انباره داده

3-3- انواع انباره داده

3-4- انباره داده و سیستم های عملیاتی

3-4-1- کاربران نهایی انباره داده ها

3-5- کاربردهای انباره داده

نتیجه گیری

فهرست منابع

 

 

دانلود فایل Word پژوهش معرفی داده کاوی در پایگاه داده ها

دانلود اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران از سال 1392 الی 1395


اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران از سال 1392 الی 1395

اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران برای بازه 4 ساله سالهای 1392 الی 1395 شامل اطلاعات و داده های بازار، نوع بازار، شرکت، خرید حقیقی ( شامل تعداد نفرات، تعداد معاملات، حجم معاملات، ارزش معاملات) خرید حقوقی (شامل تعداد نفرات، تعداد معاملات، حجم معاملات، ارزش معاملات ) فروش حقیقی (شامل تعداد نفرات، تعداد معاملات، حجم معاملات، ارز

دانلود اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران از سال 1392 الی 1395

دانلود اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران از سال 1392 الی 1395
دانلود دادهای آماری شرکتهای موجود در بازار فرابورس ایران 
اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران
دسته بندی حسابداری
فرمت فایل zip
حجم فایل 441 کیلو بایت
تعداد صفحات فایل 100

عنوان: اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران از سال 1392 الی 1395

دسته: حسابداری- مدیریت مالی- اقتصاد

فرمت: Excel

این فایل شامل اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران برای بازه 4 ساله  سالهای 1392 الی 1395 می باشد که در آن اطلاعات و داده های  بازار، نوع بازار، شرکت، خرید حقیقی ( شامل تعداد نفرات، تعداد معاملات، حجم معاملات، ارزش معاملات)، خرید حقوقی (شامل تعداد نفرات، تعداد معاملات، حجم معاملات، ارزش معاملات )، فروش حقیقی (شامل تعداد نفرات، تعداد معاملات، حجم معاملات، ارزش معاملات )، فروش حقوقی (شامل تعداد نفرات، تعداد معاملات، حجم معاملات، ارزش معاملات ) و مجموع ( تعداد خریداران، تعداد فروشندگان، تعداد دفعات معامله، حجم معاملات، ارزش معاملات )می باشد که برای انجام تحقیقات و پایان نامه های دانشگاهی رشته های حسابداری، مدیریت مالی و اقتصاد می تواند مورد استفاده قرار گیرد.

دانلود اکسل دادهای آماری شرکتهای موجود در بازار فرابورس ایران از سال 1392 الی 1395

مقدمه ای بر کلان داده در رایانش ابری


مقدمه ای بر کلان داده در رایانش ابری

کلان داده در رایانش ابری

دانلود مقدمه ای بر کلان داده در رایانش ابری

فزایش راندمان
مساله کلان داده
رایانش ابری
BigData
برنامه MapReduce
دسته بندی کامپیوتر و IT
فرمت فایل docx
حجم فایل 3404 کیلو بایت
تعداد صفحات فایل 145

بزرگترین پدیده ای که توجه محاسبات مدرن صنعت امروز " اینترنت"  راجلب کرده " کلان داده" است. ترکیب این دو واژه با هم برای اولین بار در مقاله ای در مورد این موضوع توسط مک کینزی (McKinsey) و شرکا معروف و مشهور شد و تعریف پایه و اساس این ترکیب برای اولین بار توسط داگ لنی (Doug Laney) از گارتنرعمومیت گرفت.

ازدلایل اساسی که چرا "کلان داده" امروز محبوب است این است که چون سیستم عامل های فن آوری که همراه با آن پدید آمده اند ،  قابلیت پردازش داده ها از فرمت ها و ساختارهای مختلف بدون هیچ گونه نگرانی در مورد محدودیت های مرتبط با سیستم های سنتی و سیستم عامل پایگاه داده را  فراهم کرده اند.

دانلود مقدمه ای بر کلان داده در رایانش ابری