پايان نامه با موضوع يافتن الگوهاي مكرر در داده هاي عظيم غير قطعي، جهت كاهش فضاي جستجو به كمك MapReduce
چكيده پايان نامه
پیشرفتهای به وجود آمده در دهه های اخیر در زمینه جمع آوری داده ها و قابلیت ذخیره سازی آنها باعث رویارویی با حجم بزرگی از اطلاعات در بسیاری از علوم شده است. داده کاوی کوششی جهت استخراج اطلاعات مفید از میان این داده هاست. طی سالهای گذشته در میان تکنیک های داده کاوی توجه خاصی به الگوریتم های کشف الگوهای مکرر شده است. الگوهای مکرر، مجموعه آیتم ها، زیر ساختها و یا توالی هایی هستند که در یک مجموعه داده به تعدادی مساوی یا بیشتر از آنچه توسط کاربر به عنوان حد آستانه تعیین شده است تکرار شده باشند. بيشتر كارهاي انجام شده بر يافتن الگوهاي تكراري روي داده هاي قطعي تاكيد داشته اند. اما شرايط مختلفي وجود دارد كه در آنها، دادهها به صورت غير قطعي هستند. فضاي جستوجو در دادههاي غير قطعي بسيار بزرگتر و پيچيده تر از داده هاي قطعي است. كاربران در برنامه هاي كاربردي مختلف، بر اساس محدوديتهايي كه اعمال ميكنند، ميخواهند با حجم محدودي از اين حجم عظيم دادهها و فضاي جستوجو، سروكار داشته باشند. در نتيجه در روش پيشنهادي استخراج الگوهاي تكراري بر روي دادههاي غير قطعي و با حجم عظيم انجام مي گيرد. همچنين براي كاهش فضاي جستوجو، كاربران محدوديتهاي خود را بر روي الگوها اعمال مي كنند. براي اعمال محدوديتهاي كاربران از روش SAM استفاده شده است. از آنجا كه با حجم عظيم دادهها سروكار داريم براي پيادهسازي الگوريتم پيشنهادي از روش MapReduce استفاده شده است. بر اساس آزمايشات انجام شده روش پيشنهادي هم براي دادههاي قطعي و هم براي دادههاي غير قطعي با ميزان انتخاب مختلف داراي نتايجي مطلوبي است.
كلمات كليدي: الگوهاي مكرر، دادههاي عظيم، محدوديتهاي كاربر، SAM، MapReduce
توضيحات
اين پايان نامه به صورت دقيق بر روي محيط ابري EC2 آمازون پياده سازي شده است.
فصل اول و فهرست مطالب آن را مي توانيد رايگان دانلود نماييد.
فايل پايان نامه به شكل يك فايل word است كه پس از خريد بلافاصله لينك دانلود براي شما فعال شده و همچنين به ايميل شما هم ارسال مي گردد.
دیدگاه ها