no-img
انجمن دانشجویان هوش مصنوعی

تعريف داده هاي عظيم و ويژگي اين نوع داده ها


انجمن دانشجویان هوش مصنوعی
پکیج های آموزشی سایت
اطلاعیه های سایت

ادامه مطلب

TXT
تعريف داده هاي عظيم و ويژگي اين نوع داده ها
txt
اسفند ۲۷, ۱۳۹۵

تعريف داده هاي عظيم و ويژگي اين نوع داده ها


داده­هاي عظيم داده­هايي هستند با حجم بالاي داده­اي­، كه تركيبي از داده­هاي ساخت يافته و غير ساخت يافته را تحت پوشش قرار مي­دهند و پردازش آنها با روش­هاي سنتي پايگاه داده­اي رابطه­اي امكان پذير نيست و به همين دليل براي مديريت آنها از تكنيك­هاي خاصي استفاده مي­شود. سه ويژگي خاص داده­هاي عظيم هستند كه به عنوان يك معيار براي شناسايي داده هاي عظيم، استفاده مي­شوند. اين سه ويژگي به ۳V معروف هستند و شامل مقدار، نوع و سرعت پردازش مي­ شوند كه در ويژگي­هاي داده­ هاي عظيم آنها را تعريف خواهيم كرد.

ويژگي­ هاي داده هاي عظيم

حجم داده­ ها : مقدار داده­ ها در مجموعه­ هاي داده ­اي داده­ هاي عظيم، بالاست. اين حجم يكي از ويژگي هايي است كه براي داده هاي عظيم­، به عنوان يك خصيصه اصلي شناسايي مي­شود. همان طور كه در بخش­هاي پيشين ذكر شد، حجم داده ها در جهان امروز رو به افزايش است و در پردازش داده ها، بايد در نظر گرفته شود. چرا كه در بسياري از موارد نياز به پالايش و فيلتر اطلاعات است و همچنين بايد طرق دسترسي و ذخيره سازي اطلاعات نيز، بر مبناي اين حجم، شخصي سازي شود.

سرعت پردازش: سرعت خلق، جريان، پردازش و تجميع اطلاعات بايد به گونه اي باشد كه متناسب با ويژگي­ه اي گروه­ هاي داده­ اي امروزي عمل كند. با توجه به سرعت توليد اطلاعات در دنياي امروز و نياز به پاسخگويي بلادرنگ در بسياري از برنامه­ هاي كاربردي و شبكه هاي اجتماعي، سرعت عمل و پردازش روي داده­ها بايد به گونه­اي باشد كه متناسب با اين ويژگي ها انجام شود. از طرفي، چون داده هاي عظيم معمولا به صورت توزيع شده، نگهداري مي­شوند، برقراري ارتباطات و نحوه دسترسي به حافظه نيز بايد مورد توجه قرار گيرد.

انواع داده­اي گوناگون: داده­ هايي كه در گروه هاي داده اي داده­ هاي عظيم قرار مي­گيرند، شامل انواع مختلف داده­اي از قبيل عكس، متن، ويدئو و …. هستند كه از منابع گوناگوني به دست آمده­اند. فرمت­هاي مختلف دارند و دسته ­بندي آنها بسيار مشكل است و نمي­توان قالب يا ساختار خاصي براي آنها تعريف كرد. داده­ هاي عظيم ازاين رو، غير ساختارمند هستند.

ارزش داده ­ها: به دليل حجم بالاي داده­ هاي عظيم، مثال­هاي گوناگوني براي ارزيابي در اختيار قرار مي گيرد كه با توجه به اين حجم بالا اگر در زبرگروهي از اين داده­ها، مشكل يا نقصي مشاهده شود، مي­توان داده ها را مجددًا پالايش و انتخاب كرد و اين امر در زماني كه در نتايج به دست آمده از ارزشيابي نيز مشكل داشته باشد، كاربرد دارد. همچنين بايد در نظر گرفت كه مقدار داده­اي در مجموعه­هاي داده­اي تا چه زماني، مورد اطمينان است و نتايج آن درست است. اين امر در داده­هاي عظيم بسيار اهميت دارد، چرا كه بسياري از تصميمات و برنامه ريزي­ها، در حوزه ي صنايع مختلف؛ بر اساس پردازش اين داده ها صورت مي پذيرد.

صحت و يكپارچگي داده ها: به دليل توزيع پذير بودن داده­هاي حجم، صحت و يكپارچگي داده ها اهميت زيادي پيدا مي­كند، چرا كه بايد بخش­هاي مختلف از يك مجموعه داده­اي روي سرويس دهنده­اي مختلف قرار گرفته­اند، يكپارچه باشند و آخرين نسخه ي به روز شده ي آن نيز در قسمت­ هايي كه ممكن است اين مجموعه داده­اي روي سرويس دهنده­ هاي مختلف، كپي شده­اند، وجود داشته باشد.

 



درباره نویسنده

مديريت 40 نوشته در انجمن دانشجویان هوش مصنوعی دارد . مشاهده تمام نوشته های

دیدگاه ها


پاسخ دهید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *