نویسندگان
دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شریف، تهران، ایران
چکیده
تعداد زیادی از شرکتها با پردازش دادههای بزرگ برای تحلیل دادههای مالی، دادههای تجاری و سایر تحلیلها روبرو هستند. با توجه به زیر ساخت بزرگ و گران قیمت برای پردازش دادههای بزرگ، ممکن است نتوان تمام دادهها را مورد پردازش قرار داد. این موضوع بر روی کیفیت پاسخ تأثیر گذاشته و کیفیت پاسخ را کاهش میدهد. راهحل ارائه شده در این مقاله در مواقعی که با محدودیت بودجه و زمان اتمام پردازش روبرو هستیم میتواند مورد استفاده قرار بگیرد. در این مقاله ما برای افزایش کیفیت پاسخ دادهها با تأثیر بیشتر را به منابع با توان پردازشی بیشتر اختصاص میدهیم. بعد از آن اگر بودجهای برای استفاده در دسترس بود، سایر دادهها را نیز مورد پردازش قرار میدهیم. در این مقاله با استفاده از روشهای آماری با سطح اطمینان قابل قبولی میزان تأثیر هر قسمت از داده را بر روی پاسخ نهایی مشخص میکنیم. با استفاده از این روش قادر خواهیم بود در صورت وجود محدودیت زمانی و بودجهای کیفیت پاسخ را افزایش دهیم. در فاز ارزیابی دادههایی از حوزههای مختلف را مورد بررسی قرار دادهایم. بررسی نشان میدهد این روش دارای کارایی خوبی برای افزایش کیفیت پاسخ در صورت وجود محدودیت زمانی و بودجه است. در کاربردهای مورد ارزیابی در این مقاله موفق شدهایم تا 33 درصد بهبود در کیفیت پاسخ ایجاد کنیم.
کلیدواژهها