محدودیتهای تحلیل دادهها و یادگیری ماشین
شاید از اخبار و مقالات آنلاین شنیده باشید که یادگیری ماشین و تحلیل پیشرفته دادهها میتونن ساختار جامعه رو تغییر بدن (اتوماسیون، از دست رفتن شغلها، درآمد پایه همگانی، تسلط هوش مصنوعی).
در واقع، جامعه در حال حاضر داره تغییر میکنه. پشت صحنه، یادگیری ماشین و تحلیل مداوم دادهها در حال انجامه، به خصوص در موتورهای جستجو، شبکههای اجتماعی و تجارت الکترونیک. یادگیری ماشین حالا کارهایی مثل اینها رو راحتتر و سریعتر انجام میده:
- آیا در تصویر چهره انسانی وجود داره؟
- آیا کاربر روی تبلیغ کلیک میکنه؟ (آیا تبلیغ شخصیسازی شده و برای او جذابه؟)
- چطور کپشنهای دقیقتری روی ویدیوهای یوتیوب ایجاد کنیم؟ (تشخیص گفتار و تبدیل به متن)
- آیا موتور یا قطعهای خراب میشه؟ (نگهداری پیشگیرانه در تولید)
- آیا تراکنش جعلیه؟
- آیا ایمیل اسپم هست یا نه؟
اینها به لطف دسترسی به مجموعه دادههای عظیم و قدرت پردازش بالا ممکن شده. با این حال، تحلیل پیشرفته دادهها با استفاده از پایتون (و یادگیری ماشین) جادو نیست. اینها راهحل همه مشکلات نیستن. چرا که دقت و عملکرد ابزارها و مدلهای ما به شدت وابسته به یکپارچگی دادهها و مهارت و قضاوت خودمونه.
دقت و عملکرد
رایجترین استفاده از تحلیل دادهها در پیشبینیهای موفق (پیشبینی) و بهینهسازیه. آیا تقاضا برای محصول ما در پنج سال آینده افزایش پیدا میکنه؟ بهترین مسیرها برای تحویلکالا که کمترین هزینه عملیاتی رو دارن چیه؟
به همین دلیله که بهبود دقت حتی به اندازه 1% میتونه به میلیونها دلار درآمد اضافی تبدیل بشه. مثلاً، فروشگاههای بزرگ میتونن برخی محصولات رو از قبل انبار کنن اگه نتایج تحلیل نشون بده تقاضا در حال افزایشه. حمل و نقل و لجستیک هم میتونن مسیرها و برنامههای بهتری برای استفاده کمتر از سوخت و تحویلهای سریعتر برنامهریزی کنن.
علاوه بر بهبود دقت، اولویت دیگهای هم روی اطمینان از عملکرد قابل اعتماده. تحلیل ما چطور روی مجموعه دادههای جدید عمل میکنه؟ آیا باید عوامل دیگهای رو در تحلیل دادهها و انجام پیشبینیها در نظر بگیریم؟ کار ما باید همیشه نتایج دقیق و قابل اعتماد تولید کنه. در غیر این صورت، اصلاً علمی نیست چون نتایج قابل بازتولید نیستن.
کشف فرصتها
علاوه بر پیشبینی و بهینهسازی موفق، تحلیل داده مناسب میتونه به ما کمک کنه تا فرصتها رو کشف کنیم. بعداً ممکنه متوجه بشیم که کاری که انجام دادیم در پروژهها و زمینههای دیگه هم کاربرد داره. میتونیم اگه عمیقتر بررسی کنیم، نقاط ناهنجار و الگوهای جالب رو هم شناسایی کنیم. مثلاً شاید مشتریها در خوشههایی قرار بگیرن که برای ما بزرگ باشه تا اونها رو بررسی و بهرهبرداری کنیم. شاید تراکمهای بالای غیرمعمولی از مشتریها وجود داشته باشه که در یه محدوده درآمدی یا سطح هزینهای خاص قرار بگیرن.
اینها فقط نمونههای معمول از کاربردهای تحلیل داده مناسب هستن. در فصل بعد، یکی از نمونههای پرکاربرد در نمایش پتانسیل امیدوارکننده تحلیل داده و یادگیری ماشین رو بحث میکنیم. همچنین، به بررسی پیامدها و فرصتهای موجود میپردازیم.