نگاهی به یافته های جالب «داده کاوی»؛ حاصل جمع ناپلئون با نوستراداموس
«داده» مثل یک منبع قدرت جادویی می ماند که به شما قابلیت های ماورایی می دهد. کسب و کارهای امروزی بدون داشتن «کلان داده» مثل موجودی می شوند که در تاریکی گیر افتاده است. ناپلئون بناپارت در مورد اهمیت داده ها می گوید: «۹۰ درصد هر جنگ به اطلاعات بستگی دارد». اگر این سردار موفق تاریخی امروز زنده بود سرزمین چندانی برای کشورگشایی وجود نداشت، پس احتمالاً متخصص «داده کاوی» می شد. حتی نوستراداموس هم امروز قادر بود با کاویدن داده ها، پیشبینی کند در آینده چه اتفاقی می افتد. در حقیقت داده کاوی به شما امکان می دهد مثل نوستراداموس آینده را پیشبینی کنید و مثل ناپلئون بازار رقبا را به تصاحب خود درآورید.
گوگل روزی ۱۰۰ میلیون دلار از جستجوهای ما سود می کند
رسوایی های بیشمار نشان می دهند شرکت ها برای به دست آوردن داده های ارزشمند و ساختن پول از آنها حاضر هستند به هر راهی متوسل شوند، حتی جاسوسی ناجوانمردانه از کاربران. در این ویدیو یک کاربر یوتوب ثابت می کند که گوگل همواره از طریق میکروفن ابزارهای کامپیوتری ما به مکالمات روزمره ی ما گوش می دهد تا بر اساس آنها بهترین تبلیغات ممکن را برایمان نمایش دهد و سود بیشتری کسب کند.
اما داده ها صرفاً مالی نیستند و تقریباً هر اتفاق روزمره می تواند به داده تبدیل شود. مثلاً اینکه چه ساعتی کدام خیابان ها شلوغ تر هستند داده محسوب می شود. اینکه چند خودرو در تعطیلات از جاده چالوس برای مسافرت به شمال استفاده می کنند داده است. از اطلاعات ضبط شده با حسگرهای هواشناسی تا پست هایی که کاربران در شبکه های اجتماعی می گذارند، همگی داده هایی هستند که هر روز به سرعت تولید می شوند.
در قرن ۲۱ «اطلاعات» مثل نفت خام است و از ابزار «تجزیه و تحیل» برای تبدیل این ماده به بنزین استفاده می شود.
حجم حقوق پرداخت شده به متخصصین داده کاوی هر سال ۵۰ درصد بیشتر می شود و کسب و کارها در به در دنبال تحلیل داده هایی که کسب کرده اند هستند. شرکت ها می خواهند بدانند مردم دنبال چه چیزی هستند. می خواهند بهترین زمان مملکن را برای نمایش تبلیغات در شبکه های اجتماعی خود پیدا کنند. می خواهند بدانند کاربران شبکه های اجتماعی در مورد آنها چه نظراتی ثبت می کنند.
بازار داده کاوی در سال ۲۰۲۰ بالغ بر ۲۱۰ میلیارد دلار ارزش خواهد داشت. اما این کسب و کار نسبتاً جدید، در عین حال یک علم کاملاً به زور هم به حساب می آید. در نتیجه دانشگاه های سراسر جهان مشغول به کار گرفتن داده کاوی برای استخراج یافته های تازه در تمام حوزه های ممکن هستند. در رویداد تداکس تهران امسال یکی از سخنران ها دکترای هوش مصنوعی داشت و مثالی زد که توجهم را جلب کرد. دکتر حمیدرضا کشاورز محمدیان که سمت داده کاوی را در کسب و کارهای ایرانی بر عهده دارد، اشاره کرد:
«کلان داده» و «داده کاوی» کلیدواژه های امروز علم و تجارت هستند و در هر سو به گوش می رسند. بعد از شرکت در سخنرانی کمی در این مورد دقیق تر شدم و در مورد داده کاوی بیشتر جستجو کردم. در این مطلب می خواهم شما را با ۱۰ نمونه جالب از یافته هایی آشنا کنم که از اعماق داده های ثبت و ضبط شده استخراج کرده ایم.
البته بسیاری از یافته های دانشگاهی و نتیجه تحقیقات کسب و کارها محرمانه هستند، اما برخی نمونه ها به شکل عمومی منتشر شده اند که در ادامه می خوانیم.
۱. خرید ترکیبی از ۲۵ قلم کالا از احتمال حاملگی خریدار حکایت دارد.
تحقیق توسط: فروشگاه زنجیره ای تارگت
صابون بدون بو، ضد عفونی کننده ی دست و پارچه های گردگیری تعدادی از لیست ۲۵ کالا هستند
اولین نمونه ای که برای جستجو سراغش رفتم همان مثال فروشگاه تارگت بود. بر اساس مقاله ای که نیویورک تایمز اولین بار در این زمینه منتشر کرده است فروشگاه زنجیره ای آمریکایی ۲۵ کالا را شناسایی کرده که اگر باهم خریده شوند، از احتمال حاملگی خریدار حکایت دارند. تارگت با تبریک گفتن حاملگی احتمالی خریدارانش را قبل از اینکه خودشان فهمیده باشند شگفت زده می کند و نام این برند برای همیشه در خاطر مشتری ثبت می شود.
یا اینکه بعد از تشخیص حاملگی احتمالی با ارسال کوپن های تخفیف کاربر را برای خرید محصولات مورد نیاز حاملگی به خرید از فروشگاه های تارگت دعوت کند. تارگت اولین بار با تشخیص حاملگی ناخواسته یکی از خریداران قبل از خودش در آمریکا خبرساز شد، خریداری تا امروز همیشه صابون های عطردار خریداری کرده بود حالا مدتی بود فقط صابون های بدون بو خریداری می کرد و به مصرف قرص تهوع تمایل نشان می داد.
حالا همه می دانند این شرکت حتی به چیزهایی که از روی قفسه بر می دارید هم به عنوان ابزاری برای کسب اطلاعات بیشتر از شما استفاده می کند. این شرکت به هر خریدار بر اساس شماره کارت اعتباری، ایمیل یا شماره تلفن یک شماره مشتری اختصاص می دهد و تمام خریدهای مشتریان خود را در آنها ذخیره می کند، تا سر فرصت به داده کاوی آنها و استخراج یافته های سودمند مشغول شوند و ببینید چه چیزهایی می توانند از آنها کسب کنند.
۲. مقام بالاتر مساوی است با ادب کمتر
تحقیق توسط: محققینی که از ویکی پدیا برای داده کاوی استفاده می کنند
ویکی نویس ها پشت پرده سایت ویکی پدیا مشغول هستند و به شکل داوطلبانه این دانشنامه آنلاین رایگان را به روز نگه می دارند. محققین به این نتیجه رسیده اند که ویکی نویس های مودب تر که کامنت های مودبانه تری در انجمن های این سایت ثبت می کنند احتمال بیشتری دارد به رده مدیریت این دانشنامه ارتقاء یابند.
اما نکته ی جالب تر این است که وقتی ویکی نویس های مودب به رده مدیریت ارتقاء پیدا می کنند میزان ادب کامنتهایشان سقوط می کند! برای مطالعه بیشتر در این حوزه، مقاله «نظریه ادب» را در ویکیپدیا مطالعه کنید.
۳. کاربران مرورگرهای کروم و فایرفاکس کارمندان بهتری هستند.
تحقیق توسط: شرکتی که به شکل تخصصی در حوزه مدیریت منابع انسانی کار می کند
متخصصین حوزه منابع انسانی با اعمال الگوریتم های داده کاوی رو اطلاعات زیراکس و چند شرکت تجاری دیگر به این نتیجه رسیده اند: کارمندانی که از مرورگرهای کروم و فایرفاکس استفاده می کنند کارمندان بهتری برای کارفرمایان خود هستند و با مسئولیت پذیری بیشتری وظایف خود را انجام می دهند.
در بخشی از این گزارش می خوانیم: «اینکه شخصی مرورگر پیش فرض سیستم عامل های مک یا ویندوز را رها کند و برای نصب جایگزین بهتری وقت بگذارد نشان می دهد با کارمند مسئولیت پذیر تری طرف هستیم که احتمالاً درک بهتری از موضوعات دارد و خروجی بهتری هم تحویل می دهد.»
۴. طوفان هایی که سهمگین تر هستند اسم زنانه دارند
تحقیق توسط: محققین دانشگاهی
محققین داده کاوی می گویند بیشتر طوفان هایی که در نیم قرن اخیر به شکل متوسط بالای ۴۰ نفر تلفات به بار آورده اند نام های مونث دارند، اما متوسط تلفات طوفان هایی که نام مذکر دارند از ۱۵ نفر بیشتر نمی شوند. حالا مشخص نیست کسانی که این نام ها را انتخاب می کنند با خانم ها مشکل دارند، یا اینکه به اعتقاد برخی دیگر، وقتی طوفان نام زنانه داشته باشد برای مردم کم خطر تر به نظر می رسد و به دلیل عدم آمادگی جامعه تلفات بیشتری ایجاد می کند.
۵. افراد باهوش تر سیب زمینی حلقوی دوست دارند
تحقیق توسط: محققین دانشگاه کمبریج و مایکروسافت
نتایج این تحقیق نشان می دهد اگر کسی صفحه «Curly Fries» یا سیب زمینی سرخ کرده حلقه ای را در فیسبوک لایک زده باشد، احتمالاً هوش بالایی دارد.
تنها دلیل منطقی که می توان برای این موضوع پیدا کرد این است که اولین بار یک شخص باهوش صفحه این خوراکی را لایک زده و بر اساس نظریه «Homophily» دوستان یک شخص باهوش هم هوش بالایی دارند، در نتیجه وقتی به دوست خود که اولین بار سیب زمینی حلقوی را کشف کرده بود پیوسته اند، نتیجه تحقیق فوق را رقم زده اند.
۶. تعهد شغلی بیشتر، حوادث کاری را کاهش می دهد
تحقیق توسط: Shell
یکی از رؤسای شِل می گوید آمار حوادث کشتی رانی در انگلیس ۴ برابر از متوسط نرخ حوادث شغلی در این کشور بالاتر است و این موضوع، خسارت زیادی به شرکت بریتانیایی وارد می کند. شل بر همین اساس تصمیم گرفته با استفاده از داده کاوی سرچشمه ی مشکل را پیدا و حل کند. شل می گوید حتی حاضر است با همین روش به حل مشکلات صنایع دیگر از جمله صنعت هسته ای و کاهش تصادفات در راه آهن و مسیرهای دریایی کمک کند.
شرکت بریتانیایی فعلاً تا اینجا با داده کاوی روی اطلاعات کارکنان خود به این نتیجه رسیده است که هر ۱ درصد افزایش تعهد شغلی کارکنارش، حوادث کاری را تا ۴ درصد کاهش می دهد، آماری که البته بیشتر تبلیغ این شرکت برای تشویق کارمندان برای بهتر کار کردن به نظر می رسد.
۷. کسانی که با دقت بیشتری تایپ می کنند قابل اطمینان تر هستند
تحقیق توسط: یک استارتاپ حوزه اقتصادی
یک استارتاپ حوزه اقتصاد فرم های پر شده برای درخواست وام را بررسی کرده و به این نتیجه رسیده است که اگر شخص گرامر زبان انگلیسی را مو به مو رعایت کرده باشد، یعنی حروف اول جملاتی که لازم است را با حروف بزرگ تایپ کرده باشد، موقع بازپرداخت وام نیز با دقت بیشتری عمل می کند. کسانی که تمام متون انگلیسی را با حروف کوچک تایپ می کنند کمتر قابل اطمینان به حساب می آیند و از آن بدتر هم کسانی هستند که تمام جملات با حروف بزرگ تایپ می کنند.
اگر همین قانون را به زبان فارسی تعمیم دهیم باید گفت کاربرانی که از «slm» به جای «سلام» و مخفف های اینچنینی استفاده می کنند، یا کسانی که مشکل «هکسره» دارند، کمتر از دیگران قابل اطمینان هستند.
۸. میزان فروش شیرینی های تارت با وقوع طوفان ارتباط مستقیم دارد
تحقیق توسط: والمارت
شاید فکر کنید خرید شیرینی تارت نوعی گناه است که عذاب الهی ایجاد می کند، اما واقعیت این است که وقتی یک حادثه قابل پشبینی در شرف وقوع باشد، مردم به فکر خرید آذوقه می افتند. ظاهراً تارت های سوپر مارکتی یکی از خوردنی های پر طرفدار است که موقع تماشا کردن طوفان و گردباد توسط مردم آمریکا مصرف می شود.
۹. هرچه آمار و جرم و جنایت بیشتر باشد «اوبر» مشتری بیشتری پیدا می کند
تحقیق توسط: اوبر
بررسی داده های اوبر در سانفرانسیسکو نشان می دهد در مناطقی که آمار دزدی، مصرف الکل و فحشا بیشتر باشد، تعداد کاربران و سفرهای اوبر هم بیشتر می شود. حالا نمی دانیم این رانندگان اوبر هستن که جرم و جنایت می کنند و آمار را بالا می برند یا چیز دیگر! (اوبر در آمریکا معادل اسنپ در ایران به حساب می آید.)
The post نگاهی به یافته های جالب «داده کاوی»؛ حاصل جمع ناپلئون با نوستراداموس appeared first on دیجیاتو.