مروری بر تاریخچه داده کاوی

در شکل زیر ما نقاط عطف مهم در تاریخ داده کاوی را بهمراه نحوه تکامل این علم برای شما رسم کردیم.
داده کاوی فرآیندی محاسباتی است که به کشف الگو در مجموعه ای از داده های بزرگ کمک می کند. این رشته شاخه ای از علم کامپیوتر است که ترکیبی از تکنیک ها آماری، علوم اطلاعات، نظریه پایگاه داده و یادگیری ماشین می باشد.

تاریخچه داده کاوی

در سال ۱۷۶۳ پس از مرگ توماس بیز مقاله ای منتشر شد که در مورد احتمال وقوع یا عدم وقوع یک پدیده‌ بود که بعدها این مقاله به قضیه بیز معروف شد. این قضیه از آن جهت مفید است که می‌توان از طریق آن احتمال یک پیشامد را با مشروط کردن نسبت به وقوع و یا عدم وقوع یک پیشامد دیگر محاسبه کرد. این دیدگاه پایه و اساس داده کاوی و احتمالات است.

حتما بخوانید " منابع و مراجع برای آموزش داده کاوی  "

در سال ۱۸۰۵ آدرین ماری لژاندر و کارل فریدریش گاوس از رگرسیون برای تعیین چرخش اجرام به دور خورشید استفاده کردند. هدف تحلیل رگرسیون یک فرآیند آماری برای تخمین روابط بین متغیرها می باشد. این روش شامل تکنیک های زیادی برای مدل سازی و تحلیل متغیرهای خاص و منحصر بفرد است وقتی که تمرکز روی روابط بین متغیر وابسته و یک یا چند متغیر مستقل باشد. تحلیل رگرسیون به صورت گسترده برای پیش بینی استفاده شده و یکی از ابزارهای کلیدی در داده کاوی به حساب می آید.
در سال ۱۹۳۶ عصر کامپیوتر ها شروع می شود، جمع آوری و پردازش مقادیر زیادی از داده ها صورت می پذیرد. در همین سال آلن تورینگ  در مقاله ای به یاد ماندنی درباره اعداد شمارا، با استفاده از انسکیدانس پرابلم فرمول بندی‌های سال ۱۹۳۱ کرت گودل را دربارهٔ محدودیت‌های اثبات و محاسبات تجدید کرد و زبان ریاضی محور گودل را با چیزی که امروزه ماشین تورینگ نامیده می‌شود جایگزین نمود. کامپیوتر های مدرن امروزی بر مفاهیم تورینگ بنا شده اند.

حتما بخوانید " داده کاوی توییتر با پایتون؛ جئولوکیشن و نقشه های تعاملی "

درسال ۱۹۴۳ دو پژوهش‌گر به نام‌های وارن مک کالچ Waren Mc Culloch و والتر پیتز Waltter Pitts مقاله‌ای در مورد شبکه‌های عصبی نوشتند. این مقاله نخستین جرقهٔ طراحی شبکه‌های عصبی مصنوعی بود. از آن زمان تاکنون انواع گوناگونی از شبکه‌ها به وجود آمده‌اند ولی همهٔ آن‌ها در دو چیز مشترک‌اند: مجموعه‌ای از گره‌ها و رابطه‌های میان گره‌ها. گره‌ها می‌توانند به‌عنوان واحدهای محاسبات در نظر گرفته شوند. ورودی‌ها به آن‌ها وارد می‌شوند و پردازش می‌شوند تا درنهایت یک خروجی به‌دست آید. این پردازش‌ها ممکن است بسیار ساده باشند (مانند جمع زدن ورودی‌ها) یا کاملاً پیچیده باشند (یک گره شامل یک شبکهٔ دیگر باشد…). رابطه‌های میان گره‌ها اطلاعات جاری میان گره‌ها را تعیین می‌کنند. تعامل میان گره‌ها به‌وسیلهٔ این رابطه‌ها منجر به یک رفتار سراسری در شبکه می‌شود که آن‌ها برآیند می‌نامند (چیزی شبیه کارکرد شبکهٔ عصبی مغز!).

در سال ۱۹۶۵ لورنس فوگل شرکت جدیدی به نام علوم تصمیم گیری بنا نهاد. این اولین شرکت بود که به طور خاص از محاسبات تکاملی برای حل مسائل واقعی استفاده می کرد.

در سال ۱۹۷۰ سیستم های مدیریت پایگاه داده پیشرفته روی کار آمد و امکان ذخیره سازی داده ها فراهم گشت.

حتما بخوانید " کاربرد داده کاوی در پزشکی "

در سال ۱۹۷۵جان هنری هلند کتابی به نام الگوریتم ژنتیک نوشت این کتاب تکنیک جستجویی در علم رایانه برای یافتن راه‌حل تقریبی برای بهینه‌سازی و مسائل جستجو است. در واقع الگوریتم‌های ژنتیک از اصول انتخاب طبیعی داروین برای یافتن فرمول بهینه جهت پیش‌بینی یا تطبیق الگو استفاده می‌کنند. الگوریتم‌های ژنتیک اغلب گزینه خوبی برای تکنیک‌های پیش‌بینی بر مبنای رگرسیون هستند. در هوش مصنوعی الگوریتم ژنتیک (یا GA) یک تکنیک برنامه‌نویسی است که از تکامل ژنتیکی به عنوان یک الگوی حل مسئله استفاده می‌کند.

سال ۱۹۸۰ اصطلاح database mining مطرح شد. در این دوره کارشناسان می توانستند به روابط معنادار پی ببرند.

در سال ۱۹۸۹ اصطلاح ” کشف دانش در پایگاه داده” (Knowledge Discovery in Databases) یا به مختصر KDD توسط Piatetsky-Shapiro مطرح گشت. در همین زمان او اولین کارگاه آموزشی خودش را با نام KDD تاسیس کرد.

در سال ۱۹۹۰ اصطلاح داده کاوی مطرح گشت. در این زمان شرکت های خرده فروش و بازارهای مالی  با استفاده از داده کاوی به تجزیه و تحلیل داده ها و پیش بینی نوسانات در نرخ بهره و افزایش مشتری می پرداختند.

در سال ۱۹۹۲ Bernhard E. Boser ، Isabelle M. Guyon و Vladimir N. Vapnik فرآیند ماشین بردار پشتیبانی (Support vector machines – SVMs) که یکی از روش‌های یادگیری بانظارت است و از آن برای طبقه‌بندی و رگرسیون استفاده می شود را بهبود بخشیدند.

در سال ۱۹۹۳ Piatetsky-Shapiro خبرنامه KDnuggets را راه اندازی کرد. این خبرنامه در واقع پل ارتباطی بین پژوهشگرانی است که در کارگاه KDD شرکت کرده اند.

در سال ۲۰۰۱ اگرچه علم داده از سال ۱۹۶۰ شکل گرفته است ولیکن William S. Cleveland در این سال علم داده را به عنوان یک رشته مستقل معرفی نمود.

حتما بخوانید "داده کاوی پیامک های تبلیغاتی بر نگرش مصرف کنندگان + دانلود مقاله"

سال ۲۰۰۳ Moneyball توسط Michael Lewis منتشر گردید و بسیاری از ورزش ها را با تغییر بزرگی روبرو ساخت.

در حال حاضر در فوریه ۲۰۱۵ آقای DJ Patil به عنوان اولین دانشمند ارشد داده در کاخ سفید وارد شد. امروزه داده کاوی در تجارت، علوم، مهندسی، پزشکی و… کاربرد فروانی دارد. داده کاوی کارت های اعتباری، رصد بازار سهام، امنیت ملی، آزمایش های بالینی تنها نمونه های کوچکی از استفاده این علم در جامعه می باشد.

منبع :

dataconomy

به اشتراک بگذارید:

یک دیدگاه