معرفی بیش از ۲۵ ابزار مجانی داده کاوی برای آنالیز بهتر داده ها

در جهان امروز، اطلاعات نقش پول را بازی میکنند. بیشتر دیتاها ساختار بخصوصی ندارند و بدین منظور، شما نیاز به یک متد کارآمد و تاثیرگذار برای استخراج اطلاعات از آنها و تبدیلشان به یک فرمت قابل فهم و قابل استفاده دارید. در این جا است که نقش نرم افزار های داده کاوی پررنگ میشود. این ابزار، علاوه بر توانایی تجزیه و تحلیل های اولیه، میتوانند به مدیریت داده ها بپردازند و با استفاده از پایگاه داده ها، مدل های پردازش داده، تصویرسازی و بروزرسانی آنلاین این ابزار ها میتوانید به خوبی از پس داده کاوی دیتاهای خود بربیایید. ابزار های بسیاری برای این کارها وجود دارند که با استفاده از تکنیک های پیشرفته ای همچون business learning، هوش مصنوعی و machine learning، به کمک شما در داده کاوی می آیند. بیشتر این ابزار ها پولی هستند. ما همچنین دریافته ایم که بیشتر تجارت ها توانایی پرداخت چنین هزینه هنگفتی را برای داده کاوی اطلاعاتشان ندارند؛ به همین دلیل لیستی از ابزار های مجانی داده کاوی را برای شما تهیه کرده ایم که به شما در داده کاوی اطلاعاتتان در راهی بسیار خوب کمک میکنند.

 

  1. mply

27

Mply یک نرم افزار machine learning ، بر پایه پایتون میباشد. این برنامه طیف گسترده ای از متدهای ماشین لرنینگ را برای هر دو مشکلات نظارتی و بدون نظارتی به شما ارائه میکند. ویژگی های طبقه بندی، رگرسیون، خوشه چینی، کاهش ابعاد و wavelet submodule در این برنامه گنجانده شده اند.

 

  1. Jubatus

 

26

Jubatus یک کتابخانه و چارچوبی برای یادگیری ماشین آنلاین توزیع شده است. این نرم افزار میتواند از پس صد هزار دیتا در هر ثانیه، با استفاده از سخت افزار مناسب چند شاخه ای بربیاید. Jubatus از طبقه بندی، خوشه بندی، رگرسیون، تجریه و تحلیل و آنالیز گراف پشتیبانی میکند و مدل های جدید معرفی شده را بلافاصله پس از دریافت داده ها بروزرسانی میکند.

  1. PyBrain

25

PyBrain یک کتابخانه انعطاف پذیر، قدرتمند وابسته به پایتون میباشد. این ابزار شامل الگوریتم هایی برای شبکه های عصبی، یادگیری بدون نظارت (unsupervised learning) ، تکامل و اموزش تقویتی میباشد.

  1. MiningMart

24

 

هدف MiningMart، توسعه پردازش های زنجیره ای، توسط تجربه های کاربرانش میباشد. این نرم افزار به منظور توصیف داده ها و اپراتور ها، در زبان متای عملیاتی توسعه یافته است. MiningMart همچنین برای پرونده های KDD نیز توسعه یافته و آماده شده است.

  1. KEEL

23

KEEL یک نرم افزار جاوای متن باز، برای دسترسی به الگوریتم های مشکل ساز دیتا ماینینگ همچون خوشه چینی، طبقه بندی، رگرسیون و … میباشد. این نرم فزار با الگویتم های کلاسیک استخراج سازی دانش ، ویژگی های انتخابی، تکنیک های پیش پردازشی، هوش محاسباتی و مدل های هیبریدی همچون شبکه های عصبی تکاملی، سیستم های فازی ژنتیک و غیره بسته بندی و تکمیل شده است.

  1. Fityk

22

Fityk یک نرم افزار پردازش داده ها و منحنی ساز میباشد که عمدتا برای انالیز داده ها، از روش chromatography، طیف سنجی فوتوالکترون، powder diffraction، و دیگر تکنیک های تجربی استفاده میکند. علاوه بر اینها، این نرم افزار میتواند برای هر کاری که نیاز مند به منحنی های اطلاعات دو بعدی میباشد استفاده شود.

  1. CMSR Data Miner

 21

CMSR data miner یک محیط یکپارچه برای مدل سازی پیش بینی کننده، تصویرسازی اطلاعات، قانون گذاری بر اساس سنجش مدل، قطعه بندی و تحلیل آماری داده ها ارائه میکند. ویژگی های اصلی این نرم افزار شامل خوشه بندی عصبی، امتیاز بندی پایگاه داده (database scoring)، (radial basis function)، hotspot drill down, decision tree classification, Cross-sell Basket Analysis، و غیره میباشند.

  1. Pandas

 pandas

Pandas یک کتابخانه قدرت مند و انعطاف پذیر بر اساس پایتون میباشد که قادر به تجزیه و تحلیل داده ها و manipulation میباشد. با استفاده از pandas شما میتوانید به راحتی با اطلاعات از دست رفته کنار بیایید، اطلاعات با شاخص های متفاوت و ناهموار رابه فرم های دیگر تبدیل (convert) کنید و مجموعه داده های بزرگ را ادغام کند یا تغییر شکل دهد. این نرم افزار همچنین از تبدیل فرکانس ها، (moving window linear regressions)، lagging و انتقال داده ها نیز پشتیبانی میکند.

  1. Shogun

19

Shogun یک جعبه ی ماشین لرنینگ بزرگ میباشد که متده های ماشین لرنینگ موثر و یکپارچه را ارائه میکند. این نرم افزار با استفاده از ابزار های چند منظوره اش، به شما اجازه میدهد تا کلاس های الگوریتم ها را با یکدیگر ترکیب کرده، و داده های چندگانه را بازنمایی کنید.

  1. SCaVis

18

SCaVis یک محاسبه گر علمی و تصویر ساز محیطی برای تجزیه و تحلیل داده ها و تجسم سازی آنهاست. این نرم افزار میتواند برای داده های عددی با حجم بالا استفاده شود و بر روی هر پلت فورم جاوایی اجرا شود.

  1. MALLET

 17

MALLET یک بسته مبتنی بر جاوا برای طبقه بندی اسناد، استخراج اطلاعات، خوشه بندی، مدل سازی موضوع، پردازش زبان طبیعی، ماشین لرنینگ و غیره میباشد. این بسته شامل الگوریتم های متعددی برای عملکرد محاسباتی با استفاده از معیارهای مختلف میباشد. همچنین، یک بسته افزودنی برای این ابزار وجود دارد که GRMM نامیده میشود و شامل پشتیبانی برای مدل های گرافیکی میباشد.

  1. CLUTO

16

CLUTO یک پکیج نرم افزاری برای خوشه بندی مجموعه داده های کم و زیاد (ابعادی) است. این پکیج از ویژگی دسته بندی چندگانه الگوریتم های خوشه بندی، توابع فاصله دار، اشکال ادغامی، قابلیت تجسم و متد های مختلفی برای خلاصه سازی خوشه ها استفاده میکند.

  1. Databionic ESOM Tools

15

The databionic ESOM tools مجموعه ای از برنامه ها برای اجرای وظایف داده کاوی همچون clustering, classification و visualizationمیباشد. این مجموعه شامل ویژکی های تعاملی، تجزیه و تحلیل های استثماری داده ها، تصویر سازی متحرک، و غیره (creation of non-redundant U-maps, creation of ESOM classifier, automated application to new data and more) میباشد.

  1. Rattle

 14

Rattle به شما یک رابط منطقی برای دیتا ماینینگ ارائه میدهد که بر اساس زبان آماری مجانی R (با استفاده از رابط گرافیکی گنوم) کار میکند. هدف اصلی این ابزار، ارائه یک رابط بصری است.

  1. Apache Mahout

13

Apache Mahout یک machine learning مقیاس پذیر و پلتفورم داده کاوی میباشد. در اینجا کلمه (مقیاس پذیر) اشاره به مجموعه داده های بزرگ دارد). این ابزار به طور عمده از ۳ مورد ۱- i.e. recommendation mining 2-خوشیه بندی و ۳-طبقه بندی استفاده میکند.

  1. Tanagra

12

Tanagra یک ابزار داده کاوی برای اهداف علمی و پژوهشی است. این ابزار شامل چندین تکنیک داده کاوی همچون تجزیه و تحلیل داده ها، ماشین لرنینگ، یادگیری آماری و غیره میباشد. این ابزار همچون یک پلتفورم تجربی رفتار میکند تا شما بتوانید متد خودتان را برای مقایسه عملکرد های مختلف به آن اضافه کنید.

  1. PSPP

11

PSPP ابزاری است برای آنالیز آماری که در نتیجه پروژه GNU بوجود آمده است. این ابزار از کتابخانه علمی GNU برای محاسبات ریاضی و تولید گراف استفاده میکند. شما در این نرم افزار میتوانید، دو یا چندین پایگاه داده را به صورت همزمان باز، آنالیز، ادیت و ادغام کنید. این نرم افزار از بیش از یک میلیارد متغیر پشتیبانی میکند.

  1. jHepWork

10

jHepWork، بستری برای تجزیه تحلیل داده ها، انجام محاسبات علمی و مصورسازی میباشد که بر اساس زبان جاوا نوشته شده است و در عین حال با پایتون نیز همکاری میکند. این پلتفورم برای تجزیه و تحلیل های کارآمد تر، قادر به نمایش طرح ها به صورت دو بعدی و سه بعدی میباشد.

  1. NLTK

9 

NLTK مخفف جعبه ابزار زبان طبیعی میباشد. این برنامه یک دسته از ابزار های پردازش زبانی همچون دیتا ماینینگ، data scraping، ماشین لرنینگ، تجزیه و تحلیل احساسی و غیره را ارائه میدهد.

 

  1. Vowpal Wabbit

8

Vowpal Wabbit یک پروژه ماشین لرنینگ میباشد که توسط یاهو طراحی شده و در تحقیقات مایکروسافت ارتقا پیدا کرده است تا به ساخت سریع، مفید و مقیاس پذیر الگوریتم های یادگیری کمک کند. این پروژه به خاطر داشتن توانایی یادگیری موازی از دیگر رقیبان خود برتری یافته است.

  1. KNIME

7

KNIME یک پلت فورم متن باز یکپارچه داده کاوی است که قادر به انجام هر ۳ مرحله ی داده کاوی (استخراج، انتقال و بارگزاری داده ها) میباشد. KNIME ماژول های مختلف را برای داده کاوی و ماشین لرنینگ، از طریق مفهوم مدولار data pipe-lining با یکدیگر هماهنگ سازی و یکپارچه میکند.

  1. scikit-learn

6

scikit-learn ابزارهای ساده و کارآمدی را برای داده کاوی و آنالیز ارائه میکند. این نرم افزار به صورت متن باز میباشد و از پردازش، طبقه بندی، خوشه بندی، رگرسیون و dimensionality reduction نیز پشتیبانی میکند.

  1. Gephi

5

Gephi یک پلتفورم تصویرسازی تعاملی برای سیستم های پیچیده، گراف های مرتبه ای و تمام انواع شبکه ها میباشد، این ابزار بر اساس رابط کاربری NetBeans طراحی شده است و از موتور رندر سه بعدی بهره می برد. همچنین شما میتوانید طرح ها و معیار های خود را از طریق پلاگین های در دسترس، شخصی سازی کنید.

  1. R Project

4

R یک زبان برنامه نویسی و محیطی برای محاسباط آماری و گرافیکی است. این زبان به طور گسترده ای توسط داده کاوان برای تجزیه و تحلیل داده ها و ساخت نرم افزار های آماری استفاده می شود. علاوه بر این، این ابزار از تجزیه و تحلیل های time-series، طبقه بندی، خوشه بندی، مدل سازی خطی و غیر خطی نیز پشتیبانی میکند.

  1. Orange Data Mining

 3

Orange یک ابزار متن باز برای تصویر سازی داده ها و تجزیه تحلیل برای پایه پایتون میباشد. این ابزار همچنین شامل قطعاتی برای ماشین لرنینگ، متن کاوی و bioinformatics میباشد. تا به امروز این ابزار از نمودار های میله ای، درختی، پراکندگی، heatmaps و تجزیه و تحلیل داده ها با بیش از ۱۰۰ ویجهت همراه پشتیبانی کرده است.

  1. Weka

2

Weka مجموعه ای از الگوریتم های ماشین لرنینگ میباشد که برای حل مشکلات داده کاوی طراحی شده اند. این الگوریتم ها میتوانند به طور مستقیم بر روی پایگاه داده ها اعمال شوند، یا از طریق کد های جاوایی که شما وارد میکنید فراخوانده می شوند. این الگوریتم ها میتوانند در بسیاری از اپلیکیشن های مختلف برای نجزیه و تحلیل داده ها، تصویر سازی، مدل سازی پیش بینی کننده و غیره استفاده شوند.

  1. RapidMiner

1

RapidMiner یک پلتفورم داده کاوی مدرن میباشد که روند معنا دار کردن اطلاعات در هم بر هم را در داده کاوی تسریع می بخشد. این پلتفورم با هر محیطی که حاوی اطلاعاتی از هر منبعی میباشد کار میکند و شما میتوانید دیدگاه های خود را در آن پیاده سازی کنید. تنها ایرادی که میتوان به این ابزار گرفت این است که نسخه ی کامل آن مجانی نمیباشد!

منبع :

۳rank

به اشتراک بگذارید:

2 دیدگاه

  • سلام .خیلی لذت بردم از اطلاعات مفید و مختصرتون.عالی بود.اگر امکان داره لینک دانلود و لینک آموزش کار با هر نرم افزار رو هم برای محققین عزیز ایران زمین که برای دسترسی به علم جهانی با سختی و مرارت روبرو هستند قرار بدید ممنون میشم.

    • سلام
      با تشکر از انتخابتان
      برخی از آموزش ها در کانال تلگرام قرار داده شده می توانید با عضویت در آن از آموزش ها استفاده نمیایید
      در آینده نزدیک این آموزش ها در وبسایت نیز قرار می گیرد