توییتر یکی از بهترین منابع موجود برای داده کاوی و داده کاوان می باشد. داده کاوان میتوانند با استفاده از دانش خود و ابزارهایی مانند tweepy که از پایتون قدرت گرفته است به جمع آوری توییت های موجود در توییتر حول محور کلید واژه ها و منابعی که مورد نظرشان میباشد بپردازند. سپس به خوشه بندی و دسته کردن این اطلاعات پرداخته تا دانش درون آنها را استخراج کند. در نهایت نیز می بایست با استفاده از ابزارهای تصویر سازی مانند گفی یا networkx 2 به تصویر سازی و مصور سازی آنها بپردازند. در این جا ما نمونه ای از مراحل انجام گرفته از توضیحاتی که در بالا ذکر کرده ایم را به شما نشان داده ایم. موضوع داده کاوی این تصویر ها مربوط به یک نگاه اجمالی داشته باشیم به  ۱۰ تا از تأثیرگذارترین اشخاص و صفحات با موضوع علم داده بر روی توییتر می باشد که در چند پست قبلی با نام (۱۰ تا از تاثیرگزارترین ها با موضوع علم داده بر روی توییتر) در مفتا منتشر کرده بوده ایم. در نمودار های میله ای، محور x مروبط به تعداد تاپیک های موجود و محور y مربوط به فراوانی کلمات موجود در این تاییک ها می باشد. همچنین اندازه این دایره ها مربوط به فراوانی کلمات با توجه به موضوع مورد نظرشان می باشد.

community11-768x783 community13-768x745 community38-768x692 termite_plot_1-768x1306 termite_plot_2-768x1306 termite_plot_3-768x1306

دیدگاه شما چیست؟