مطالب قدیمی

با spark قدرت را حس کنید

 

تصور کنید که بتوانید هر کلمه از هر صفحه ی هر کتاب موجود در کتابخانه کنگره ایالت متحده آمریکا را استخراج کنید. سپس اجازه دهید که تمام آنها به صورت یک توده بزرگ بر روی زمین سقوط کند. اندازه این توده را ضرب در ۱۰ کنید. فکر میکنید که چقدر طول بکشد تا این توده کلمات به حالت منظم قبلی خود برگردد؟ آیا حدس شما به ۲۳ دقیقه نزدیک بوده است؟ در اکتبر سال ۲۰۱۴، پروژه های در حال رشد و متن باز Apache Spark توانسته اند که این کار را در این محدوده زمان انجام دهند. این پروژه توانست ۱ میلیارد پرونده ۱۰۰ بایتی از اطلاعات نامنظم و به هم ریخته را در ۲۳ دقیقه منظم کند و رکورد قبلی جهان را در مرتب سازی داده ها جابه جا کند.

برچسب ها

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.

دکمه بازگشت به بالا