همه چیز درباره وب عمیق یا پنهان

منظور از وب عمیق یا وب پنهان بخشی از شبکه جهان گستر وب است که منابع موجود در آن، خارج از حوزه جستجو و بازیابی مقدماتی موتورهای جستجوی عمومی قراردارد و بازیابی اطلاعات موجود در این بخش از محیط وب، با استفاده و جستجوی مستقیم از این موتورها میسر نیست. به عبارت دیگر امکان بازیابی منابع اطلاعاتی وب پنهان یا از نظر فنی برای موتورهای جستجو مقدور نیست و یا آنها به دلیل محدودیت ­های دیگر از دسترسی و ایندکس ­گذاری این منابع بازمانده ­اند.

همه چیز درباره وب عمیق یا پنهاندر زیر دلایل این مسئله ذکر شده است:

۱-        نقاطی از وب هستند که به خاطر احتیاج به نام کاربری و رمز عبور امکان دسترسی به آنها وجود ندارد.

۲-        برخی اطلاعات در صورتی قابل مشاهده می­ گردند که خریداری شوند، این بخش که به وب ملکی شهرت دارد نیز از دید موتورهای جستجوگر پنهان است.

۳-        بخش دیگری از وب نامرئی، به مجموعه ای از اطلاعات الکترونیکی پیوسته اطلاق میشود که آنها معمولا خارج از حوزه جستجوی موتورهای جستجوگر قرار دارند هریک از این پایگاه ها صفحه جستجوی مبتنی بر وب دارند، که امکان جستجو در آنها برای کاربران را فراهم می کند، اما خزنده های موتورهای جستجو توان ورود به آن ها را ندارند و در نتیجه حجم انبوهی از اطلاعات، نمایه نشده باقی می ماند.

۴-        منابع اطلاعاتی غیرمتنی نیز جزء وب پنهان بشمار می­روند چون موتورهای جستجوگر برای ایندکس گذاری منابع ابرمتن Hypertext طراحی شده اند درحالیکه بسیاری از منابع موجود در وب در قالب ­های دیگر و معمولا غیرمتنی (تصویر، منابع دیداری شنیداری و …) ظاهر می ­شوند و امکان ایندکس گذاری آن­ها در موتورهای جستجوگر وجود ندارد.

۵-        با توجه به استفاده اغلب موتورهای جستجوگر از الگوریتم عنکبوتی، در صورتی که صفحه وبی به هیچ جا متصل نشده باشد، دسترسی به آن از طریق موتورهای جستجو غیرممکن است.

منابع موجود در وب عمیق

سایت های دارای رمز عبور، اسناد موجود در ﭘﺸت سامانه های حفاظتی، فایل های pdf از متون آرشیو شده و ابزارهای تعاملی نظیر ماشین حساب ها و برخی واژه نامه ها و همچنین محتویات بعضی از ﭘﺎیگاه های اطلاعاتی، منابع حفاظت شده از طریق اسم کاربر و گذرواژه، منابع و صفحات وب بدون ﭘﯾوند و صفحات افزون بر حد­اکثر تعداد صفحات قابل مرور در نتایج بازیابی.

اهمیت وب عمیق

به دو دلیل می توان گفت که وب پنهان اهمیت دارد. نخست از نظر کمی باید گفت که حجم اطلاعات موجود در این بخش خیلی بیشتر از سطح آشکار است.

  • بهترین موتورهای جستجو فقط قادر هستند که حدود ۱۶ درصد از اطلاعات موجود در وب را بازیابی کنند و بنابراین ۸۴ درصد آنها جزء وب پنهان به حساب می­آیند.
  • اندازه وب نامرئی تقریباً ۵۰۰ برابر وب مرئی است. وب نامرئی ۵۵۰ میلیون سند و وب مرئی تقریباً یک میلیون سند را دارا می باشد. هر چند مطالعات انجام شده در این باره با یکدیگر متفاوتند اما بر اساس همه آن­ها دیپ وب از نظر داده ها بسیار غنی ­تر از وب معمولی یا وبی است که ما می­شناسیم. می­توان گفت که کل وب یک کوه یخی است که دیپ وب قسمتی از آن است که در زیر آب­ها پنهان و قسمت دیگر که در سطح آب نمایان است همان وبی است که ایندکس شده است.

و از منظر کیفی باید گفت:

  • اطلاعات بخش­های مختلف این مجموعه به ویژه منابع اطلاعاتی موجود در وب عمیق، معمولاً منابع ارزشمند و مفیدی هستند و در بسیاری از موارد ﭘﺎسخگوی نیاز کاربران می باشند. تقریباً بیش از نیمی از وب نامرئی را ﭘﺎیگاه های اطلاعاتی موضوعی تشکیل می­دهند.

اما لازم به توضیح است که دیپ وب مقدار محتوای بسیاری نیز دارد که به هیچ ­وجه جالب توجه نیست و یک دلیل ایندکس نشدن این محتواها نیز همین امر است. اما محتوایی که عمدا روی دیپ وب قرار داده شده می­ تواند فوق العاده جالب توجه باشد. مثلا محتوای کامل ویکی لیکس روی دیپ وب است. فرومهای انفورماتیک بسیار پیشرفته و همین­طور سایت­های مشتاقان دستکاری­ ها و ساخت و ساز از هر نوع نظیر امواج رادیوئی و اسناد بسیار حساس بعضی دولت­ها روی دیپ وب هستند. اما لازم است توضیح داده شود که با این­همه باید محتاط بود و هر محتوائی را که روی دیپ وب یافت می ­شود نباید دانلود کرد چراکه می­ توانند بسیار دروغین و خطرناک باشند. دیپ وب خیلی مورد توجه انونیموس نیز هست. روی وب عمیق همان­قدر که میتوان محتوای فوق العاده جالب یافت همان­قدر هم محتوای غیر قانونی وجود دارد که دسترسی به ان­ها میتواند تولید دردسر کند. علاوه بر این دیپ وب خالی از خطر انواع ویروس و الودگی نیست.

دسترسی به وب عمیق

دسترسی به آنچه که در لایه ­های پایین وب می­ گذرد زیاد ساده نیست. چرا که بیشتر ارتباط ­ها و خرید و فروش ­های اصلی توسط لینک ارتباطی امن بین طرفین برقرار می­ شود. ارتباطی که از نظرگاه همه موتورهای جستجوگر فرسنگ ها فاصله دارد. ولی وب سایت هایی هم هستند که عموم مردم را مورد هدف قرار می ­دهند. این وب سایت ها بر روی سرورهای TOR راه اندازی شده اند و از طریق مرورگرهای معمولی قابل دستیابی نیستند. root name این وب سایت ها اغلب onion. است که در DNS های root ثبت نشده و فقط بر روی سرورهای TOR تعریف شده است. همچنین URL آنها، بسادگی به یاد سپردنی نیست و هرچند وقت یکبار به کل تغییر می­ کند. اغلب این وب­سایت­ها دارای صفحات سیاه رنگی حاوی چند متن مختصر هستند. یکی از مراجعی که اطلاعات دسته بندی شده این وب سایت ها را در اختیار کاربران می­گذارد HiddenWiki است.

به اشتراک بگذارید:

یک دیدگاه