وب نامرئی یا اینترنت ژرف چیست؟

* یکی از جالبترین اصطلاحاتی که اخیرا یاد گرفتم همین وب نامرئی یا invisible web بود که البته اسم دیگرش deep وب هست. صفحات اینترنتی ای که ما به طور عادی می بینیم، وب سطحی نام دارند. افراد قبل از هر مرجع دیگری از وب برای جستجوی تحقیقاتشان استفاده می کنند. اما موتورهای جستجو لزوما بهترین نتایج را نمایش نمی دهند. آنها اطلاعات مخفی یا عمیق موجود در اینترنت را نمایش نمی دهند.

* وب ژرف چیست؟
اصطلاح وب نامرئی یا وب “ژرف” به مخزن عظیمی از اطلاعات اطلاق می شود که موتورهای جستجو به آنها دسترسی مستقیم ندارند به طور مثال پایگاه داده کتابخانه های دانشگاهها، سایتهایی که برای مشاهده آنها نیاز به رمز عبور داریم و سایتهایی که به هر دلیل، موتورهای جستجو از فهرست بندی آنها، منع شده اند. بر خلاف صفحات قابل مشاهده (یعنی همین وبی که می توانید توسط موتورهای جستجو ببینید) اطلاعاتی در پایگاههای داده موجود است که اسپایدرها و رباتهای خزنده بدانها دسترسی ندارند.
بعنوان نمونه، اغلب مردم گوگل را بعنوان دارنده بزرگترین پایگاه داده جستجو تصور می کنند که حدودا ۸ بیلیون صفحه را فهرست بندی کرده است. این رقم بزرگ است ولی اگر وب مخفی را در نظر بگیریم باید این رقم را بایستی در ۵۰۰ ضرب کنیم. بعلاوه گوگل فقط صفحات قابل جستجو را که حدودا ۲۵۰ بیلیون است ذخیره کرده است ولی از رقم دقیق صفحات غیر قابل جستجو خبری نیست.

* آمارهای جالب:
- اطلاعات موجود در وب ژرف، بین ۴۰۰ تا ۵۵۰ برابر وب عمومی هستند که ما می بینیم
- وب ژرف حاوی ۷۵۰۰ ترابایت اطلاعات است، در مقابل وب سطحی ۱۹ ترابایت ذخیره کرده است
- وب ژرف دارای نزدیک به ۵۵۰ بیلیون مستند می باشد در حالیکه این رقم برای وب سطحی ۱ بیلیون است
- بیش از ۲۰۰ هزار وب سایت ژرف وجود دارند
- جالب است بدانید که بیش از نیمی از محتوای وب عمیق در عنوان سایتهایشان از کلمه Database استفاده کرده اند و اگر این کلمه را در جستجوهایتان بکار برید، امکان دسترسی تان را به این سایتها افزایش می دهید.

* این مطلب خلاصه ای از این مقاله بسیار عالی هست که توصیه می کنم حتما بخوhنید. در جدول شماره ۲، بزرگترین وب سایتهای عمیق لیست شده اند که می تونید در جستجوهای مختلف از اونها استفاده کنید

۲۲ نظر

  1. یک شیرفروش ۱۳۸۸-۱۲-۲۵، ۸:۳۵ ق.ظ

    به نظرم سایتهای تورنت خصوصی هم در دسته ی وب ژرف قرار میگیرند ، اینطور نیست ؟

    سعید Reply:

    سلام
    بیشتر فلش سایت ها که موتور جستجو نمیتونه توشون بگرده ( البته گوگل داره روش کار می کنه )

    انجمن ها و کلوب هایی که محتویاتشون رو وقتی می بینی که باید عضو بشی

    و برخی سایت هایی که به موتور جستجو معرفی نشدند جزو این سایت ها هستند .

    بنده تقریبا دو سال دنبال موتور جستجویی گشتم که بتونه اینجاها بگرده ولی موتور جستجویی که بتونه سایت های فارسی رو پیدا کنه یافت نشد :دی

    چند تا موتور جستجو که میتونن سایت های انگلیسی رو پیدا کنن البته نه همشون رو
    http://websearch.about.com/od/deepwebsearchengines/Invisible_Web_Search_Engines.htm

    البته یک روش هم اینه از سایت هایی مثل Stumble upon استفاده کنید . تا سایت هایی رو که بقیه پیدا کرده اند شما هم ببینید .

    ۹ways-google-is-discovering-the-invisible-web
    http://www.hyperdogmedia.com/blog/2008/07/01/9-ways-google-is-discovering-the-invisible-web/

    مسعود (گنبد قابوس) Reply:

    سلام گلان و بلبلان سال جدید مو مو مبارک !
    سایتهای اشتراک تورنت، نخیر تورنتهای نیز جزو آن دسته سطحی میباشند، شما میتوانید تورنتها را هم با مرورگرتان جست و جو کنید.
    و همچنین همه ی فروم ها و انجمنها و کلوبها، همه را نمایش میدهد فقط لینکها در آن نمایش داده نمیشوند و اون هم فقط برای عضو نبودن شما در آن سایت است.

    منظور اصلی در این مطلب به نظر من آن دسته از سایتهایی است که خود منبع بزرگی از اطلاعاتند که سایتهای گوگل و غیره نمیتوانند مستقیما به آن دسترسی داشته باشند.
    مثل سایت : http://www.magiran.com که موتورهای جست و جو فقط به نام و لینکهای سطحی آن دسترسی دارند، نه به کل مقالات و اطلاعات ثبت شده در (دیتابیس) این سایت.

  2. دردا ۱۳۸۸-۱۲-۲۵، ۹:۰۳ ق.ظ

    مقاله جالبی بود مرسی

  3. فهیمه ۱۳۸۸-۱۲-۲۵، ۱۱:۰۷ ق.ظ

    سلام
    وب خیلی جالبی داری.خیلی وقته که اسمتو توی لیست دوستان تورجان میبینم ولی سعادت نبود وبتو ببینم.مطلبات عالیه.به خصوص”ببخشید خانوم میشه…”
    امیدوارم همیشه موفق باشی.

  4. سینا ۱۳۸۸-۱۲-۲۵، ۱۲:۰۹ ب.ظ

    یعنی این همه سرچ انجین و دایرکتوری و … همه اش کشک ؟ :D

  5. امیر مهدی ۱۳۸۸-۱۲-۲۵، ۲:۳۵ ب.ظ

    سلام
    روز بخیر
    مطلبت خیلی عالی بود.کاربردی و جالب.
    موفق باشی.بازم از این پستهای خوب بگذار

  6. حسن ۱۳۸۸-۱۲-۲۵، ۷:۰۱ ب.ظ

    مشکل اینه که نه فقط گوگل، بلکه هیچ کس به جز صاحبان همون سایت ها به اون اطلاعات دسترسی ندارن. یادمه یه سایتی راه افتاده بود که در عوض گرفتن مبلغ مشخصی به جستجوی اطلاعات پزشکی در خود بانک های اطلاعاتی می پرداخت. فکر کنم گوگل طرحی هم برای بستن قرارداد با صاحبان بزرگ ترین بانک های اطلاعاتی برای اجازه دادن به جستجو درون اون ها داشت.
    اگه می شد چی می شد!

  7. آشناس! ۱۳۸۸-۱۲-۲۵، ۸:۰۰ ب.ظ

    صحت خواب نازنین! یعنی جنابعالی به عنوان یه دانشجوی سابق، و شاغل فعلی در زمینه نرم افزار نویسی تازه این مطلبو اکتشاف فرمودین؟ البته از “دانش کاه” خیلی انتظاری نمیره اما برای یه آدم برنامه نویس – که حداقل ۵ ساله وبگردی میکنه و وبلاگ مینویسه – خیلی بده! افتضاحه! پاک کن این پستتو آبرو ریز!

  8. غلامرضا ۱۳۸۸-۱۲-۲۵، ۱۱:۳۷ ب.ظ

    تو آخر نوشته اتون کیبوردتون انگلیسی بوده به جای “ا” حرف اچ انگلیسی را تایپ کردید.

  9. زهره ۱۳۸۸-۱۲-۲۶، ۸:۰۱ ق.ظ

    ما بهش میگیم وب پنهان! یکی از اساتید رشته کتابداری رساله کتراشونو در انگلستان در این موضوع تمام کردند. اسم دکتر یزدان منصوریان رو سرچ کنید به نتایج خیلی خوبی می رسید.

  10. iman ۱۳۸۸-۱۲-۲۶، ۸:۲۳ ق.ظ

    yadesh bekheyr

    4,5 saal pish

  11. مونا ۱۳۸۸-۱۲-۲۶، ۹:۲۲ ق.ظ

    قابل توجه کسانی که خیلی ادعای آپ تو دیت بودن دارند: این مطلب رو خیلی ها نمیدونند و من بشخصه خیلی خوشم اومد از مطرح شدنش و مطلع شدنش. حتما باید ادعای فضل بکنید. ممنون زهرا خانم

  12. احسان ۱۳۸۸-۱۲-۲۶، ۱۱:۴۰ ق.ظ

    سلام

    وبسایت خوبی دارید . اگر مایل به تبادل لینک هستید وبلاگ من رو با نام “وبلاگ تخصصی وب و کامپیوتر ” لینک کنید.
    بعد به من اطلاع دهید تا نام وبسایتتان را با نام دخواهتان لینک کنم .

    ازتون خیلی ممنون میشم که این خواسته رو اجابت کنید!

    راستی مطالبتون هم جالب و خواندنی هستند.

  13. محمد ۱۳۸۸-۱۲-۲۶، ۱۲:۵۳ ب.ظ

    سلام عزیز … آدرس فید وبلاگم از دیروز این است، لطفا اصلاح کنید:
    http://feeds.feedburner.com/mmoeeni

  14. اشنا ۱۳۸۸-۱۲-۲۶، ۷:۵۸ ب.ظ

    استاد:
    وب نویس هر چیری می دونه نمی نویسه

    http://web.archive.org/web/20020604024316/http://zahra-hb.blogspot.com/

    نقطه Reply:

    ممنئن از معرفی لینک بریم که کلی بخندیم :)

  15. اکبرپور ۱۳۸۸-۱۲-۲۷، ۱۰:۰۷ ق.ظ

    دوست عزیز ، شب بیا باغ.
    وقتی مطلبی به رای گذاشته می‌شه به مطلب نظر بدین نه به حواشی

  16. مسعود (گنبد قابوس) ۱۳۸۸-۱۲-۲۹، ۱:۱۸ ق.ظ

    ممنون زحمت کشیدی

  17. روزبه ۱۳۸۹-۰۱-۵، ۱:۲۲ ب.ظ

    مطلب خیلی جالبی بود
    اما من با بعضی از اون سایتهای جدول ۲ اشنایی دارم و کار کردم
    مثل سایت NOAA
    توی این سایتها بیشتر اطلاعات عددی هست تا اطلاعاتی که بشود یک کسی که وبگردی می کنه بخونه
    برای اینکه دقیق تر توضیح داده باشم، مثلا داده های دما و رطوبت برای کل کره زمین به تفکیک ۲٫۵ درجه و برای ۴۸ ساعت
    خوب این فایلها هم خیلی بزرگ اند و هم خیلی مهم برای مثلا مدل سازی هواشناسی
    ولی نمی شه که مثلا در جواب جستجوی یک واژه به اونا رسید
    کلا یکسری عدد هستند

  18. مهدیحسینی ۱۳۸۹-۰۲-۱۶، ۲:۳۷ ق.ظ

    سلام_من یه دختر برای رفاقت سالم می خوام از کرج یاتهران سنش ۱۶یا۱۷باشد_ خیلی خوشکلم سنم۱۷سالمه_شمارم ۰۹۳۷۶۶۷۶۶۴۹_۰۹۱۹۶۴۴۴۷۷۲

  19. مهدیحسینی ۱۳۸۹-۰۲-۱۶، ۲:۳۸ ق.ظ

    اسم من محمدهست