زنگ

کسانی هستند که این خبر را قبل از شما می خوانند.
برای دریافت آخرین مقالات مشترک شوید.
پست الکترونیک
نام
نام خانوادگی
چگونه می خواهید The Bell را بخوانید
بدون اسپم

ارسال کار خوب خود در پایگاه دانش ساده است. از فرم زیر استفاده کنید

دانشجویان ، دانشجویان فارغ التحصیل ، دانشمندان جوان که از دانش دانش در مطالعات و کار خود استفاده می کنند بسیار از شما سپاسگزار خواهند بود.

اسناد مشابه

    ابزارهای جستجوی اطلاعات در اینترنت. الزامات و روشهای اصلی بازیابی اطلاعات. ساختار و مشخصات خدمات جستجو. موتورهای جستجوی جهانی WWW (شبکه جهانی وب). برنامه ریزی برای جستجو و جمع آوری اطلاعات در اینترنت.

    چکیده ، اضافه شده 11/02/2010

    ویژگی های روش های جستجوی اطلاعات در اینترنت ، یعنی استفاده از لینک های ابر متن ، موتورهای جستجو و وسایل ویژه. تجزیه و تحلیل منابع جدید اینترنتی. تاریخچه ظهور و شرح موتورهای جستجوگر غربی و روسی.

    چکیده ، اضافه شده 05/12/2010

    توضیحات و طبقه بندی سیستم های بازیابی اطلاعات مدرن. اسناد ابر متن. بررسی و رتبه بندی موتورهای اصلی جستجوی جهان. توسعه یک سیستم بازیابی اطلاعات که مکانیسم بازیابی اطلاعات را در اینترنت نشان می دهد.

    پایان نامه ، اضافه شده 06/16/2015

    تجزیه و تحلیل قابلیت های موتورهای جستجو Yandex و Google ، مقایسه آنها از نظر سودمندی. تاریخچه ایجاد موتورهای جستجو ، ویژگی های رابط آنها ، ابزارهای جستجو و الگوریتم ها. تشکیل یک سؤال و ملاک پاسخ به آن.

    چکیده ، اضافه شده 05/07/2011

    در نظر گرفتن موتورهای جستجوگر اینترنتی به عنوان یک مجموعه نرم افزاری و سخت افزاری با یک رابط وب که امکان جستجوی اطلاعات را فراهم می کند. انواع موتورهای جستجو: Archie، Wandex، Aliweb، WebCrawler، AltaVista، Yahoo!، Google، Yandex، Bing و Rambler.

    چکیده اضافه شده در 05/10/2013

    ساختار و اصول ساخت اینترنت ، جستجو و ذخیره اطلاعات در آن. تاریخچه ظهور و طبقه بندی سیستم های بازیابی اطلاعات. اصل عملکرد و ویژگی های موتورهای جستجوگر گوگل ، یاندکس ، رامبلر ، یاهو. جستجو بر اساس URL.

    مقاله ترم ، اضافه شده 03/29/2013

    جوهر و اصل اینترنت جهانی. در سیستم Google اطلاعاتی درباره پارامترها جستجو کنید. سیستم های بازیابی اطلاعات تخصصی: "KtoTam" ، "Tagoo" ، "Truveo" ، "Kinopoisk" ، "Ulov-Umov". استفاده مناسب از موتورهای جستجو.

    ارائه در تاریخ 02/16/2015 اضافه شد

    ذخیره اطلاعات در اینترنت. اسناد ابر متن ، انواع پرونده ها. پرونده های گرافیکی ، انواع و ویژگی های آنها. قوانین جستجو و قوانین جستجوی اطلاعات. بررسی موتورهای جستجوگر اینترنتی. همه چیز درباره موتورهای جستجو Yandex ، Google ، Rambler.

    مقاله ترم ، اضافه شده در 26/26/2011

اطلاعات کلی.

در حال حاضر ، اینترنت صدها میلیون سرور که میزبان میلیارد ها سایت مختلف و پرونده های فردی شامل انواع مختلفی از اطلاعات هستند ، متحد می شود. این یک مخزن بزرگ اطلاعات است. روشهای مختلفی برای یافتن اطلاعات در اینترنت وجود دارد.

جستجوی یک آدرس شناخته شده. آدرس های مورد نیاز از دایرکتوری ها گرفته می شود. دانستن آدرس کافی است آن را وارد نوار آدرس مرورگر کنید.

www.gov.ru سرور مقامات دولتی روسیه است.

ساخت آدرس توسط کاربر. با دانستن سیستم تشکیل آدرس در اینترنت ، می توانید هنگام جستجو برای وب سایت ها آدرس ایجاد کنید.

دامنه موضوعی یا جغرافیایی باید به کلمه کلیدی اضافه شود (نام یک شرکت ، شرکت ، سازمان یا یک اسم انگلیسی ساده) و شهود باید در آن گنجانده شود.

آدرس های وب سایت تجاری:

www.cnn.com (اخبار جهانی CNN) ،

www.sony.com (شرکت SONY) ،

www.mtv.com (اخبار موسیقی MTV).

آدرس موسسات آموزشی:

www.ntu.edu (دانشگاه ملی ایالات متحده).

آدرس سرورهای منطقه ای:

www.poland.net (لهستان) ،

www.israil.net (اسرائیل).

موتورهای جستجوگر اینترنتی

برای جستجوی اطلاعات در اینترنت ، سیستم های بازیابی اطلاعات ویژه تولید شده است. موتورهای جستجو دارای یک آدرس مشترک هستند و به صورت یک صفحه وب حاوی ابزارهای ویژه برای سازماندهی جستجو (رشته جستجو ، فهرست موضوعی ، پیوندها) نمایش داده می شوند. برای تماس با موتور جستجو ، کافیست آدرس آن را در نوار آدرس مرورگر وارد کنید.

مطابق روش سازماندهی اطلاعات ، سیستم های بازیابی اطلاعات به دو دسته طبقه بندی (مبانی) و فرهنگ لغت تقسیم می شوند.

اصطلاحات (طبقه بندی کننده ها) موتورهای جستجو هستند که از یک سازمان سلسله مراتبی (مانند درخت) اطلاعات استفاده می کنند. کاربر هنگام جستجوی اطلاعات ، سرفصل های موضوعی را جستجو می کند ، به تدریج قسمت جستجو را باریک می کند (برای مثال ، اگر شما نیاز به پیدا کردن معنی یک کلمه دارید ، سپس ابتدا باید یک فرهنگ لغت در طبقه بندی پیدا کنید و سپس کلمه مورد نظر را در آن پیدا کنید).

موتورهای جستجوگر فرهنگ لغت سیستم های سخت افزاری و نرم افزاری قدرتمند هستند. با کمک آنها ، اطلاعات (اسکن شده) در اینترنت مشاهده می شود. اطلاعات مربوط به محل این یا آن اطلاعات در فهرستهای ویژه مرجع وارد می شوند. در پاسخ به یک پرس و جو ، یک جستجو با توجه به رشته پرس و جو انجام می شود. در نتیجه ، به آن دسته از آدرس ها (URL ها) که در هنگام جستجو ، کلمه جستجو یا گروهی از کلمات پیدا شده است ، پیشنهاد می شود. با انتخاب هر یک از لینک های URL پیشنهادی ، می توانید به سند یافت شده بروید. بیشتر موتورهای جستجو مدرن مخلوط هستند.

معروف ترین و محبوب ترین موتورهای جستجو:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

سیستم هایی وجود دارند که در جستجوی منابع اطلاعات از جهات مختلفی تخصص دارند.

جستجوی افراد در اینترنت:

www.whowhere.ru ww. bigfoot.com

جستجوی گروه خبری (Usenet):

www.dejanews.com

موتورهای جستجو موضوع:

جستجوی نرم افزار:

جستجو در بایگانی پرونده:

http: // ftpseach. city.ru ، http: // ftpsearch. licos.com

راهنمای (مجموعه های موضوعی از پیوندها با حاشیه نویسی):

http://www.atrus.ru

غالباً با استفاده از دایرکتوری های منطقه ای می توان جستجوی مؤثر برای اطلاعات را انجام داد - سرورهای تخصصی حاوی اطلاعات مربوط به شرکتها یا منابع وب یک شهر یا منطقه. به عنوان مثال ، برای سن پترزبورگ چنین دایرکتوری در http://www.spb.ru قرار دارد.

لیستی از IPS را می توان در www.monk یافت. newmail.ru

لیست مفصلی از موتورهای جستجو و دایرکتوری ها در جدول ارائه شده است. 3.2

قوانین اجرای را درخواست کنید

در هر موتور جستجو ، بخش راهنما اطلاعاتی در مورد چگونگی جستجو ، نحوه آهنگسازی رشته پرس و جو ارائه می دهد. در زیر اطلاعات مربوط به یک زبان پرس و جو معمولی "متوسط" وجود دارد.

درخواست ساده

یک کلمه را برای تعریف موضوع جستجو وارد کنید. به عنوان مثال ، در موتور جستجو Rambler.ru کافی است وارد کنید: اتوماتیک.

اسنادی وجود دارد که شامل کلمات مشخص شده در درخواست هستند. تمام اشکال کلمات زبان روسی به رسمیت شناخته می شود ، به طور معمول ، پرونده حروف نادیده گرفته می شود.

می توانید از شخصیت "*" یا "؟" در پرس و جو استفاده کنید. امضاء کردن "؟" در کلمه کلیدی یک کاراکتر جایگزین می شود ، که می تواند با هر حرف جایگزین شود ، و "*" - دنباله ای از کاراکترها.

به عنوان مثال ، پرس و جو خودکار * به شما امکان می دهد اسنادی را پیدا کنید که شامل کلمات خودکار ، خودکار و غیره باشد.

درخواست پیچیده

اغلب برای بدست آوردن اطلاعات خاص تر ، ترکیب کلمات کلیدی ضروری است. در این حالت از کلمات پیوند دهنده اضافی ، توابع ، عملگرها ، نمادها ، ترکیبی از اپراتورها که توسط براکت ها جدا شده استفاده می شود.

به عنوان مثال ، جستجوی موسیقی & (ضرب و شتم | ضرب و شتم) به این معنی است که کاربر به دنبال اسنادی است که حاوی کلمات موسیقی و ضرب و شتم یا موسیقی و ضرب و شتم است.

در جدول 3.1 قواعد شکل گیری نمایش داده شدگان پذیرفته شده در سیستم Aport (http://www.aport.ru) را نشان می دهد.

جدول 3.1

عملگرهایی برای تولید نمایش داده شد

اپراتور مترادف یک نظر
و و & در این جستجوی اسناد حاوی هر دو کلمه کلیدی پیدا می شود. لازم نیست آن را بنویسید. به عنوان مثال ، پرس و جو: علوم کامپیوتر و کتاب درسی معادل کتاب علوم کامپیوتر است
یا یا | جستجوی آن اسنادی است که در آن هر یک از کلمات مشخص شده یا هر دو کلمه به طور همزمان استفاده می شود
نه نه - ~ جستجو محدود به اسنادی است که بعد از عملگر حاوی کلمه نیستند
" " " " نقل قول های دو یا یک به شما امکان می دهد یک عبارت را پیدا کنید
تاریخ \u003d تاریخ: تاریخ \u003d جستجو محدود به اسنادی است که در محدوده تاریخ مشخص شده قرار دارند. مثال 1. تاریخ اعتبار \u003d 01/02 / 2002-01 / 03/2002. در صورت درخواست ، اسناد حاوی کلمه "ارز" و دارای تاریخ از اول فوریه 2002 تا 1 مارس 2002 صادر می شود. مثال 2. تاریخ \u003d 01/03/2002 ارز مثال 3. تاریخ:<02/03/2002 валюта

جدول 3.2

لیست موتورهای جستجو و دایرکتوری ها

نشانی شرح
www.excite.com موتور جستجو با بررسی ها و راهنماهای سایت
www.alta-vista.com سرور جستجو ، قابلیت جستجوی پیشرفته در دسترس است
www.hotbot.com سرور جستجو
www.poland.net www.israil.net سرورهای جستجوی منطقه ای لهستان ، اسرائیل
www.ifoseek.com سرور جستجو (آسان برای استفاده)
www.ipl.org کتابخانه Internet Publik ، کتابخانه عمومی که توسط پروژه دهکده جهانی اداره می شود
www.wisewire.com WiseWire - جستجوی هوش مصنوعی
www.webcrawler.com WebCrawler - موتور جستجو ، آسان برای استفاده
www.yahoo.com دایرکتوری وب و رابط برای دسترسی به جستجوی متن کامل روی سرور AltaVista
www.aport.ru Aport - سرور جستجوی زبان روسی
www.yandex.ru Yandex - سرور جستجوی روسی زبان
www.rambler.ru Rambler - سرور جستجوی روسی زبان
منابع کمک آنلاین
www.yellow.com صفحات زرد اینترنتی
راهب. newmail.ru موتورهای جستجو از پروفایل های مختلف
www.top200.ru 200 وب سایت برتر
www.allru.net
www.ru کاتالوگ منابع اینترنتی روسیه
www.allru.net/z09. htm منابع آموزشی
www.students.ru سرور دانش آموزان روسی
www.cdo.ru/index_new. جانشین مرکز آموزش از راه دور
www.open. Ac بریتانیا دانشگاه آزاد انگلیس
www.ntu.edu دانشگاه ملی آمریکا
www.translate.ru مترجم متن الکترونیکی
www.pomorsu.ru/guide. کتابخانه.html لیست پیوندها به کتابخانه های شبکه
www.elibrary.ru کتابخانه الکترونیکی علمی
www.citforum.ru کتابخانه الکترونیکی
www.infamed.com/psy تست های روانشناختی
www.pokoleniye.ru وب سایت فدراسیون آموزش اینترنت
www.metod. narod.ru منابع آموزشی
www.spb. osi.ru/ic/distant آموزش از راه دور در اینترنت
www.examen.ru امتحانات و آزمونها
www.kbsu.ru/~book/ کتاب علوم کامپیوتر
عظیم. km.ru دانشنامه ها و فرهنگ لغت ها

جستجوی اطلاعات در اینترنت: مشکلات

مشکلاتی که روی سطح آن قرار نمی گیرند ، اغلب خود را تنها احساس می کنند که "تحت تأثیر قرار گیرند" ، پس از اتمام مرحله معین کار آینده نگر و احتمالاً بر اساس نتایج آن ، قبلاً تصمیمی گرفته شده است. چه چیزی مانع از شفافیت اوضاع از ابتدای کار یک سیستم بازیابی اطلاعات خاص (ISS) می شود؟ جواب بسیار ساده است: عدم وجود اطلاعات جامع از این نوع از طرف توسعه دهنده. پیامد مستقیم این عدم صحت داده های دریافت شده و از دست رفتن کنترل نشده آنها است. پیدا کردن یک موتور جستجو در وب که برخی از ویژگی های "بدون سند" را ندارد ، نادر است. به نظر می رسد کاربر به اطلاعات زیادی احتیاج ندارد ، یعنی:

نحوه پر کردن بانک اطلاعاتی IPS و حجم آن چگونه است؛

طیف کاملی از قابلیت های زبان جستجو سیستم

ویژگی های اصلی ارائه نتایج جستجو ، اول از همه ، الگوریتم برای رتبه بندی سوابق از لیست پاسخ های یک جستجوی جستجو است.

متأسفانه ، منبع چنین اطلاعاتی معمولاً سندی نیست که از صفحه اصلی یک موتور جستجو موجود باشد ، بلکه انتشارات نویسندگان فردی است که در وب ، کتاب و مجله رایانه پراکنده شده اند. به نظر می رسد دلایل این وضعیت نه تنها به سهل انگاری توسعه دهنده بلکه به عاملی به نام سیاست بازاریابی نیز نسبت داده می شود. به بیان ساده تر ، ارائه موتور جستجوگر با کامل ترین اطلاعات در مورد خود ، همیشه تأثیر مثبتی در رتبه بندی آن ندارد. با این وجود ، در برخی موارد ، کاربر کاملاً قادر به کنترل وضعیت است. غالباً می توان از طریق آزمایش ویژگی های کار یک سرویس جستجوی انتخاب شده را پیدا کرد. ساخت پرس و جوهای تست ویژه که به سرعت دقیقاً آن جنبه عملکرد سیستم را که مهمترین وظیفه فعلی است ، روشن می سازند ، در بسیاری موارد غیرمجاز است. ما بحث خود را به نحوه جلوگیری از بروز برخی از مشکلات هنگام کار با IPS اختصاص خواهیم داد. موتورهای جستجوگر مشهور اینترنتی به عنوان نمونه ای برای نشان دادن ارائه در نظر گرفته می شوند.

16.یافتن اطلاعات در اینترنت

اطلاعات ارسال شده در شبکه جهانی وب به میزان زیادی بایت محاسبه می شود. برای جستجوی اطلاعات در شبکه جهانی وب ، از وب سایتهای ویژه استفاده می شود - سیستم های بازیابی اطلاعات. آنها به کلمات کلیدی اجازه می دهند منابع اطلاعاتی مرتبط با کلمات کلیدی را پیدا کنند. این می تواند متن حاوی کلمات کلیدی یا تصویر گرافیکی یکی از کلمات کلیدی باشد. نمونه هایی از سیستم های بازیابی اطلاعات گوگل و یاندکس هستند.

جستجوی اطلاعات - یکی از مهمترین وظایف در عمل که هر کاربر اینترنتی باید آن را حل کند.

سه روش اصلی برای یافتن اطلاعات در اینترنت وجود دارد:

1. مشخص کردن آدرس صفحه.

3. مراجعه به موتور جستجو (سرور جستجو).

روش 1: آدرس صفحه را مشخص کنید

این سریعترین راه برای جستجو است ، اما می توانید از آن استفاده کنید در صورتی که آدرس دقیق سند یا سایتی را که سند در آن قرار دارد بدانید.

امکان جستجو از طریق یک صفحه وب باز شده در پنجره مرورگر را فراموش نکنید (ویرایش-یافتن در این صفحه ...).

این روش کمترین راه ممکن است ، زیرا می توان از آن برای جستجوی اسنادی استفاده کرد که فقط به سند فعلی نزدیک هستند.

روش 3: مراجعه به موتور جستجو

با استفاده از پیوندهای هایپرتکست ، می توانید بی وقفه در فضای اطلاعات وب حرکت کنید ، از یک صفحه وب به صفحه دیگر حرکت کنید ، اما با توجه به اینکه میلیون ها صفحه وب در جهان ایجاد شده اند ، به سختی می توان اطلاعات لازم را از این طریق پیدا کرد.

موتورهای جستجوگر ویژه به نجات می آیند (به آنها موتورهای جستجو نیز می گویند). آدرس های موتور جستجو برای همه در اینترنت به خوبی شناخته شده است. در حال حاضر موتورهای جستجوگر زیر در بخش روسی زبان اینترنت محبوب هستند: Yandex (yandex.ru) ، Google (google.ru) و Rambler (rambler.ru

سیستم جستجو - وب سایتی که به شما امکان جستجو در اینترنت را می دهد.

اکثر موتورهای جستجوگر به دنبال اطلاعات در شبکه جهانی وب هستند ، اما سیستمهایی نیز وجود دارند که می توانند فایلها را در سرورهای ftp ، محصولات موجود در فروشگاههای آنلاین و اطلاعات در گروههای خبری Usenet جستجو کنند.

توسط اصل عمل موتورهای جستجو به دو نوع تقسیم می شوند: فهرستهای جستجو و فهرستهای جستجو.

جستجوی دایرکتوری ها برای جستجوی موضوعی خدمت کنید.

اطلاعات در مورد این سرورها به صورت موضوعی و فرضی ساخته می شود. با هدف پوشش یک موضوع باریک ، یافتن لیستی از صفحات وب اختصاص داده شده به آن دشوار نیست.

فهرست منابع از طریق اینترنت یا یک فهرست از منابع اینترنتی یا فقط یک فهرست اینترنتی مجموعه ساختار یافته ای از پیوندها به سایتهایی است که مختصراً در مورد آنها می باشد.

فهرست جستجو مانند فهرست های الفبایی کار می کنند. مشتری کلمه یا گروهی از کلمات را مشخص می کند که منطقه جستجو را مشخص می کند - و لیستی از پیوندها به صفحات وب را که شامل اصطلاحات مشخص شده است ، دریافت می کند.

نخستین موتور جستجوی شبکه جهانی وب ، وندکس بود ، یک شاخص ضعف که توسط متیو گری از انستیتوی فناوری ماساچوست در سال 1993 ساخته شد.

نمایه جستجو چگونه کار می کند؟

ایندکس ها را بصورت خودکار جستجو کنید ، به کمک برنامه های ویژه (عنکبوت های وب) صفحات اینترنتی را اسکن کرده و آنها را ایندکس کنید ، یعنی آنها را در پایگاه داده عظیم خود وارد کنید.

ربات جستجو ("وب عنکبوت") برنامه ای است که جزئی جدایی ناپذیر از یک موتور جستجو است و برای خزیدن صفحات اینترنتی به منظور وارد کردن اطلاعات در مورد آنها (کلمات کلیدی) در پایگاه موتور جستجو طراحی شده است. در هسته خود ، یک عنکبوت از نزدیک به یک مرورگر معمولی شباهت دارد. محتوای صفحه را اسکن می کند ، آن را در سرور موتور جستجوگر که در اختیار دارد بارگذاری می کند و آن را از طریق لینک های به صفحات زیر ارسال می کند.

در پاسخ به درخواست برای یافتن اطلاعات مورد نیاز ، سرور جستجو لیستی از لینک های منتهی به صفحات وب را که اطلاعات لازم در دسترس یا ذکر شده است ، برمی گرداند. بسته به محتوای درخواست ، لیست می تواند به اندازه دلخواه شما باشد.

http://www.yandex.ru/

یاندکس - سیستم جستجوی وب روسی. وب سایت شرکت Yandex.ru در 23 سپتامبر 1997 راه اندازی شد. دفتر مرکزی این شرکت در مسکو واقع شده است. این شرکت در سن پترزبورگ ، یاترینبورگ ، اودسا و کیف دفاتر دارد. تعداد کارمندان بیش از 700 نفر است.

کلمه "Yandex" (متشکل از حرف "I" و بخشی از کلمه index؛ این واقعیت که ضمیر روسی "I" با انگلیسی "I" مطابقت دارد) توسط ایلیا سگالوویچ ، یکی از بنیانگذاران Yandex ، که در حال حاضر دارای سمت مدیر فنی شرکت است ، اختراع شده است.

جستجوی Yandex به شما امکان می دهد با در نظر گرفتن مورفولوژی زبان های روسی و انگلیسی و نزدیکی کلمات در یک جمله ، روی اسناد رانت به روسی ، اوکراینی ، بلاروس ، رومانیایی ، انگلیسی ، آلمانی و فرانسوی جستجو کنید. یک ویژگی متمایز Yandex ، قابلیت تنظیم دقیق پرس و جو جستجو است. این کار از طریق یک زبان پرس و جو انعطاف پذیر انجام می شود.

به طور پیش فرض ، Yandex 10 پیوند را در هر صفحه نتیجه جستجو نمایش می دهد ؛ در تنظیمات نتایج جستجو ، می توانید اندازه صفحه را به 20 ، 30 یا 50 سند یافت شده افزایش دهید.

هر از گاهی ، الگوریتم های Yandex که مسئولیت اهمیت نتایج جستجو را تغییر می دهند ، منجر به تغییر در نتایج جستجو می شود. به ویژه ، این تغییرات در برابر اسپم موتور جستجو است که منجر به نتایج نامربوطی برای برخی از نمایش داده شد.

http://www.google.ru/

رهبر موتورهای جستجوگر اینترنتی ، گوگل بیش از 70٪ بازار جهانی را اشغال می کند. در حال حاضر روزانه حدود 50 میلیون جستجوی جستجو ثبت می کند و بیش از 8 میلیارد صفحه وب ایندکس می کند. Google می تواند اطلاعات را به 115 زبان پیدا کند.

طبق یک نسخه ، گوگل هجی شده کلمه انگلیسی googol است. "Googol" یک اصطلاح ریاضی برای یکی است که 100 صفر دنبال می کند. این اصطلاح توسط میلتون سیروتا ، برادرزاده ریاضیدان آمریکایی ادوارد کسنر ابداع شد و اولین بار در کتاب ریاضیات و تصورات کاسنر و جیمز نیومن شرح داده شد. استفاده Google از این اصطلاح نشان دهنده چالش سازماندهی مقادیر عظیم اطلاعات در اینترنت است.

رابط Google حاوی یک زبان پرس و جو نسبتاً پیشرفته است که به شما امکان می دهد جستجوی خود را به دامنه ها ، زبان ها ، انواع پرونده ها و موارد دیگر محدود کنید.

http://www.rambler.ru/

Rambler Media Group یک هلدینگ اینترنتی است که شامل یک موتور جستجو ، طبقه بندی رتبه بندی از منابع اینترنتی روسیه ، و یک درگاه اطلاعات به عنوان خدمات است.

Rambler در سال 1996 تأسیس شد.

موتور جستجوی Rambler کلمات زبانهای روسی ، انگلیسی و اوکراینی را می فهمد و متمایز می کند. بطور پیش فرض ، تمام فرم های یک کلمه جستجو می شوند.

انتقال به جامعه اطلاعاتی قرن بیست و یکم باعث رشد بی سابقه ای در حجم و تمرکز اطلاعات در شبکه های جهانی رایانه ای شد. این مسئله به شدت مسئله ایجاد سیستم های بازیابی اطلاعات (ISS) و استفاده مؤثر آنها را تشدید کرده است.

تاریخچه سیستم های بازیابی اطلاعات خودکار نیم قرن بر می گردد. ISS معمولی در سالهای اولیه یک سیستم انسان ساز است ، که در آن تجزیه و تحلیل و توصیف محتوای اسناد (نمایه سازی) به صورت دستی انجام می شود و جستجوها توسط یک دستگاه انجام می شود. در ابتدا ، ISL مبتنی بر زبان های بازیابی اطلاعات (IPL) بود که عناصر اصلی آنها فرهنگ لغت توصیف کننده و اصطلاحات هستند. اما امروزه ، بیشتر ISS کارگر متعلق به کلاس سیستمهای کلامی از نوع عاری از ساوروس است ، هنگامی که اصطلاحات فهرست بندی مستقیم از متون اسناد انتخاب می شوند. رشد شبیه بهمن در حجم اطلاعات مستند الکترونیکی ، گونه های آن ، تنوع موضوعی و زبانی هر دو عامل بروز بحران بازیابی اطلاعات مدرن و محرک بهبود آن است.

مشکل جستجوی منابع در اینترنت به زودی تحقق یافت و در پاسخ ، سیستم های مختلف و ابزارهای نرم افزاری برای جستجو ظاهر شدند که در میان آنها باید به سیستم های Gopher ، Archie ، Veronica ، WAIS ، WHOIS و غیره اشاره کرد که اخیراً این ابزارها توسط «مشتری» جایگزین شده اند. "و" سرورهای "شبکه جهانی وب.

اگر سعی کنیم طبقه بندی ISS اینترنت ارائه دهیم ، انواع اصلی زیر قابل تشخیص است:

1.IPS از نوع کلامی (موتورهای جستجو)

2. طبقه بندی ISS (دایرکتوری ها)

3. دایرکتوری های الکترونیکی (صفحات "زرد" و غیره)

4- سیستم های اطلاعاتی تخصصی برای انواع خاصی از منابع

5- عوامل هوشمند.

حسابداری جهانی کلیه منابع اینترنتی توسط سیستمهای طبقه بندی کلامی و تا حدی ارائه می شود.

طبقه بندی IPS آنها ناوبری را در فضای وب بر اساس نشانگرهای ویژه پیاده سازی می کنند ، که "درختان" موضوعی هستند که بر اساس طبقه بندی ساخته شده اند.

برای حل مشکل پوشش حداکثر منابع اینترنتی ، سیستمهایی ایجاد می شوند متاستار (موتورهای metasearch).

ابزار اصلی جستجوی اطلاعات در وب امروزه باید IPS جهانی در نظر گرفته شود نوع کلامینمایه سازی (حداقل ادعا می شود) کل فضای اینترنت. موتورهای اصلی جستجو از این نوع (در درجه اول از نظر حجم دیتابیس) شامل گوگل ، سریع (AlltheWeb) ، AltaVista ، HotBot ، Inktomi ، Teoma ، WiseNut ، MSN Search هستند. در میان سیستم های روسی سه مورد اصلی هستند: Yandex (Yandex) ، Rambler (Rambler) و Aport! (Aport) به عنوان یک قاعده ، سیستم هایی که دارای یک پایگاه داده بزرگتر هستند ، تعداد بیشتری اسناد را در پی می گیرند. یک مشکل بزرگ ، هم از نظر زبانی و هم از نظر برنامه ای ، چند زبانه بودن فضای اطلاعات اینترنت و انواع قالب های ارائه داده است.



ویژگی سیستمهای مدرن جستجوی متن کامل است. بسیاری از IRS کلامی در اینترنت ، ارتباط اسناد را به نمایش داده شد با مقایسه عناصر پرس و جو با متون کامل اسناد ارسال شده در وب محاسبه می کنند. در مورد زبان بازیابی اطلاعات ، به طور معمول ، کلمات عادی زبانهای طبیعی به عنوان عناصر جستجو عمل می کنند. درخواست ها از طریق یک رابط ویژه صورت می گیرد ، که به صورت فرم های صفحه در برنامه های مرورگر اجرا می شود.

سه بخش اصلی از هر موتور جستجو وجود دارد.

ربات - زیر سیستم که امکان مشاهده (اسکن) اینترنت را فراهم می کند و فایل معکوس (بانک اطلاعاتی فهرست) را به روز می کند. این بسته نرم افزاری ابزار اصلی برای جمع آوری اطلاعات در مورد در دسترس بودن و وضعیت منابع اطلاعاتی شبکه است.

پایگاه داده جستجو - باصطلاح فهرست مطالب -یک پایگاه ویژه سازمان یافته (بانک اطلاعاتی eng.index) ، اول از همه ، پرونده ای معکوس ، که از واحدهای واژگانی گرفته شده از اسناد وب فهرست بندی شده تشکیل شده است ، و شامل اطلاعات مختلفی در مورد آنها (به ویژه ، جایگاه آنها در اسناد) ، و همچنین در مورد اسناد خود و سایتها به طور کلی.

سیستم جستجو - زیر سیستم جستجو که یک درخواست کاربر (نسخه جستجو) را پردازش می کند ، در پایگاه داده جستجو می کند و نتایج جستجو را به کاربر نشان می دهد. موتور جستجو از طریق رابط کاربر با کاربر ارتباط برقرار می کند - اشکال صفحه برنامه های مرورگر: رابط برای تولید نمایش داده شد و یک رابط برای مشاهده نتایج جستجو.

یک مؤلفه مهم IRS مدرن به اصطلاح صفحات وب جلویی است ، یعنی. اشکال صفحه نمایش که از طریق آن کاربر با موتور جستجو ارتباط برقرار می کند. دو صفحه اصلی صفحه اصلی وجود دارد: صفحات پرس و جو و صفحات نتایج جستجو.

رابط صدور (فرم ارائه نتایج) برای سیستمهای مختلف شامل پارامترهای زیر است: آمار کلمات از پرس و جو ، تعداد اسناد موجود ، تعداد سایتها ، کنترل برای مرتب سازی اسناد در صدور ، شرح مختصر اسناد و غیره. توضیحات هر سند به نوبه خود ، ممکن است شامل باشد ترکیب آن: عنوان سند ، URL (آدرس وب) ، حجم سند ، تاریخ ایجاد ، نام رمزگذاری ، حاشیه نویسی ، فونت برجسته در حاشیه نویسی از کلمات از درخواست ، نشانه ای از سایر صفحات وب مربوطه در همان سایت ، پیوندی به عنوان فهرست به سند یا سایت یافت شده ، ضریب ارتباط ، سایر قابلیت های جستجو (جستجوی اسناد مشابه ، جستجو در یافت شده) اشاره دارد.

سؤالات مربوط به خودکنترلی:

  1. IPS چیست؟
  2. طبقه بندی IPS چیست؟
  3. IRS مستند چیست؟
  4. IRS واقعی چیست؟
  5. قسمت های IPS چیست؟
  6. چه سیستم فرعی پشتیبانی ISS در دسترس است؟
  7. مفاهیم اساسی بازیابی اطلاعات.
  8. زبانهای بازیابی اطلاعات چیست؟
  9. طبقه بندی IPS در اینترنت چیست؟
  10. قسمتهای اصلی IPS.

1. معرفی

هر ساله حجم اینترنت بطور چشمگیری در حال افزایش است ، بنابراین احتمال یافتن اطلاعات لازم بطور چشمگیری افزایش می یابد. اینترنت میلیون ها کامپیوتر ، شبکه های مختلف را متحد می کند ، تعداد کاربران سالانه 15-80٪ در حال افزایش است. و با این وجود ، بیشتر و بیشتر در هنگام دسترسی به اینترنت ، مشکل اصلی کمبود اطلاعات مورد نیاز نیست بلکه توانایی یافتن آن است. به عنوان یک قاعده ، یک فرد عادی به دلیل شرایط مختلف ، نمی تواند یا نمی خواهد بیش از 15-20 دقیقه را صرف جستجوی جواب مورد نیاز خود کند. بنابراین ، یادگیری یک چیز به ظاهر ساده و صحیح بسیار مهم است - کجا و چگونه باید به دنبال دریافت پاسخ های DESIRED باشیم.

برای یافتن اطلاعات مورد نیاز ، باید آدرس آن را پیدا کنید. برای این کار ، سرورهای جستجوی تخصصی (ربات های شاخص (موتورهای جستجو) ، دایرکتوری های موضوعی اینترنت ، سیستم های جستجوی متا ، خدمات جستجوی افراد و غیره) وجود دارند. این کلاس کارشناسی ارشد فن آوری های اصلی برای جستجوی اطلاعات در اینترنت را آشکار می کند ، ویژگی های کلی ابزار جستجو را ارائه می دهد ، ساختار سؤالات جستجو را برای محبوب ترین موتورهای جستجو روسی زبان و انگلیسی بررسی می کند.

2. فن آوری های جستجو

وب جهانی فناوری جهانی (WWW) یک فناوری ویژه برای تهیه و ارسال اسناد در اینترنت محسوب می شود. WWW شامل صفحات وب ، کتابخانه های الکترونیکی ، کاتالوگ ها و حتی موزه های مجازی است! با چنین اطلاعات فراوان ، این سؤال پیش می آید: "چگونه در چنین فضای اطلاعاتی عظیم و گسترده ای حرکت کنیم؟"
ابزارهای جستجو برای حل این مشکل به نجات می رسند.

2.1 ابزار جستجو

ابزارهای جستجو نرم افزارهای ویژه ای هستند که هدف اصلی از آن ارائه بهینه ترین و با کیفیت ترین جستجوی اطلاعات برای کاربران اینترنت است. ابزارهای جستجو روی سرورهای ویژه وب میزبانی می شوند ، که هر کدام یک عملکرد خاص را انجام می دهند:

  1. تجزیه و تحلیل صفحات وب و وارد کردن تجزیه و تحلیل به یک یا سطح دیگری از پایگاه داده موتور جستجو منجر می شود.
  2. اطلاعات مربوط به درخواست کاربر را جستجو کنید.
  3. تهیه رابط کاربری مناسب برای جستجوی اطلاعات و مشاهده نتیجه جستجو توسط کاربر.

روشهای کار استفاده شده هنگام کار با یک یا ابزار جستجوی دیگر عملاً یکسان است. قبل از بحث در مورد آنها ، مفاهیم زیر را در نظر بگیرید:

  1. رابط ابزار جستجو به عنوان صفحه ای با لینک های ارتباطی ، خط ارسال پرس و جو (نوار جستجو) و ابزار فعال سازی پرس و جو ارائه می شود.
  2. فهرست موتور جستجو پایگاه اطلاعاتی است كه حاوی نتیجه آنالیز صفحات وب است كه طبق قوانین خاص تالیف می شود.
  3. query یک کلمه کلیدی یا عباراتی است که کاربر در نوار جستجو وارد می کند. برای شکل گیری نمایش داده های مختلف ، از نمادهای ویژه ("" ، ~) ، نمادهای ریاضی (* ، + ،؟) استفاده می شود.

طرح جستجوی اطلاعات در اینترنت ساده است. کاربر یک عبارت کلیدی را تایپ می کند و جستجو را فعال می کند و بدین ترتیب گزیده ای از اسناد را برای پرس و جو فرموله شده (مشخص شده) دریافت می کند. این لیست از اسناد مطابق معیارهای خاصی درج شده است به گونه ای که در صدر لیست آن دسته از اسنادی قرار دارند که از نزدیک با درخواست کاربر مطابقت دارند. هر یک از ابزارهای جستجو برای رتبه بندی اسناد ، از معیارهای متفاوتی استفاده می کنند ، هم هنگام تجزیه و تحلیل نتایج جستجو و هم در هنگام تشکیل یک فهرست (پر کردن یک بانک اطلاعاتی فهرست صفحات وب).

بنابراین ، اگر همان درخواست را در رشته جستجو برای هر ابزار جستجو مشخص کنید ، می توانید نتایج جستجوی متفاوتی بدست آورید. برای کاربر از اهمیت بسیار بالایی برخوردار است که اسناد مطابق با نتایج جستجو در دو یا سه دهم اسناد اول ظاهر می شوند و چه میزان این اسناد با انتظارات کاربر مطابقت دارد.

بیشتر ابزارهای جستجو دو روش برای جستجو دارند - جستجوی ساده(جستجوی ساده) و جستجوی پیشرفته(جستجوی پیشرفته) با و بدون فرم درخواست ویژه. بیایید با استفاده از نمونه موتور جستجوگر انگلیسی زبان ، هر دو نوع جستجو را در نظر بگیریم.

به عنوان مثال ، AltaVista برای استفاده از سؤالات دلخواه ، "چیزی در مورد مدارک آنلاین در فناوری اطلاعات" ، در حالی که ابزار جستجوی یاهو به شما امکان می دهد اخبار جهانی ، اطلاعات ارزی یا پیش بینی وضعیت هوا را بدست آورید ، مناسب است.

تسلط بر معیارهای پالایش یک درخواست و تکنیک های پیشرفته جستجو به شما امکان می دهد راندمان جستجو را افزایش داده و به سرعت اطلاعات لازم را پیدا کنید. اول از همه ، می توانید با استفاده از عملگرهای منطقی (عملیات) یا ، و ، نزدیک ، نه ، نمادهای ریاضی و ویژه در نمایش داده شد ، بازده جستجو را افزایش دهید. با استفاده از اپراتورها و / یا نمادها ، کاربر کلمات کلیدی را در دنباله لازم برای به دست آوردن مناسب ترین نتیجه جستجو مرتبط می کند. فرم های درخواست در جدول 1 نشان داده شده است.

میز 1

از آنجا که یک پرس و جو ساده ، تعدادی پیوند به اسناد می دهد لیست شامل اسناد حاوی یکی از کلمات وارد شده در هنگام پرس و جو یا یک عبارت ساده است (جدول 1 را ببینید). این عملگر به شما امکان می دهد که کلیه کلمات کلیدی را باید در محتوای سند گنجانده باشید. با این حال ، تعداد اسناد ممکن است هنوز بزرگ باشد و بررسی آنها طول می کشد. بنابراین ، در بعضی موارد استفاده از عملگر متن نزدیک بسیار راحت تر است ، این نشان می دهد که کلمات باید در مجاورت کافی در سند قرار بگیرند. استفاده از نزدیک تعداد اسناد موجود را به میزان قابل توجهی کاهش می دهد. وجود نماد "*" در رشته پرس و جو بدین معنی است که یک کلمه توسط ماسک آن جستجو می شود. به عنوان مثال ، لیستی از اسناد حاوی کلماتی را که با "gov" شروع می شوند دریافت می کنیم اگر در رشته پرس و جو "gov *" را بنویسیم. اینها می توانند کلمات دولت ، فرماندار و غیره باشند.

Rambler موتور جستجو به همان اندازه محبوب ، آماری را در مورد ترافیک پیوند از پایگاه داده خود ، همان عملگرهای منطقی و ، یا ، NOT ، metacharacter * (شبیه به شخصیت * گسترش طیف وسیعی از پرس و جو در AltaVista) ، نمادهای ضریب + و - پشتیبانی می کند تا از اهمیت یا اهمیت آن کاسته شود. کلمات وارد پرس و جو شدند.

بیایید به محبوب ترین فناوری ها برای یافتن اطلاعات در اینترنت نگاهی بیندازیم.

2.2 موتورهای جستجو

موتورهای جستجوی وب سرورهایی با بانک اطلاعاتی عظیم URL هستند که به طور خودکار به تمام این آدرسها به صفحات WWW دسترسی پیدا می کنند ، محتویات این صفحات را بررسی می کنند ، کلمات کلیدی را از صفحات در پایگاه داده خود (صفحه های فهرست) قرار می دهند.

علاوه بر این ، روبات های موتور جستجو پیوندهای موجود در صفحات را دنبال کرده و مجددا آنها را فهرست بندی می کنند. از آنجا که تقریباً هر صفحه WWW پیوندهای زیادی با صفحات دیگر دارد ، بنابراین با چنین کارهایی ، موتور جستجو در نتیجه نهایی می تواند به صورت تئوریک تمام سایت های اینترنت را دور بزند.

این نوع از ابزارهای جستجو مشهورترین و محبوب ترین در بین کاربران اینترنت است. همه نام موتورهای جستجوگر معروف وب (موتورهای جستجو) را شنیده اند - Yandex ، Rambler، Aport.

برای استفاده از این نوع ابزار جستجو ، باید به آن بروید و در نوار جستجو کلمه کلیدی مورد نظر خود را تایپ کنید. در مرحله بعد ، از پیوندهایی که در پایگاه داده موتور جستجو نزدیک به درخواست شما هستند ، نتیجه دریافت می کنید. برای اثربخش تر کردن جستجوی خود ، از قبل به نکات زیر توجه کنید:

  • در مورد موضوع درخواست خود تصمیم بگیرید. در نهایت دقیقاً چه چیزی را می خواهید پیدا کنید؟
  • توجه به زبان ، دستور زبان ، استفاده از انواع مختلف نمادهای غیر نامه ای ، مورفولوژی را داشته باشید همچنین لازم است که به درستی فرم بندی و وارد کردن کلمات کلیدی شوید. هر موتور جستجو شکل خود را برای نوشتن یک پرس و جو دارد - اصل یکسان است ، اما نمادها یا اپراتورهای مورد استفاده ممکن است متفاوت باشند. فرم های مورد نیاز تحقیق نیز بسته به پیچیدگی نرم افزار موتور جستجو و خدماتی که ارائه می دهند متفاوت است. به یک صورت یا روش دیگر ، هر موتور جستجو دارای یک بخش "راهنما" است ، که در آن کلیه قوانین نحو ، و همچنین توصیه ها و راهنمایی های جستجو به راحتی توضیح داده می شوند (تصویر صفحه صفحات موتور جستجو).
  • از قابلیت های موتورهای جستجوگر مختلف استفاده کنید. اگر نمی توانید آن را در Yandex پیدا کنید ، آن را در Google امتحان کنید. از خدمات جستجوی پیشرفته استفاده کنید.
  • برای حذف اسناد حاوی اصطلاحات خاص ، از علامت "-" در مقابل هر کلمه استفاده کنید. به عنوان مثال ، اگر به جز "هملت" به اطلاعات مربوط به آثار شکسپیر نیاز دارید ، یک سؤال را در فرم وارد کنید: "شکسپیر-هملت". برای اینکه برعکس ، در نتایج جستجو لزوماً پیوندهای خاصی وجود داشته باشد ، از نماد "+" استفاده کنید. بنابراین ، برای یافتن پیوندهایی در مورد فروش اتومبیل ، به عبارت "فروش + ماشین" نیاز دارید. برای افزایش کارایی و دقت جستجوی خود ، از ترکیب این نمادها استفاده کنید.
  • هر پیوند در لیست نتایج جستجو شامل چندین خط از سند یافت شده است که در میان آنها کلمات کلیدی شما وجود دارد. قبل از کلیک بر روی لینک ، مکاتبات مربوط به قطعه را با موضوع درخواست ارزیابی کنید. بعد از کلیک روی پیوند یک سایت خاص ، به صفحه اصلی دقت کنید. به عنوان یک قاعده ، صفحه اول برای درک اینکه آیا شما به آدرس رسیده اید یا نه کافی است. اگر بله ، سپس جستجوهای بیشتری را برای اطلاعات لازم در سایت انتخاب شده (در بخش های سایت) انجام دهید ، در غیر اینصورت به نتایج جستجو برگردید و پیوند بعدی را امتحان کنید.
  • به یاد داشته باشید که موتورهای جستجو به تنهایی اطلاعاتی را تولید نمی کنند (به جز توضیح در مورد خود). موتور جستجو فقط واسطه ای بین صاحب اطلاعات (سایت) و شما است. دیتابیس ها دائماً به روز می شوند ، آدرس های جدیدی به آنها اضافه می شود ، اما عقب ماندگی اطلاعاتی که در جهان موجود است هنوز باقی مانده است. به این دلیل که موتورهای جستجو با سرعت نور کار نمی کنند.

معروف ترین موتورهای جستجوگر وب شامل Google ، Yahoo ، Alta Vista ، Excite ، Hot Bot ، Lycos است. در میان بلندگوهای روسی می توان Yandex ، Rambler ، Aport را از هم تفکیک کرد.

موتورهای جستجو بزرگترین و با ارزش ترین هستند اما به دور از تنها منابع اطلاعاتی در وب قرار دارند ، زیرا علاوه بر آنها روش های دیگری برای جستجوی اینترنت نیز وجود دارد.

دایرکتوری 2.3

کاتالوگ منابع اینترنتی یک کاتالوگ سلسله مراتبی دائماً به روز و پر شده است که شامل بسیاری از دسته ها و سرورهای وب شخصی با شرح مختصر در مورد مطالب آنها می باشد.چگونگی جستجوی کاتالوگ به معنی "حرکت از پله ها" است ، یعنی انتقال از دسته های کلی تر به دسته های خاص تر. یکی از مزیت های کاتالوگ های موضوعی این است که توضیحات مربوط به لینک ها توسط سازندگان کاتالوگ داده می شود و محتوای آن را کاملاً بازتاب می دهد ، یعنی این امکان را به شما می دهد تا با دقت بیشتری تعیین کنید که چگونه محتوای سرور با هدف جستجوی شما مطابقت دارد.

نمونه ای از کاتالوگ موضوعی به زبان روسی منبع http://www.ulitka.ru/ است.

در صفحه اصلی این سایت یک مجری موضوعی وجود دارد ،

با کمک آن کاربر با پیوندهایی به محصولات مورد علاقه وی وارد عنوان می شود.

علاوه بر این ، برخی از فهرستهای موضوعی امکان جستجوی کلمات کلیدی را می دهند. کاربر کلمه کلیدی مورد نیاز را در نوار جستجو وارد می کند

و لیستی از پیوندها را با توضیحات سایت دریافت می کند که به بهترین وجه با درخواست وی مطابقت دارند. لازم به ذکر است که این جستجو در محتویات سرورهای WWW صورت نمی گیرد ، بلکه در توضیحات مختصر آنها ذخیره شده در فروشگاه است.

در مثال ما ، کاتالوگ همچنین توانایی مرتب سازی سایتها براساس تعداد بازدیدها ، به ترتیب حروف الفبا ، براساس تاریخ ورود را دارد.

نمونه های دیگر از فهرستهای روسی زبان:
[email protected]
لیست وب
Vsego.ru
در میان کاتالوگ های انگلیسی زبان عبارتند از:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 مجموعه پیوندها

مجموعه لینک ها پیوندهایی هستند که براساس موضوع طبقه بندی شده اند. آنها از نظر محتوا کاملاً متفاوت از یکدیگر هستند ، بنابراین برای یافتن انتخابی که کاملاً با علایق شما مطابقت داشته باشد ، باید خودتان از طریق آنها قدم بزنید تا نظر خود را شکل دهید.

به عنوان نمونه ، ما به انتخاب پیوندها "گنجینه اینترنت" JSC "Relcom" می پردازیم

با کلیک روی هر یک از عناوینی که به او علاقه دارند ، کاربر را کلیک کنید

  • محتوا

    برای رانندگان

    • نجوم و طالع بینی
    • خانه ی تو
    • حیوانات خانگی شما
    • کودکان گل زندگی هستند
    • اوقات فراغت
    • شهرها در اینترنت
    • بهداشت و دارو
    • آژانس ها و خدمات خبری
    • موزه تاریخ محلی و غیره ،
    • الکترونیک خودرو.
    • موزه باستان خودرو.
    • دانشکده حمایت قانونی از دارندگان خودرو.
    • Sportdrive

    مزیت این نوع ابزارهای جستجو هدفمند بودن آنها است ، معمولاً این انتخاب شامل منابع نادر اینترنتی است که توسط یک مدیر وب سایت خاص یا صاحب یک صفحه اینترنتی انتخاب شده است.

    بانک اطلاعات 2.5 آدرس

    بانکهای اطلاعاتی آدرسها سرورهای جستجوی ویژه ای هستند که معمولاً از طبقه بندی ها بر اساس نوع فعالیت ، محصولات و خدمات ارائه شده توسط جغرافیایی استفاده می کنند. بعضی اوقات آنها با جستجوی الفبایی تکمیل می شوند. این پایگاه داده اطلاعات مربوط به سایتهایی را که اطلاعات مربوط به آدرس ایمیل ، سازمان و آدرس پستی را با هزینه دریافت می کنند ، ذخیره می کند.

    می توان بزرگترین بانک اطلاعاتی آدرس انگلیسی را نام برد: http://www.lookup.com/ -

    با ورود به این زیرشاخه ها ، کاربر پیوندهایی را به سایت هایی که اطلاعات مورد علاقه وی را ارائه می دهند ، کشف می کند.

    ما از بانکهای اطلاعاتی گسترده و رسمی آدرس در فدراسیون روسیه نمی دانیم.

    2.6 جستجو در بایگانی های Gopher

    Gopher یک سیستم سرور بهم پیوسته (فضای Gopher) است که از طریق اینترنت توزیع می شود.

    فضای Gopher شامل ثروتمندترین کتابخانه ادبی است ، اما این مواد برای مشاهده از راه دور در دسترس نیستند: کاربر فقط می تواند یک جدول از مطالب مرتب شده سلسله مراتبی را مشاهده کند و پرونده ای را با نام خود انتخاب کند. با کمک یک برنامه ویژه (ورونیکا) ، چنین جستجو می تواند به صورت خودکار و با استفاده از نمایش داده شدگان بر اساس کلمات کلیدی انجام شود.

    تا سال 1995 ، Gopher پویاترین فن آوری در اینترنت بود ، با افزایش تعداد سرورهای مرتبط با رشد بیش از همه انواع دیگر سرورهای اینترنتی. در شبکه EUnet / Relcom ، سرورهای Gopher توسعه فعال دریافت نکرده اند و امروز تقریبا هیچ کس آنها را به یاد نمی آورد.

    2.7 سیستم جستجوی FTP

    موتور جستجوی فایل FTP نوع خاصی از موتورهای جستجوی اینترنتی است که به شما امکان می دهد فایلهای موجود در سرورهای FTP "ناشناس" را پیدا کنید. FTP برای انتقال پرونده ها از طریق شبکه طراحی شده است و به این معنا ، از لحاظ عملکردی نوعی آنالوگ Gopher است.

    معیار اصلی جستجو نام پرونده است که به روش های مختلف (مطابقت دقیق ، لایه برداری ، بیان منظم و غیره) مشخص شده است. این نوع جستجو ، البته ، از نظر قابلیت ها نمی تواند با موتورهای جستجو رقابت کند ، زیرا محتویات پرونده ها در جستجو در نظر گرفته نمی شود ، و به پرونده ها ، همانطور که می دانید ، می توان اسامی دلخواه را به آنها داد. با این وجود ، اگر می خواهید برخی از برنامه های مشهور یا توضیحات استاندارد را پیدا کنید ، با احتمال زیاد پرونده ای که حاوی آن است نام مناسبی خواهد داشت و می توانید با استفاده از یکی از سرورهای FTP Search پیدا کنید:

    FileSearch با جستجو در پرونده ها روی سرورهای FTP با نام خود پرونده ها و فهرست ها قرار می گیرد. اگر به دنبال برنامه یا چیز دیگری هستید ، پس از آن در سرورهای WWW توضیحات آنها را پیدا خواهید کرد و از سرورهای FTP می توانید آنها را برای خودتان بارگیری کنید.

    2.8 موتور جستجو کنفرانس اخبار Usenet

    USENET NEWS یک سیستم ارتباط از راه دور برای جامعه اینترنت است. در غرب ، این سرویس معمولاً به عنوان خبر خوانده می شود. یک آنالوگ نزدیک از ارتباطات از راه دور به اصطلاح "پژواک" در شبکه FIDO است.

    از منظر مشترکین ارتباط از راه دور ، USENET بولتن است که دارای بخشهایی است که در آن می توانید مقالات مربوط به هر چیزی را از سیاست گرفته تا باغداری پیدا کنید. این بولتن از طریق رایانه ای مانند ایمیل قابل دسترسی است. بدون ترک رایانه ، می توانید مقالات را در یک کنفرانس دیگر بخوانید یا پست کنید ، مشاوره مفیدی پیدا کنید یا وارد بحث شوید. به طور طبیعی ، مقاله ها روی رایانه ها جای خود را می گیرند ، بنابراین آنها برای همیشه ذخیره نمی شوند بلکه بطور دوره ای از بین می روند و فضای جدیدی را ایجاد می کنند. در سراسر جهان ، بهترین سرویس برای یافتن اطلاعات در مورد گروههای خبری Usenet ، سرور Google Groups (Google Inc.) است.

    Google Groups یک سرویس گروه جامع آنلاین و بحث و گفتگو است که بزرگترین بایگانی پست های Usenet را در اینترنت ارائه می دهد (بیش از یک میلیارد پست) برای اطلاعات بیشتر به http://groups.google.com/intl/ru مراجعه کنید /googlegroups/tour/index.html

    در میان بلندگوهای روسی ، سرور USENET و ارتباطات از راه دور Relcom متمایز است. درست مانند سایر خدمات جستجو ، کاربر در یک رشته پرس و جو تایپ می کند ، و سرور لیستی از کنفرانس های حاوی کلمات کلیدی را ایجاد می کند. در مرحله بعد ، باید در برنامه های خبری در کنفرانس های منتخب مشترک شوید. سرور روسی مشابه FidoNet Online نیز وجود دارد: کنفرانس های Fido در WWW.

    2.9 موتورهای جستجوی متا

    برای جستجوی سریع در بانکهای اطلاعاتی چندین موتور جستجو به طور همزمان ، بهتر است به موتورهای جستجوی متا مراجعه کنید.

    موتورهای جستجو متا موتورهای جستجوگر هستند که پرس و جو شما را به تعداد زیادی موتور جستجوگر مختلف ارسال می کنند ، سپس نتایج به دست آمده را پردازش می کنند ، آدرس های منبع کپی را حذف کرده و طیف گسترده تری از آنچه در اینترنت ارائه می شود را نشان می دهد.

    محبوب ترین موتور جستجوی متا جستجو در جهان Search.com است.

    موتور جستجوی ترکیبی Search.com از CNET، Inc. تقریباً دوازده موتور جستجو دارد ، پیوندهایی که با کل اینترنت پر شده است.

    با کمک این نوع ابزارهای جستجو ، کاربر می تواند در انواع موتورهای جستجو به جستجوی اطلاعات بپردازد ، با این وجود می توان طرف منفی این سیستم ها را بی ثباتی آنها نامید.

    2.10 موتورهای جستجوگرها

    سیستم های جستجوی مردم سرورهای خاصی هستند که به شما امکان می دهند در اینترنت افراد را جستجو کنید ، کاربر می تواند نام کامل را مشخص کند. آدرس و آدرس ایمیل خود را دریافت کنید. البته لازم به ذکر است که موتورهای جستجوگر مردم عمدتا اطلاعات مربوط به آدرس های ایمیل را از منابع باز مانند گروه های خبری Usenet دریافت می کنند. در بین مشهورترین سیستم های جستجوی افراد عبارتند از:

    آدرس های ایمیل را جستجو کنید

    در قسمت های ویژه جستجوی اطلاعات تماس (نام خانوادگی ، نام خانوادگی ، شماره تلفن) ، می توانید اطلاعات مورد علاقه خود را پیدا کنید.

    سیستم های جستجوی مردم واقعاً سرورهای بزرگی هستند ، بانک اطلاعاتی آنها حاوی حدود 6000،000 آدرس است.

    3. نتیجه گیری

    ما فن آوری های اصلی برای یافتن اطلاعات در اینترنت را مورد بررسی قرار دادیم و به طور کلی ابزارهای جستجو را که در حال حاضر در اینترنت وجود دارد ، و همچنین ساختار جستجوی جستجو برای محبوب ترین موتورهای جستجو روسی زبان و انگلیسی صحبت کردیم و با جمع بندی موارد فوق می خواهیم توجه داشته باشیم که یک طرح بهینه واحد. در اینترنت هیچ جستجوی اطلاعاتی وجود ندارد. بسته به مشخصات اطلاعات مورد نیاز ، می توانید از ابزارها و خدمات مناسب جستجو استفاده کنید. و کیفیت نتایج جستجو به میزان انتخاب خدمات جستجو بستگی دارد.

  • زنگ

    کسانی هستند که این خبر را قبل از شما می خوانند.
    برای دریافت آخرین مقالات مشترک شوید.
    پست الکترونیک
    نام
    نام خانوادگی
    چگونه می خواهید The Bell را بخوانید
    بدون اسپم