این یک موتور جستجو است که در آن است. موتورهای جستجوگر اینترنتی: Yandex ، Google ، Rambler ، Yahoo. ترکیب ، کارکردها ، اصل عملکرد. نحوه عملکرد این سرویس ها

سیستم جستجو - یک مجموعه نرم افزاری و سخت افزاری با یک رابط وب ، که امکان جستجوی اطلاعات در اینترنت را ممکن می کند.

همه موتورهای جستجو با این واقعیت که در سرورهای قدرتمند ویژه اختصاصی مستقر هستند و به کانالهای ارتباطی مؤثر مرتبط هستند ، متحد هستند. موتورهای جستجو سیستم های بازیابی اطلاعات (ISS) نیز نامیده می شود. تعداد بازدیدکنندگان همزمان به محبوب ترین سیستم ها به هزاران نفر می رسد. معروف ترین آنها روزانه به میلیون ها مشتری خدمت می کنند. در مواردی که یک موتور جستجوگر مستقر در فهرست باشد ، به آن دایرکتوری می گویند. این مبتنی بر کار تعدیل کنندگان است. در قلب ISS با جستجوی متن کامل ، مجموعه خودکار اطلاعات است. توسط برنامه های ویژه ای انجام می شود. این برنامه ها بطور دوره ای محتوای کلیه منابع اینترنتی را بررسی می کنند. برای این کار ، آنها حرکت می کنند ، یا به قول خودشان ، در جستجوی منابع مختلف هستند. بر این اساس ، به چنین برنامه هایی ربات گفته می شود. نامهای دیگری نیز وجود دارد: از آنجا که WWW مخفف عبارت World Wide Web است ، طبیعی است که چنین برنامه ای را عنکبوتی به انگلیسی بنامید. - عنکبوت. اخیراً از نامهای دیگر استفاده شده است: فهرستهای اتوماتیک یا فهرستها. همه این برنامه ها اطلاعات را از URL های مختلف بررسی و "بارگیری" می کنند. برنامه ها از نوع مشخص شده بعد از مدت معینی از هر منبع بازدید کنید. هیچ موتور جستجوگر قادر به نمایه کردن کل اینترنت نیست. بنابراین ، بانکهای اطلاعاتی که در آن آدرس منابع فهرست بندی شده جمع آوری می شود برای موتورهای جستجو متفاوت است. با این وجود ، بسیاری از آنها ، در صورت امکان ، تلاش می کنند تا در کار خود کل فضای شبکه جهانی را پوشش دهند.

برای جستجوی اطلاعات با استفاده از موتور جستجو ، کاربر یک جستجوی جستجو را تدوین می کند. براساس درخواست کاربر ، موتور جستجو صفحه نتایج جستجو را تولید می کند. چنین نتایج جستجو می تواند انواع مختلفی از پرونده ها را ترکیب کند ، به عنوان مثال: صفحات وب ، تصاویر ، فایل های ویدیویی. برخی موتورهای جستجو همچنین داده ها را از پایگاه داده ها و فهرستهای منابع در اینترنت می گیرند.

چهار نوع موتور جستجو به روش جستجو و خدمات وجود دارد:

1.Systems با استفاده از روبات های جستجو.

سیستم های کنترل شده انسانی

سیستم های 3.hybrid

سیستم های 4.meta

معماری موتور جستجو شامل: یک ربات جستجو است که سایتهای موجود در اینترنت را خزیده ، یک فهرستگر ارائه دهنده جستجوی سریع و موتور جستجو - یک رابط گرافیکی برای کاربر.

هدف از موتور جستجو یافتن اسنادی است که شامل کلمات کلیدی یا کلمات به هر روشی با کلمات کلیدی است. موتور جستجو بهتر است ، هر چه اسناد بیشتری به جستجوی کاربر مربوط شود ، باز می گردد.

نمونه هایی از موتورهای جستجو

گوگل- یکی از کامل ترین و محبوب ترین IPS خارجی. یک ویژگی متمایز از Google ISS ، فناوری تعیین میزان ارتباط یک سند با تجزیه و تحلیل پیوندها از منابع دیگر به این منبع است. هرچه پیوندهای بیشتری به صفحه ای در صفحه های دیگر وجود داشته باشد ، رتبه بندی آن در IPS Google بیشتر است. Google برای محاسبه اختیارات PageRank از یک الگوریتم استفاده می کند. PageRank یکی از مشارکت کنندگان در رتبه بندی سایت ها در نتایج جستجو است. پیج رنک تنها روش مهم ، بلکه بسیار مهم ، تعیین موقعیت سایت در نتایج جستجوی Google نیست. گوگل از PageRank صفحات مورد نظر خود برای تعیین ترتیب نمایش این صفحات در نتایج جستجو استفاده می کند .در سال 2010 ، این شرکت جستجوی صوتی را در روسیه آغاز کرد. برای جستجو ، باید دکمه روی تلفن کنار نوار جستجو را فشار داده و درخواست خود را بگویید ، تلفن صدای شما را به سرور ارسال می کند ، و مرورگر با درخواست شناخته شده شما خطی را نشان می دهد و نتایج جستجو را برای آن نشان می دهد.

اندکس در حال حاضر محبوب ترین موتور جستجوی داخلی است. فعالیت خود را از سال 1997 آغاز کرد. این فهرست از منابع اینترنتی خود را نگهداری می کند. همچنین بهترین موتور جستجو برای شناسایی تصاویر است. نسخه انگلیسی زبان با فهرست راهنمای منابع اینترنتی تهیه شده است. دارای سیستم گسترده ای برای ایجاد یک درخواست است. به طور خاص ، مجاز است یک نسخه جستجو را با یک زبان طبیعی وارد کنید - در این حالت ، کلیه برنامه های افزودنی لازم به صورت خودکار ساخته می شوند.

علاوه بر صفحات وب HTML ، Yandex اسناد را به صورت PDF (Adobe Acrobat) ، Rich Text Format (RTF) ، Word binary (.doc) ، Excel (.xls) ، پاورپوینت (.ppt) ، RSS (وبلاگ ها و فهرست بندی ها) فهرست بندی می کند. انجمن ها)

شرکت موتور جستجو Mail.ruشروع به کار در سال 2007. حجم پرونده ایندکس در بهار سال 2009 بالغ بر 1.5 میلیارد صفحه است که در سرورهای روسی زبان قرار دارد. علاوه بر جستجوی متون ، سیستم به جستجوی تصاویر و کلیپ های ویدئویی ارسال شده در سرورهای ویژه روسی "خود پر شده" می پردازد: Photo @ Mail.Ru ، Flamber.Ru ، 35Photo.ru ، PhotoForum.ru ، Video @ Mail.Ru ، RuTube ، Loadup ، Rambler Vision و مانند آن Gogo.ru به شما امکان می دهد جستجوی خود را به سایت های تجاری ، سایت های اطلاعاتی و همچنین انجمن ها و وبلاگ ها محدود کنید. فرم "جستجوی پیشرفته" همچنین به شما امکان می دهد جستجوها را به انواع خاصی از پرونده ها (PDF ، DOC ، XLS ، PPT) ، مکان کلمات جستجو شده در یک سند یا یک دامنه خاص محدود کنید. نوامبر 2013 در بازی Google نسخه جدیدی از برنامه جستجو از Mail.Ru ظاهر شده است که به شما امکان می دهد از صفحه اصلی به هر شبکه اجتماعی بروید و شامل دسترسی سریع به جستجوی تصاویر ، فیلم ها و اخبار است. برنامه Android به یک مرورگر مینی تبدیل شده است که برای یافتن کارآمد اطلاعات مورد نیاز شما طراحی شده است. این ابزار همچنین آموخته است نمایش داده های جستجو را نه با متن بلکه از طریق صدا تشخیص دهد. توسعه دهندگان همچنین توجه دارند که ویجت خاصی ایجاد کرده اند که می تواند بر روی سیستم اندرویدی گوگل روی صفحه اصلی تلفن هوشمند یا رایانه لوحی قرار گیرد. پیامد این است که این باعث می شود بیشتر زمان صرف جستجو شود.

AltaVista- یکی از قدیمی ترین موتورهای جستجو از نظر حجم اسناد یکی از اولین مکان ها را کسب می کند - بیش از 350 میلیون. AltaVista جستجوهای ساده و پیشرفته را امکان پذیر می کند. "راهنما" به کاربران حتی آموزش دیده اجازه می دهد تا به صورت صحیح نمایش داده های ساده و پیچیده را ایجاد کنند.

رامبلر- یکی از اولین IPS روسیه ، که در سال 1996 افتتاح شد. در اواخر سال 2002 ، نوسازی بنیادی صورت گرفت ، پس از آن رامبلر دوباره وارد گروه رهبران در جستجوی شبکه شد. در حال حاضر ، حجم این شاخص حدود 150 میلیون سند است. برای تدوین پرس و جوهای پیچیده ، توصیه می شود از حالت "جستجوی دقیق" استفاده کنید ، که فرصت های کافی برای تهیه نسخه جستجو با استفاده از موارد منو را فراهم می کند.

آپارتمان... امروز حجم دیتابیس آن بیش از 20 میلیون سند است. این سیستم دارای طیف گسترده ای از قابلیت های جستجو است. APORT عملکرد یک مترجم داخلی را دارد ، این امکان را برای کاربر فراهم می کند تا درخواست ها را هم به زبان روسی و هم به صورت زیر تنظیم کند انگلیسی... علاوه بر این ، APORT برای جستجوی تصاویر و فایل های صوتی حالت های خاصی دارد.

آخرین نسل موتورهای جستجو تمامی کلمات را در یک صفحه وب یا مقاله ای از یک کنفرانس فهرست بندی می کنند ، در حالی که قبلاً حوزه نمایه سازی معمولاً فقط به عنوان ، عنوان ها ، چند سطر اول و آدرس سند محدود می شد. این امر به طور قابل توجهی توانایی شناسایی مواد در مورد موضوع باریک را محدود می کند ، زیرا نتایج جستجو همیشه داده های واقعی را منعکس نمی کند. با از بین بردن این کمبود ، موتورهای جستجوگر مدرن بسیار معتبرتر از نسل قبلی خود شده اند.

مهمترین ویژگی بعدی بهبود مکانیسم جستجوی داخلی است که با افزایش تعداد اپراتورها و سایر عناصر پرس و جوهای آهنگسازی بیان شده است. چند سال پیش ، فقط در بهترین حالت ، از دو عملگر کلاسیک بولی استفاده شده: AND (و) ، OR (یا) و NOT (نه). اکنون در OpenText نزدیک (نزدیک ، نزدیک) در Alta Vista و FOLLOWED BY (زیر) وجود دارد - اپراتورهای مسافت بسیار مفیدی که به شما امکان می دهند تا درخواست خود را تا حد ممکن خاص کنید. بسیاری از سیستم ها به شما امکان می دهند تا انتهای اصطلاحات را کوتاه کنید ، جستجو را با تاریخ ایجاد سند محدود کنید ، جستجوی کلمات کلیدی فقط در عناصر تعیین شده صفحات وب (عنوان ، عنوان ها ، آدرس ایمیل و غیره) ، و همچنین جستجوی عبارت دقیق. آخرین تحولات همچنین امکان شناسایی انواع خاصی از پرونده ها (به عنوان مثال ، گرافیک یا صدا) را فراهم می کند و به حروف کوچک و حروف بزرگ حساس هستند. توانایی جستجوی داده ها به هر زبانی رایج می شود. همه اینها باعث می شود که یک نسخه جستجو با دقت بالایی تهیه شود که البته این موضوع باعث افزایش ارتباط نتایج به دست آمده می شود.

در حال حاضر محبوب ترین موتورهای جستجو گوگل و یاندکس هستند ، بیایید آنها را با هم مقایسه کنیم:

تعداد صفحات فهرست بندی شده گوگل 8 میلیارد دلار دارد ، در حالی که Yandex تنها 2 میلیارد دلار دارد. یعنی چهار برابر کمتر. برنده شدن در گوگل.

سرعت نمایه سازی صفحه. Google صفحات جدید را طی 24 ساعت فهرست بندی می کند ، در حالی که Yandex ممکن است چند روز طول بکشد. دوباره گوگل برنده شد.

اهمیت صدور. Relevance به اهمیت نتایج نمایش داده شده در صفحه موتور جستجو با پرس و جو شما اشاره دارد. باید سریع بگویم که تعیین برنده در اینجا دشوار است. گوگل در بخش خارجی اینترنت نتایج خوبی را نشان داد ، اما در Runet ، Yandex همیشه کمی جلوتر بوده است.

خدمات اینترنتی اضافی. در اینجا مزیت کاملاً با Yandex است. این سرویس ده ها سرویس مختلف دارد که به راحتی در دسته بندی ها قرار می گیرند ، در حالی که گوگل تعداد کمتری از آنها دارد ، بعلاوه ادغام با اجتماعی شبکه Google+ که بسیاری از مردم دوست ندارند.

سلام بر خوانندگان عزیز! اكاترینا كالموا با شما. مقاله امروز به چنین مفهومی به عنوان موتور جستجو اختصاص می یابد ، آنچه در آن است ، برای چه چیزی است. ما همچنین نگاهی دقیق تر به انواع موتورهای جستجو در اینترنت خواهیم انداخت.

اگر سؤالی دارید: "چرا باید درباره این موتورهای جستجو بدانم؟" من به این روش پاسخ خواهم داد. وقتی سوپ خوشمزه ای را در رستوران می خورید ، آیا می خواهید بدانید از چه ماده ای ساخته شده است تا بتوانید آن را در خانه تکرار کنید؟ از این گذشته ، اگر از نتیجه نهایی ، یعنی طعم سوپ راضی هستید ، مطمئناً علاقه مند خواهید بود بدانید که منجر به چنین نتیجه ای شده است؟

همچنین می توانید در مورد کار با موتور جستجو (SE) بگویید. اگر وبلاگ خود را در آینده ایجاد کنید ، پس با دانستن کار PS ، دیگر نیازی به کمک متخصصان نخواهید داشت. شما قادر خواهید بود به طور مستقل پروژه خود را از این طریق مدیریت کنید تا موتور جستجو بتواند آن را ببیند و آن را به سایر کاربران نشان دهد. از این گذشته ، ترافیک به منابع شما و بر این اساس ، درآمد به این بستگی دارد.

بیایید شروع کنیم.

موتور جستجو چیست؟

موتور جستجو منبع ویژه ای در اینترنت است که مطابق با درخواست خود اطلاعاتی را در اختیار کاربر قرار می دهد. یعنی این منبع کلیه داده های موجود در شبکه جهانی ، کلیه پروژه های وب را جمع آوری می کند و هنگامی که درخواست مشخصی از کاربر دریافت می شود ، با ارسال آن ، برای مثال ، به یک وبلاگ یا وب سایت موضوعی ، اطلاعات لازم را ارائه می دهد.

بنابراین ، پس از ایجاد پروژه ، وظیفه شما وارد SERP می شود ، یعنی "لیست" یا پایه موتور جستجو. از آنجا که ارتقاء وب سایت در اینترنت به سادگی و بدون استفاده از موتور جستجو امکان پذیر نیست ، باید از کیفیت منابع خود ، بهینه سازی داخلی و خارجی آن مراقبت کنید. در مورد چگونگی انجام این کار در مقالات بعدی صحبت خواهیم کرد. بنابراین آن را از دست ندهید.

در ضمن ، اگر تصمیم دارید وبلاگ خود را ایجاد کنید ، توصیه می کنم این مقاله ها را بخوانید:

از آنجا که منابع جدید وب تقریباً هر روز ظاهر می شوند ، باید موتور موتور جستجو به طور مرتب بر این اساس به روز شود. هر سایت تازه ایجاد شده باید توسط یک ربات نمایه شود. صحبت كردن با کلمات سادهدستیاران PS - روبات ها باید با منابع جدید آشنا شده و این داده ها را به موتور جستجو منتقل کنند.

خوب ، در اینجا احتمالاً حدس زده اید که وقتی یک روبات به وبلاگ شما مراجعه می کند ، باید همه چیز را دوست داشته باشد. سرنوشت آینده شما به این میهمان بستگی دارد.

من به شما خواهم گفت چگونه می توانید ربات حاصل از پروژه خود را در یکی از مقاله های بعدی کاملاً خوشحال کنید. از دست ندهید ، اطلاعات جالب و بسیار جالبی وجود خواهد داشت که من با شما به اشتراک می گذارم.

موتورهای جستجو کار می کنند

کلیه کارهای مربوط به موتور جستجو با وارد کردن درخواست مورد نیاز در نوار جستجو شروع می شود. کاربران می توانند چه چیزی را جستجو کنند؟ هر چیزی ، از دستور تهیه کیک با کلم و پایان دادن به این سوال ابدی "چگونه می توان بدون انجام هر کاری پول بیشتری بدست آورد".

برای اینکه منبع شما به عنوان پاسخ یک سؤال مطرح شود ، باید از رقبای خود جلوتر باشید. برای این کار باید به ارتقاء پروژه خود توجه ویژه ای داشته باشید که شامل فعالیت هایی از قبیل نوشتن مطالب بهینه شده با کیفیت بالا ، یعنی پاسخ دادن به درخواست های مقاله ، بهبود ضریب رفتاری است ، یعنی اینکه خواننده شما علاقه مند به حضور در منبع باشد ، این باعث بهبود قابلیت استفاده می شود ، یعنی راحتی بازدید کننده و بسیاری از عوامل دیگر. همه ما یاد خواهیم گرفت که این کار را با شما انجام دهیم.

اجزای موتور جستجو

و چه چیزی به موتورهای جستجو ، برای مثال گوگل کمک می کند تا منابع شما را فهرست بندی کنند؟

نمایندگان کارمندانی هستند که بخش عمده ای از کار را انجام می دهند - آنها سایت ها را فهرست بندی و تجزیه و تحلیل می کنند.
عنکبوت (عنکبوت) - برنامه ای که می تواند صفحات یک منبع وب را بارگیری کند و اطلاعات کلی راجع به آن جمع آوری کند.
خزنده ها (خزنده) - برنامه ای که تمام پیوندها را در صفحات پیدا می کند و به دنبال آن اطلاعات جدیدی را که برای موتورهای جستجو آشنا نیستند جستجو می کند.
ایندکسر - متن ، عناوین ، سبک و غیره را تجزیه می کند.
روبات ها - صفحات فهرست بندی شده از محتوای شما ، و همچنین پیوندهای مختلفی را کشف می کنند.

برای اینکه ایندکس سازی به روشی که می خواهید اتفاق بیفتد ، یک سند ویژه "robots.txt" ایجاد می کنید. این سیستم به شما اجازه می دهد فقط صفحات مورد نیاز خود را بررسی کرده و آنچه را که نمی بینید حذف کند.

انواع موتورهای جستجو

گزینه های مختلفی برای سیستم های بازیابی اطلاعات وجود دارد:

راهنماها مقایسه ساده جستجو ، قفسه کتاب در یک کتابخانه است. همه چیز در زیر شاخه ها و دسته بندی های یک موضوع خاص ذخیره می شود. اگر خودتان را در چنین موتور جستجو یافتید ، پس باور کنید ، اطلاعاتی که در آنجا پیدا می کنید برای درک شما بیش از سودمند و قابل درک خواهد بود. حدس بزن چه سایتی مشترک است در سوال؟ البته ، در مورد ویکی پدیا ، که به خودی خود فهرست کاملی از اطلاعات مفید را جمع آوری کرده است.
نشانگرهای جستجو جستجوی داده ها با استفاده از عبارات کلیدی انجام می شود. این در هر دو زمان مناسب و ناخوشایند است. من فکر می کنم آن دسته از افرادی که به دنبال من هستند ، مثلاً "دختر کلاس نشان می دهد" ، من را خواهند فهمید ، تا دریابم که چگونه یک دختر انگشت شست خود را نشان می دهد ، و چیزی که خیلی مناسب نیست در جست و جو است. 🙂 این نوع جستجو اکثر موتورهای جستجو را مشخص می کند.
سیستم های رتبه بندی محبوبیت خود را بر اساس تعداد بازدید مشاهده کنید. البته این بهترین ملاک نیست ، زیرا سودمندی و کیفیت منبع به خودی خود همیشه مورد توجه قرار نمی گیرد. نمونه ای از چنین سیستم منبع اینترنت alexa.com است.

سرورهای جستجو نیز به یکدیگر تقسیم می شوند عمومی و تخصصی... موتورهای جستجوگر عمومی داده های اطلاعاتی را بدون هیچ گونه مرتب سازی در بین منابع وب شناخته شده برای آنها مرتب می کنند. این موارد شامل Yandex ، Rambler ، Google است. تخصصی - مرتب سازی بر اساس زبان مورد استفاده.

همچنین موتورهای جستجو را می توان به تقسیم کرد توزیع منطقه ای و جهانی.

امروزه همه موتورهای جستجو دائماً الگوریتم های خود را برای انتخاب منابع مناسب و با کیفیت بالا بهبود می بخشند.

کمی تاریخ

در Runet PS در سال 1996 ظاهر شد - اینها Aport و Rambler هستند. یک سال بعد ، در سال 1997 ، Yandex شکل گرفت و یک سال بعد در سال 1998 ، یک رقیب دیگر ظاهر شد - Google. در حال حاضر محبوب ترین Yandex و Google هستند.

مشهورترین موتورهای جستجو اکنون چیست؟

در اینجا آمار ارائه شده است:

همانطور که می بینید ، Yandex اکنون به همراه Google و Mail محبوب ترین در روسیه است.

بنابراین ، می توانید جستجوهای برتر را که باید هنگام ایجاد و ارتقاء پروژه خود به آنها توجه کنید ، مشاهده کنید.

موتور جستجوی Yandex (Yandex)

اصل کار به شرح زیر است: عبارت مورد نیاز را در جعبه جستجو وارد کنید ، روی "یافتن" کلیک کنید و نتایج را مشاهده کنید. Yandex 13 میلیون پاسخ به درخواست شما جمع آوری کرده است. همچنین می توانید در تصاویر ، فیلم ها ، بازار جستجو کنید (به ستون سمت چپ نگاه کنید).

علاوه بر این ، می توانید منطقه را برای جستجوی خود پیکربندی کنید. برای انجام این کار ، در نوار جستجو ، بر روی آیکون کنار صلیب کلیک کنید و در پنجره فیلتر منطقه مورد نظر خود را انتخاب کنید.

موتور جستجوی گوگل

Google به طور قیاس با Yandex کار می کند. می توانید اطلاعات را در بخش های مختلف جستجو کنید: تصاویر ، فیلم ها ، اخبار ، نقشه ها و غیره.

اگر بر روی "ابزارهای جستجو" کلیک کنید ، یک صفحه با تنظیمات باز خواهد شد ، که می توانید یک منطقه ، زبان را انتخاب کنید و جستجوی اطلاعات چه مدت طول می کشد.

اکنون می دانید موتورهای جستجو در اینترنت چه هستند ، محبوب ترین آنها را نیز مشاهده کرده اید و اکنون ، در صورت مسلح کردن اطلاعات ، می توانید ارتباطات و تعامل خود را با موتورهای جستجو برقرار کنید.

برای امروز کافی است. مقاله را چگونه دوست دارید؟

خداحافظ همه.

من به شما توصیه می کنم وبلاگ خود را به روز کنید تا آخرین اخبار را از دست ندهید.

اکاترینا کالمووا

آنها یکی از اصلی ترین و مهمترین خدمات اینترنتی هستند.

میلیاردها کاربر اینترنت با کمک موتورهای جستجو اطلاعات مورد نیاز خود را پیدا می کنند.

موتور جستجو چیست؟

موتور جستجو یک مجموعه نرم افزاری و سخت افزاری است که از الگوریتم های ویژه ای برای پردازش مقدار زیادی از اطلاعات در مورد انواع مختلف سایت ، درباره محتوای آنها به هر صفحه استفاده می کند.

یک موتور جستجو از نظر بازدید کنندگان عادی چنین سایتی هوشمند است که اطلاعات زیادی را در خود جای داده و به هر گونه درخواست کاربر پاسخ می دهد.

در کشورهای مختلف ، کاربران اینترنت از موتورهای جستجوی متفاوتی استفاده می کنند. در بخش انگلیسی زبان اینترنت ، محبوب ترین موتور جستجوگر گوگل است.

موتورهای جستجو در Runet

در روسیه بیش از نیمی از کاربران موتور جستجوی Yandex را ترجیح می دهند و Google حدود 35٪ از نمایش داده شد. بقیه کاربران از Rambler ، Mail.ru ، Nigma و سایر خدمات استفاده می کنند.

در اوکراین حدود 60٪ از کاربران از Google استفاده می کنند ، در حالی که Yandex تقریباً 25٪ درخواست های پردازش شده را تشکیل می دهد.

بنابراین ، هنگام تبلیغ سایتهای روی Runet ، کارشناسان سعی می کنند با تمرکز روی موتورهای جستجو Yandex و Google ، سایت را تبلیغ کنند.

وظایف موتور جستجو

به منظور پاسخگویی به سؤالات بازدید کنندگان تا حد امکان ، موتورهای جستجو باید کارهای زیر را انجام دهند:

برای جمع آوری سریع و کارآمد اطلاعات در مورد صفحات مختلف سایتهای مختلف.
اطلاعات مربوط به این صفحات را پردازش کرده و تعیین کنید که کدام درخواست یا درخواست با آنها مطابقت دارد.
نتایج جستجو را در پاسخ به درخواست های کاربر شکل داده و صادر کنید.

اجزای موتورهای جستجو

موتورهای جستجو یک بسته نرم افزاری پیچیده است که از بلوک های اصلی زیر تشکیل شده است:

جمع آوری داده ها.
نمایه سازی
محاسبه
متغیر

این تقسیم بندی مشروط است ، زیرا کار موتورهای جستجوگر مختلف تا حدودی با یکدیگر متفاوت است.

1. جمع آوری داده ها

در این مرحله وظیفه یافتن اسناد جدید ، تهیه برنامه ای برای بازدید و اسکن آنهاست.

وب مسترها باید با قرار دادن آدرس صفحه در افزودنی یا درایو اعلامیه صفحه در شبکه های اجتماعی ، به موتورهای جستجوگر اجازه دهند تا از ظاهر مواد جدید مطلع شوند.

من شخصاً از روش دوم استفاده می کنم و فکر می کنم این کاملاً کافی است.

یک نظر. من کمی گنگ می زنم و در مورد اثربخشی ارسال اطلاعیه ها به شما می گویم شبکه های اجتماعی در سرعت فهرست کردن صفحات جدید سایت.

من از سرویس text.ru برای کنترل و رفع منحصر به فرد بودن متن در صفحات سایت خود استفاده می کنم.

او به صورت کیفی منحصر به فرد را بررسی می کند ، آن را برطرف می کند و باعث می شود در صفحات سایت شما یک پرچم منحصر به فرد قرار دهید.

اما گاهی اوقات این سرویس دارای صف طولانی برای پردازش است. چندین مورد داشتم که منتظر بررسی یکتا بودن نبودم ، مقاله ای را در سایت قرار دادم و برای شبکه های اجتماعی ارسال کردم.

اگر بررسی منحصر به فرد بودن حدود یک ساعت یا بیشتر به تعویق افتاد ، درصد منحصر به فرد بودن همیشه 0٪ بود. این بدان معنی است که در کمتر از یک ساعت پس از قرارگیری ، این صفحه قبلاً ایندکس شده و وارد پایگاه داده موتور جستجو می شود.

2. نمایه سازی

موتورهای جستجو داده ها را در صفحات وب جدید جمع آوری کرده و آنها را در پایگاه داده خود قرار می دهند. در همان زمان ، یک فهرست ایجاد می شود ، یعنی اگر برای چنین نیاز نیاز باشد ، کلید دسترسی سریع به داده های مربوط به این صفحه را داشته باشید.

3. محاسبه

پس از ورود به پایگاه داده ، صفحات سایت های ما مرحله محاسبه پارامترها و شاخص های مختلف را طی می کنند.

چه تعداد از این شاخص ها و چگونگی محاسبه آنها دقیقاً محاسبه می شود ، به جز برنامه نویسان الگوریتم های موتور جستجو خود ، هیچ کس نمی تواند.

4- رتبه بندی

سپس براساس پارامترها و نشانگرهای محاسبه شده ، ارتباط صفحه با درخواست های مشخص مشخص می شود و رتبه بندی این صفحه انجام می شود.

این مهم برای شکل گیری سریع و با کیفیت بالا در صفحه نتایج جستجو برای این سؤالات مهم خواهد بود.

موتورهای جستجو پاسخهای مربوط به نمایش داده شدگان کاربر را تشکیل می دهند و در قالب صفحه نتایج جستجو ، نتایج را برای آنها ایجاد می کنند.

لازم به ذکر است که الگوریتم های پردازش داده های صفحه ، تشکیل شاخص ها و روش های رتبه بندی به طور مداوم در حال بهبود است. اولویت هایی که برای این رتبه بندی اتفاق می افتد تغییر می کنند.
موتورهای جستجو سعی در پاسخگویی به درخواست های کاربر را در حد امکان با دقت دارند و سعی می کنند ماهیت درخواست ، علایق یک کاربر خاص ، محل زندگی وی ، سن ، جنس ، عادات ، تمایلات را در نظر بگیرند.

به منظور موفقیت و توسعه وبلاگ شما با موفقیت ، ما قبل از هر چیز باید بدانیم و با چه الگوریتمی کار می کنیم. درک واضح از پاسخ این سؤالات به ما امکان می دهد مشکلات ارتقاء وب سایت در موتورهای جستجو را با موفقیت حل کنیم. اما گفتگو در مورد بهینه سازی موتورهای جستجو در سایتها هنوز پیش رو است ، اما در حال حاضر اندکی نظریه در مورد موتورهای جستجو است.

موتورهای جستجوگر اینترنتی چیست؟

اگر به ویکی پدیا روی آوریم ، این همان چیزی است که ما می آموزیم:

"موتور جستجو یک مجموعه نرم افزاری و سخت افزاری با یک رابط وب است که به شما امکان می دهد اطلاعات را در اینترنت جستجو کنید."

و اکنون با زبانی که می فهمیم. بیایید بگوییم که ما فوراً به اطلاعات خاصی در مورد موضوع نیاز داریم. به طوری که بتوانیم به سرعت آن را پیدا کرده و موتورهای جستجو را ایجاد کنیم - سایتهایی که با وارد کردن یک جستجوی جستجو در فرم جستجو ، لیستی از سایتهایی به ما داده می شود که با داشتن احتمال بالایی می توانیم آنچه را که می خواهیم پیدا کنیم. به این لیست نتایج جستجو گفته می شود. این سایت می تواند شامل میلیون ها صفحه از هر 10 سایت باشد. وظیفه اصلی یک مدیر وب سایت این است که حداقل به ده نفر برتر راه پیدا کنید.

به یاد داشته باشید که وقتی چیزی را در وب جستجو می کنید ، معمولاً آن را در صفحه اول نتایج جستجو مشاهده می کنید ، بندرت به صفحه دوم و حتی موارد دیگر در موارد زیر می روید. این بدان معناست که هرچه سایت بالاتر باشد ، بازدید کنندگان بیشتری به صفحات آن خواهند رسید. و ترافیک زیاد (تعداد بازدید کنندگان در روز) از جمله موارد دیگر فرصت خوبی است.

موتورهای جستجوگر اینترنتی چگونه اطلاعاتی را در اینترنت پیدا می کنند و بر چه اساس مکانهایی را در نتایج جستجو اختصاص می دهند؟

در چند کلمه، موتور جستجوی اینترنتی - این یک وب کامل است که در آن روبات های عنکبوتی دائماً وب را اسکن می کنند و تمام متونی که وارد اینترنت می شوند را به خاطر می آورند. با تجزیه و تحلیل داده های به دست آمده ، موتورهای جستجو اسنادی را انتخاب می کنند که بیشتر مربوط به جستجوی جستجو هستند ، یعنی موارد مربوطه ، که نتایج جستجو از آنها تشکیل می شود.

جالب ترین چیز این است که موتورهای جستجو نمی توانند بخوانند. بنابراین ، چگونه ، آنها اطلاعاتی پیدا می کنند؟ الگوریتم های موتور جستجو به چند اصل اساسی می پردازند. اول از همه ، آنها به عنوان و توضیحات مقاله ، عناوین پاراگراف ، نکات برجسته معنایی در متن و تراکم توجه می کنند کلید واژه ها، که لزوماً باید متناسب با موضوع مقاله باشد. هرچه این مسابقه دقیق تر باشد ، سایت در نتایج جستجو بالاتر خواهد بود. علاوه بر این ، لزوماً میزان اطلاعات و عوامل بسیاری نیز مورد توجه قرار می گیرد. به عنوان مثال ، اختیار یک منبع وب ، که به تعداد و اختیار سایتهای پیوند دهنده به آن بستگی دارد. هرچه اقتدار بیشتری داشته باشید ، رتبه شما بالاتر است.

مجموعه اقدامات با هدف بالا بردن جایگاه سایت در نتایج جستجو برای برخی از نمایش داده شد بهینه سازی موتور جستجو... اکنون این یک کل علوم است -. اما بعداً بعداً

در حال حاضر موتورهای جستجوگر زیادی در جهان وجود دارد. من معروف ترین ها را نام می برم. در غرب این موارد عبارتند از: گوگل ، بینگ و یاهو. در Runet - Yandex ، Mail.ru ، Rambler و Nigma. در اصل کاربران اولویت را به رهبر جهان می دهند و سیستم Yandex در اینترنت روسی زبان رایج ترین است.

کمی تاریخ. گوگل در سال 1997 توسط بومی مسکو تأسیس شد سرگئی برین و دوست آمریکایی اش لری پیج در طول تحصیل در دانشگاه استنفورد.

خصوصیت گوگل این بود که مرتبط ترین نتایج جستجو را به صورت منطقی با موقعیت های اول در نتایج جستجو نشان می داد ، در حالی که بقیه موتورهای جستجوگر با یک مقایسه ساده کلمات در یک پرس و جو با کلمات در صفحه وب مشغول بودند.

در 23 سپتامبر همان سال ، سیستم Yandex اعلام شد که از سال 2000 به عنوان یک شرکت جداگانه "Yandex" شروع به کار کرد.

من دیگر شما را خسته نخواهم کرد ، امیدوارم اکنون کمی روشن باشد موتورهای جستجوگر اینترنتی چیست... باید گفت که الگوریتم های موتور جستجو دائما در حال تحول هستند. همه روزه موتورهای جستجو بهتر و بهتر نیازهای کاربران را تعیین می کنند و مناسب ترین اطلاعات را در نتایج جستجو به آنها نشان می دهند ، بر اساس فاکتورهای زیادی (منطقه ای بودن ، کدام پرس و جو از کاربر قبلاً درخواست کرده است ، از کدام سایت هایی که در طول جستجو بازدید کرده اند ، از کجا از آنها رفته اند و غیره).

به زودی گوگل و Yandex بهتر از ما می دانند آنچه ما به آن نیاز داریم و به چه فکر می کنیم!

معماری موتور جستجو به طور معمول شامل موارد زیر است:

دانشنامه YouTube

1 / 5

✪ درس 3: نحوه کار موتور جستجو. آشنایی با سئو

engine موتور جستجو از درون

✪ Shodan - گوگل سیاه

engine موتور جستجو CHEBURASHKA جایگزین Google و Yandex در روسیه می شود

✪ درس 1 - نحوه کار موتور جستجو

زیرنویس

تاریخ

تاریخشناسی
سال	سیستم	رویداد
1993	W3Catalog ؟!	در حال دویدن
	علیوب	در حال دویدن
	jumpStation	در حال دویدن
1994	WebCrawler	در حال دویدن
	Infoseek	در حال دویدن
	لیکو	در حال دویدن
1995	AltaVista	در حال دویدن
	داوم	پایه
	متن را باز کنید صفحه وب	در حال دویدن
	ماژلان	در حال دویدن
	هیجان زده	در حال دویدن
	ساپو	در حال دویدن
	یاهو!	در حال دویدن
1996	سگ سگ	در حال دویدن
	اینتکتومی	پایه
	رامبلر	پایه
	HotBot	پایه
	از جویوها بپرسید	پایه
1997	نور شمالی	در حال دویدن
1997	یاندکس	در حال دویدن
1998	گوگل	در حال دویدن
1999	AlltheWeb	در حال دویدن
	GenieKnows	پایه
	ناور	در حال دویدن
	تئوما	پایه
	ویویسمو	پایه
2000	بایدو	پایه
2000	تعالی	پایه
2003	اطلاعات	در حال دویدن
2004	یاهو! جستجو کردن	راه اندازی نهایی
	A9.com	در حال دویدن
	سوگو	در حال دویدن
2005	جستجوی MSN	راه اندازی نهایی
	ask.com	در حال دویدن
	نیگما	در حال دویدن
	GoodSearch	در حال دویدن
SearchMe	پایه
2006	ویکیزک	پایه
	Quaero	پایه
	جستجوی زنده	در حال دویدن
	چاچا	راه اندازی (بتا)
	guruji.com	راه اندازی (بتا)
2007	ویکیزک	در حال دویدن
	Sproose	در حال دویدن
	جستجوی ویکی	در حال دویدن
	Blackle.com	در حال دویدن
2008	DuckDuckGo	در حال دویدن
	توبی	در حال دویدن
	Picollator	در حال دویدن
	Viewzi	در حال دویدن
	کولی	در حال دویدن
	بوگامی	در حال دویدن
	LeapFish	راه اندازی (بتا)
	جنگل	در حال دویدن
	VADLO	در حال دویدن
	Powerset	در حال دویدن
2009	بینگ	در حال دویدن
	KAZ.KZ	در حال دویدن
	یبول	راه اندازی (بتا)
	مگوردی	بسته شدن
	دیده بانی	در حال دویدن
2010	کولی	بسته شدن
	بلککو	راه اندازی (بتا)
	Viewzi	بسته شدن
2012	WAZZUB	در حال دویدن
2014	ماهواره	راه اندازی (بتا)

در اوایل اینترنت ، تیم برنرز لی لیستی از سرورهای وب را که در وب سایت CERN میزبانی شده بودند ، حفظ کرد. تعداد سایت های بیشتر و بیشتری وجود داشت ، و نگهداری از چنین دستی به طور دستی سخت تر و سخت تر می شد. وب سایت NCSA ویژه جدیدی داشت! (انگلیسی What's New!) ، جایی که آنها پیوندهایی به سایتهای جدید منتشر کردند.

اولین برنامه رایانه ای برای جستجوی اینترنت این برنامه بود آرچی (بایگانی انگلیسی یک بایگانی بدون حرف "in" است). در سال 1990 توسط آلن امگاژ ، بیل هلان و جی پیتر دویچ ، دانشجویان علوم کامپیوتر در دانشگاه مک گیل مونترال ایجاد شد. این برنامه لیستی از تمام پرونده ها را از کلیه سرورهای FTP ناشناس موجود بارگیری کرده و یک پایگاه داده ایجاد کرده است که می تواند با نام پرونده ها جستجو شود. با این حال ، برنامه Archie محتوای این پرونده ها را فهرست بندی نکرد ، زیرا میزان داده ها به قدری اندک بود که همه چیز را می توان به راحتی دستی یافت.

توسعه و توزیع پروتکل شبکه گوفر که در سال 1991 توسط مارک مک کاهیل در دانشگاه مینسوتا اختراع شد ، منجر به ایجاد دو برنامه جستجوی جدید شد ، ورونیکا و Jughead. همانند Archie ، آنها به دنبال نام فایلها و هدرهای ذخیره شده در سیستمهای شاخص Gopher بودند. ورونیکا (مهندس فهرست وب بسیار گسترده ای از گشودگی جوندگان به بایگانی رایانه ای) جستجوهای کلمات کلیدی را برای بیشتر عناوین منوی Gopher در همه لیستهای Gopher مجاز کرد. برنامه Jughead (eng. حفاری و نمایش کلی سلسله مراتب گونفر جونزی) اطلاعات منو را از سرورهای خاص Gopher گرفته است. اگرچه نام موتور جستجو Archie هیچ ارتباطی با چرخه کمیک بوک نداشت "Archie"اما Veronica و Jughead شخصیت های این کمیک ها هستند.

تا تابستان سال 1993 ، هنوز هیچ سیستمی برای جستجوی وب وجود نداشت ، اگرچه چندین دایرکتوری تخصصی به صورت دستی نگهداری می شدند. اسکار Nierstrasz در دانشگاه ژنو مجموعه ای از اسکریپت های پرل را نوشت که بطور دوره ای این صفحات را کپی می کردند و بازنویسی آنها را در فرمت استاندارد... این پایه و اساس شد W3Catalog ؟!، اولین موتور جستجوی اولیه وب ، در تاریخ 2 سپتامبر 1993 راه اندازی شد.

احتمالاً اولین خزنده ای که در پرل نوشته شده بود "World Wide Web Wereerer" - بات متیو گری از ژوئن سال 1993 بود. این ربات شاخص جستجوی Wandex را ایجاد کرده است. هدف از ربات واندرر اندازه گیری اندازه وب در سراسر جهان و یافتن تمام صفحات وب حاوی کلمات از یک پرس و جو بود. در سال 1993 ، موتور جستجوی دوم با نام Aliweb ظاهر شد. Aliweb از خزنده استفاده نکرد ، اما در عوض انتظار اعلان هایی را از سرپرست وب سایت در مورد وجود یک فایل فهرست بندی با فرمت مشخص در سایت های خود داشت.

jumpStation، ایجاد شده در دسامبر سال 1993 توسط جاناتان فلچر ، جستجو در صفحات وب و ایجاد فهرست های آنها با خزنده ، و استفاده از یک فرم وب به عنوان یک رابط برای فرموله کردن جستجوها. این اولین ابزار جستجوی اینترنتی بود که سه عملکرد اصلی موتور جستجو (اعتبار سنجی ، نمایه سازی و جستجوی واقعی) را با هم ترکیب کرد. به دلیل محدود بودن منابع رایانه ها در آن زمان ، ایندکس سازی و به همین دلیل جستجوها فقط به عناوین و عناوین صفحات وب که توسط ربات جستجو یافت می شد محدود بود.

موتورهای جستجوگر در اواخر دهه 1990 در حباب dotcom شرکت کردند. چندین شرکت با موفقیت وارد بازار شده اند و در طول عرضه اولیه عمومی ، سود رکوردی کسب کرده اند. برخی از بازار موتور جستجوگر منبع باز را رها کرده اند و فقط با بخش شرکت ها شروع به کار کرده اند ، برای مثال ، نور شمالی.

گوگل در سال 1998 ایده فروش کلمات کلیدی را به عهده گرفت ، زیرا این شرکت کوچک بود که موتور جستجوی موتور goto.com را تأمین می کرد. این حرکت باعث تغییر موتورهای جستجو از رقابت با یکدیگر به یکی از سودآورترین مشاغل اینترنت شد. موتورهای جستجو شروع به فروش موقعیت های برتر در نتایج جستجو به شرکت های فردی کردند.

موتور جستجوی گوگل از اوایل دهه 2000 برجسته است. این شرکت به لطف نتایج جستجوی خوب با استفاده از الگوریتم PageRank ، به موقعیت بالایی رسیده است. این الگوریتم در مقاله "آناتومی موتور جستجو" ، نوشته شده توسط سرگئی برین و لری پیج ، بنیانگذاران گوگل ، در معرض دید عموم قرار گرفت. این الگوریتم تکرار شونده صفحات وب را بر اساس تخمین تعداد لینک های یک صفحه وب قرار داده و فرض می کند که پیوندهای بیشتری به صفحات "خوب" و "مهم" نسبت به سایرین دارد. رابط کاربری گوگل اسپارتان است و برخلاف بسیاری از رقبای خود که موتور جستجو را در یک پورتال وب ایجاد کرده اند هیچ چیز اضافی ندارد. موتور جستجوی Google آنقدر محبوب شد که سیستم هایی وجود داشتند که از آن تقلید می کنند ، به عنوان مثال ، جستجوگر رمز و راز(موتور جستجوی مخفی).

جستجوی اطلاعات به زبان روسی

در سال 1996 ، جستجوی با در نظر گرفتن مورفولوژی روسی در موتور جستجوی Altavista و موتورهای اصلی جستجو روسی Rambler و Aport آغاز شد. در 23 سپتامبر 1997 موتور جستجوی Yandex راه اندازی شد. در تاریخ 22 مه 2014 ، رستلكوم موتور جستجوی ملی Sputnik را راه اندازی كرد كه در زمان سال 2015 در آزمایش بتا قرار دارد. 22 آوریل 2015 افتتاح شد خدمات جدید ماهواره کودکان مخصوص کودکانی که ایمنی بیشتری دارند.

روش های تجزیه و تحلیل خوشه ای و جستجوی ابرداده بسیار رایج شده است. از بین خودروهای بین المللی از این نوع ، معروف ترین ها دریافت می شوند "خوشه" شرکت ویویسمو... در سال 2005 در روسیه با حمایت دانشگاه ایالتی مسکو موتور جستجوی "نیگما" راه اندازی شد که از خوشه بندی اتوماتیک پشتیبانی می کند. در سال 2006 ، metamachine روسی Quintura افتتاح شد و خوشه بندی بصری را به صورت ابر تگ ارائه می دهد. Nygma همچنین با خوشه بندی بصری آزمایش کرد.

موتور جستجو چگونه کار می کند

اجزای اصلی یک موتور جستجو: ربات جستجو ، ایندکسر ، موتور جستجو.

به طور معمول ، سیستم ها به صورت مرحله ای کار می کنند. ابتدا خزنده محتوا را دریافت می کند ، سپس ایندکس ایندکس یک شاخص جستجو را تولید می کند و سرانجام موتور جستجو عملکرد جستجوی داده های نمایه شده را فراهم می کند. برای به روزرسانی موتور جستجو ، این چرخه فهرست بندی تکرار می شود.

موتورهای جستجو با ذخیره اطلاعات در مورد بسیاری از صفحات وب که آنها را از صفحات HTML بازیابی می کنند ، کار می کنند. یک خزنده یا "خزنده" برنامه ای است که بطور خودکار تمام پیوندهای موجود در یک صفحه را می گذرد و آنها را برجسته می کند. خزنده ، بر اساس لینک ها یا بر اساس لیست از پیش تعریف شده آدرس ، اسناد جدیدی را که هنوز برای موتور جستجو مشخص نیست ، جستجو می کند. صاحب سایت می تواند صفحات خاصی را با استفاده از robots.txt حذف کند ، که می تواند برای جلوگیری از نمایه سازی پرونده ها ، صفحات یا فهرست های سایت استفاده شود.

موتور جستجو برای فهرست بندی بیشتر محتوای هر صفحه را تجزیه و تحلیل می کند. کلمات را می توان از عناوین ، متن صفحه یا فیلدهای خاص استخراج کرد - برچسب های متا. ایندکسر ماژول است که پس از تجزیه آن در قسمت هایی با استفاده از الگوریتم های واژگانی و مورفولوژیکی خود ، صفحه را تجزیه و تحلیل می کند. تمام عناصر صفحه وب جدا شده و تجزیه و تحلیل می شوند. داده های مربوط به صفحات وب برای استفاده در نمایش داده های بعدی در یک پایگاه داده فهرست ذخیره می شوند. این فهرست به شما امکان می دهد تا به سرعت اطلاعات را در صورت درخواست کاربر پیدا کنید. تعدادی از موتورهای جستجو مانند گوگل صفحه اصلی را به طور کامل یا جزئی ، به اصطلاح حافظه پنهان و همچنین اطلاعات مختلفی در مورد صفحه وب ذخیره می کنند. سیستمهای دیگر مانند AltaVista هر کلمه ای از صفحه ای را که می یابند ذخیره می کنند. استفاده از حافظه نهان به سرعت بخشیدن به بازیابی اطلاعات از صفحات قبلاً بازدید شده کمک می کند. صفحات ذخیره شده همیشه حاوی متنی هستند که کاربر در آن مشخص کرده است جستجوی جستجو... این می تواند در شرایطی که صفحه وب تجدید می شود مفید باشد ، یعنی دیگر حاوی متن درخواست کاربر نیست ، مفید باشد و صفحه موجود در حافظه پنهان همچنان قدیمی است. این وضعیت مربوط به از دست دادن لینک ها (eng. پیوند) و رویکرد کاربر پسند (قابلیت استفاده) Google. این شامل واکشی قطعات کوتاه متن از حافظه نهان حاوی متن درخواست است. اصل حداقل تعجب آور اعمال می شود ، کاربر معمولاً انتظار دارد کلمات جستجو را در متون صفحات دریافت شده مشاهده کند ( انتظارات کاربر) علاوه بر سرعت بخشیدن به جستجوها با استفاده از صفحات ذخیره شده ، صفحات موجود در حافظه نهان می توانند حاوی اطلاعاتی باشند که دیگر در هیچ جای دیگر در دسترس نیست.

موتور جستجو با فایلهای خروجی دریافت شده از فهرستگر کار می کند. موتور جستجو پرس و جوهای کاربر را می پذیرد ، آنها را با استفاده از فهرست پردازش می کند و نتایج جستجو را برمی گرداند.

هنگامی که کاربر یک پرس و جو را درون موتور جستجو (معمولاً با استفاده از کلمات کلیدی) وارد می کند ، سیستم فهرست آنها را بررسی می کند و لیستی از مناسب ترین صفحات وب (مرتب سازی بر اساس برخی معیار) را تولید می کند ، معمولاً با یک یادداشت کوتاه که حاوی عنوان سند و بعضی مواقع بخش هایی از متن است. فهرست جستجو با استفاده از تکنیک ویژه و براساس اطلاعاتی که از صفحات وب استخراج می شود ساخته شده است. از سال 2007 ، موتور جستجوی Google به شما امکان می دهد تا براساس زمان ، جستجو كنید و اسناد مورد نظر خود را ایجاد كنید (با تماس به منوی "ابزارهای جستجو" و مشخص كردن محدوده زمانی). اکثر موتورهای جستجو از سؤالات اپلیکیشن های بولی و AND ، یا نه پشتیبانی می کنند و به شما امکان می دهد لیست کلمات کلیدی جستجو شده را تصحیح یا گسترش دهید. در این حالت ، سیستم دقیقاً همانطور که وارد شده است ، کلمات یا عبارات را جستجو می کند. برخی از موتورهای جستجو این گزینه را دارند جستجوی تقریبیدر این حالت ، کاربران با مشخص کردن فاصله کلمات کلیدی ، جستجو خود را گسترش می دهند. همچنین وجود دارد جستجوی مفهومی، که از آنالیز آماری استفاده از کلمات و عبارات جستجو در متون صفحات وب استفاده می کند. این سیستم ها به شما امکان می دهند نمایش داده شد به زبان طبیعی. نمونه ای از چنین موتور جستجو ask com است.

سودمندی موتور جستجو بستگی به ارتباط صفحاتی دارد که می یابد. اگرچه میلیون ها صفحه وب ممکن است شامل یک کلمه یا عبارت باشند ، برخی ممکن است از سایرین دارای اهمیت ، محبوب تر یا معتبر باشند. اکثر موتورهای جستجو از تکنیک های رتبه بندی استفاده می کنند تا "بهترین" نتایج را در صدر فهرست قرار دهند. موتورهای جستجو تصمیم می گیرند که کدام صفحات بیشتر مرتبط هستند و به چه ترتیب نتایج باید به روش های مختلف نمایش داده شوند. روش های جستجو ، مانند اینترنت ، با گذشت زمان تغییر می کنند. اینگونه ظاهر می شود که دو نوع اصلی موتورهای جستجو وجود دارد: سیستم های کلمات کلیدی از پیش تعریف شده و سلسله مراتبی مرتب شده و سیستم هایی که در آنها یک شاخص معکوس بر اساس تجزیه و تحلیل متن ایجاد می شود.

بیشتر موتورهای جستجو شرکتهای تجاری هستند که از تبلیغات سود می برند ، در برخی موتورهای جستجو می توانید برای اولین بار در SERP کلمات کلیدی داده شده را با هزینه ای خریداری کنید. موتورهای جستجوگر که برای ترتیب نمایش نتایج ، هزینه ای دریافت نمی کنند ، از تبلیغات متنی استفاده می کنند ، در حالی که پیام های تبلیغاتی با درخواست کاربر مطابقت دارند. چنین تبلیغاتی در صفحه ای با لیستی از نتایج جستجو نمایش داده می شود و موتورهای جستجو هر بار که کاربر با کلیک بر روی تبلیغات ، درآمد کسب می کنند.

انواع موتور جستجو

چهار نوع موتور جستجو وجود دارد: سیستم های روباتیک ، انسان محور ، ترکیبی و متا سیستم.

سیستم های موتور جستجو

آنها از سه بخش تشکیل شده اند: خزنده ("ربات" ، "ربات" یا "عنکبوت") ، ایندکس و نرم افزار موتور جستجو. یک خزنده برای خزیدن شبکه و ایجاد لیست صفحات وب لازم است. ایندکس یک بایگانی بزرگ از کپی صفحات وب است. هدف این نرم افزار ارزیابی نتایج جستجو است. با توجه به اینکه ربات جستجو در این مکانیسم دائما در حال کاوش در شبکه است ، اطلاعات مربوط به آن بیشتر است. بیشتر موتورهای جستجو مدرن از این نوع هستند.

سیستمهای مدیریت انسانی (فهرستهای منابع)

این موتورهای جستجو لیست صفحات وب را دریافت می کنند. دایرکتوری شامل آدرس ، عنوان و توضیحات کوتاه سایت است. فهرست منابع فقط به دنبال نتیجه توصیف صفحه ای است که توسط وب مسترها ارسال شده است. مزیت کاتالوگ ها این است که کلیه منابع به صورت دستی بررسی می شوند ، بنابراین کیفیت مطالب در مقایسه با نتایج به دست آمده به طور خودکار توسط سیستم نوع اول بهتر خواهد بود. اما یک اشکال هم وجود دارد - به روز کردن این فهرست ها به صورت دستی انجام می شود و می تواند به طور چشمگیری از وضعیت واقعی امور عقب مانده باشد. رتبه بندی صفحه نمی تواند فوراً تغییر کند. نمونه هایی از چنین سیستم هایی هستند دایرکتوری یاهو ، dmoz و Galaxy.

سیستم های ترکیبی

موتورهای جستجو مانند یاهو ، گوگل ، MSN عملکرد سیستم های موتور جستجو و سیستم های انسانی محور را ترکیب می کنند.

سیستمهای متا

موتورهای Metasearch نتایج چندین موتور جستجو را به طور همزمان ترکیب و رتبه بندی می کنند. این موتورهای جستجو زمانی مفید بودند که هر موتور جستجوگر داشت فهرست منحصر به فردو موتورهای جستجو کمتر هوشمند بودند. از آنجا که اکنون پیشرفت های زیادی یافته شده است ، نیاز آنها کم شده است. مثال ها: MetaCrawler و جستجوی MSN.

بازار موتور جستجو

گوگل محبوب ترین موتور جستجوگر جهان با 68.69٪ سهم در بازار است. بینگ با سهم 12.26٪ در رده دوم قرار دارد.

محبوب ترین موتورهای جستجو در جهان:

سیستم جستجو	سهم بازار در ژوئیه 2014	سهم بازار در اکتبر 2014	سهم بازار در سپتامبر 2015
گوگل	68,69 %	58,01 %	69,24%
بایدو	17,17 %	29,06 %	6,48%
بینگ	6,22 %	8,01 %	12,26%
یاهو!	6,74 %	4,01 %	9,19%
آول	0,13 %	0,21 %	1,11%
هیجان زده	0,22 %	0,00 %	0,00 %
پرسیدن	0,13 %	0,10 %	0,24%

آسیا

در کشورهای آسیای شرقی و روسیه گوگل محبوب ترین موتور جستجو نیست. به عنوان مثال در چین محبوبیت بیشتری دارد موتور جستجو سوزو ؟!.

در کره جنوبی از پورتال جستجوی خود Naver حدود 70٪ از Yahoo! ژاپن و یاهو تایوان به ترتیب محبوب ترین موتورهای جستجو در ژاپن و تایوان هستند.

موتورهای جستجوگر روسیه و روسیه

با توجه به داده های LiveInternet در ژوئن سال 2015 در مورد دسترسی به پرس و جوهای جستجوی روسی زبان:

همه زبانی:
- یاهو! (0.1٪) و موتورهای جستجو متعلق به این شرکت: اینتکتومی، AltaVista ، Alltheweb
انگلیسی زبان و بین المللی:
- AskJeeves (مکانیسم Teoma)
روسی زبان - اکثریت موتورهای جستجو "روسی زبان" فهرست می کنند و متن ها را در بسیاری از زبانها جستجو می کنند - اوکراینی ، بلاروس ، انگلیسی ، تاتاری و موارد دیگر. آنها با سیستمهای "همه زبان" که همه اسناد را پشت سر هم فهرست بندی می کنند ، متفاوت هستند ، به این ترتیب که آنها منابع واقع در مناطق دامنه تحت تسلط زبان روسی را فهرست بندی می کنند ، یا به روش های دیگر روبات های خود را به سایت های روسی زبان محدود می کنند.

برخی از موتورهای جستجو از الگوریتمهای جستجوی خارجی استفاده می کنند.

داده های کمی موتور جستجوی Google

تعداد کاربران اینترنت و موتورهای جستجو و نیاز کاربر برای این سیستم ها به طور مداوم در حال افزایش است. برای افزایش سرعت جستجوی اطلاعات مورد نیاز ، موتورهای جستجوگر بزرگ شامل تعداد زیادی سرور هستند. سرورها معمولاً در مراکز سرور (مراکز داده) گروه بندی می شوند. موتورهای جستجوگر محبوب مراکز سرور پراکنده در سراسر جهان دارند.

در اکتبر 2012 ، Google پروژه Where the Internet Lives را اجرا کرد ، که به کاربران این امکان را می دهد تا مراکز داده شرکت را کشف کنند.

درباره کار جستجوی مراکز داده سیستم Google موارد زیر شناخته شده است:

ظرفیت کل کلیه مراکز داده Google ، تا سال 2011 ، 220 مگاوات برآورد شده است.
هنگامی که گوگل قصد داشت مجتمع 6.5 میلیون متر مربعی جدید را در سال 2008 در اورگان باز کند ، مجله هارپر تخمین زد که چنین مجتمع بزرگی بیش از 100 مگاوات برق مصرف می کند ، که با مصرف انرژی یک شهر 300000 قابل مقایسه است. شخص
تعداد تخمینی سرورهای Google در سال 2012 1000،000 است.
هزینه گوگل در مراکز داده 1.9 میلیارد دلار در سال 2006 و 2.4 میلیارد دلار در سال 2007 بود.

اندازه شبکه جهانی وب ، که از دسامبر 2014 توسط گوگل نمایه شده است ، تقریباً 4.36 میلیارد صفحه است.

موتورهای جستجو با توجه به ممنوعیت های مذهبی

گسترش جهانی اینترنت و محبوبیت روزافزون وسایل الکترونیکی در جهان عرب و مسلمان ، به ویژه در خاورمیانه و شبه قاره هند ، در توسعه موتورهای جستجوگر محلی که حسابگر سنت های اسلامی هستند ، نقش داشته است. چنین موتورهای جستجو حاوی فیلترهای ویژه ای است که به کاربران کمک می کند به سایت های ممنوعه ، به عنوان مثال ، سایت های مستهجن مراجعه نکنند و به آنها اجازه می دهند فقط از سایتهایی استفاده کنند که محتوای آنها با ایمان اسلامی منافات ندارد. اندکی قبل از ماه مسلمان ماه رمضان ، در ژوئیه 2013 ، جهان معرفی شد حلالگوگل - سیستمی که فقط به پیوندهای حلال "درست" به کاربران می دهد ، و نتایج جستجوی دریافت شده از سایر موتورهای جستجو مانند Google و Bing را فیلتر می کند. دو سال قبل ، در سپتامبر 2011 ، موتور جستجوی IHalal برای خدمت رسانی به کاربران در خاورمیانه راه اندازی شد. با این حال ، این خدمات جستجو به گفته صاحب ، به دلیل کمبود بودجه مجبور شد به زودی تعطیل شود.

کمبود سرمایه گذاری و سرعت کند انتشار فناوری در جهان اسلام مانع پیشرفت و مانع موفقیت یک موتور جستجوی جدی اسلامی شده است. سرمایه گذاری عظیم در پروژه های وب شیوه زندگی مسلمانان به وضوح شکست خورده است ، یکی از این موارد بود Muxlim... این کشور میلیون ها دلار از سرمایه گذاران مانند Rite Internet Ventures دریافت کرده است و اکنون - طبق آخرین پیام IHalal قبل از بسته شدن ، - با این ایده مشکوک روبرو شده است که "Facebook یا Google بعدی تنها می تواند در خاورمیانه باشد. اگر از جوانان درخشان ما حمایت می کنید. " با این وجود ، کارشناسان اینترنت اسلامی سالهای زیادی را در تعیین آنچه که شریعت سازگار است یا نیست ، می گذارند و وب سایتها را "حلال" یا "حرام" طبقه بندی می کنند. همه موتورهای جستجوگر سابق و فعلی اسلامی به سادگی مجموعه ای از داده های خاص فهرست بندی شده یا موتورهای اصلی جستجو مانند گوگل ، یاهو و بینگ هستند که برخی از سیستم فیلترشکن برای جلوگیری از دسترسی کاربران به سایت های حرام مانند استفاده می کنند. به عنوان سایت هایی درباره برهنگی ، دگرباشان جنسی ، قمار و هر چیز دیگر ، موضوع آن ضد اسلامی تلقی می شود.

سایر موتورهای جستجوگرای مذهبی گرا عبارتند از Jewogle ، نسخه یهودی گوگل و SeekFind.org ، یک سایت مسیحی که شامل فیلترهایی برای مصون نگه داشتن کاربران از محتوا است که می تواند ایمان آنها را تضعیف یا تضعیف کند.

نتایج شخصی شده و حباب های فیلتر

بسیاری از موتورهای جستجو ، مانند گوگل و بینگ ، از الگوریتم هایی استفاده می کنند تا بطور انتخابی حدس بزنند که کاربر بر اساس فعالیت قبلی خود بر روی سیستم ، چه اطلاعاتی را می خواهد ببیند. در نتیجه ، وب سایت ها فقط اطلاعاتی را نمایش می دهند که با علایق گذشته کاربر سازگار است. این اثر را حباب فیلتر می نامند.

همه اینها منجر به این واقعیت می شود که کاربران اطلاعات بسیار متناقضی دریافت می کنند و از نظر فکری در "حباب اطلاعاتی" خود جدا می شوند. بنابراین ، "اثر حباب" می تواند پیامدهای منفی برای شکل گیری افکار مدنی داشته باشد.

تعصب موتور جستجو

اگرچه موتورهای جستجوگر برای رتبه بندی وب سایت ها بر اساس برخی از محبوبیت و ارتباط برنامه ریزی شده اند ، اما در واقعیت ، تحقیقات تجربی نشان می دهد که عوامل مختلف سیاسی ، اقتصادی و اجتماعی بر نتایج جستجو تأثیر می گذارد.

این تعصب ممکن است نتیجه مستقیم فرایندهای اقتصادی و تجاری باشد: شرکتهایی که در موتور جستجو تبلیغ می کنند ممکن است در نتایج جستجوی ارگانیک در آن موتور جستجو محبوب تر شوند. حذف نتایج جستجو که مطابق با قوانین محلی نیست نمونه ای از تأثیر روندهای سیاسی است. به عنوان مثال ، گوگل برخی از وب سایتهای نئو نازی را در فرانسه و آلمان نمایش نمی دهد ، جایی که انکار هولوکاست غیرقانونی است.

تعصب همچنین می تواند نتیجه ای از فرایندهای اجتماعی باشد ، زیرا الگوریتم های موتور جستجو غالباً به منظور حذف نظرات غیررسمی به نفع نتایج "محبوب تر" طراحی شده اند. نمایه سازی الگوریتم برای موتورهای جستجوگر سایت های ایالات متحده را در اولویت قرار داده است.

بمب جستجو یکی از نمونه های تلاش برای مدیریت نتایج جستجو به دلایل سیاسی ، اجتماعی یا تجاری است.

همچنین ببینید

کوویکا
کتابخانه الکترونیکی # لیست های کتابخانه و موتورهای جستجو
داشبورد توسعه دهنده وب

یادداشت

ادبیات

اشمانوف I.S. ، ایوانف A.A. ارتقاء وب سایت در موتورهای جستجو. - م: ویلیامز ، 2007 .-- 304 ص. - شابک 978-5-8459-1155-1.
بایکوف V.D. اینترنت. جستجوی اطلاعات. ارتقاء وب سایت - SPb. : BHV-Petersburg، 2000 .-- 288 ص. - شابک 5-8206-0095-9.
Kolisnichenko D.N. موتورهای جستجو و ارتقاء وب سایت در اینترنت. - م: دیالکتیک ، 2007 .-- 272 ص. - شابک 978-5-8459-1269-5.

Lande D.V. به جستجوی دانش در اینترنت بپردازید. - م: دیالکتیک ، 2005 .-- 272 ص. - شابک 5-8459-0764-0.

Lande D.V.، Snarskiy A.A.، Bezsudnov I.V. اینترنت: پیمایش در شبکه های پیچیده: مدل ها و الگوریتم ها. - م.: لیبروکوم (سرمقاله URSS) ، 2009 .-- 264 ص. - شابک 978-5-397-00497-8.

Chu H. ، Rosenthal M.

این یک موتور جستجو است که در آن است. موتورهای جستجوگر اینترنتی: Yandex ، Google ، Rambler ، Yahoo. ترکیب ، کارکردها ، اصل عملکرد. نحوه عملکرد این سرویس ها

نمونه هایی از موتورهای جستجو

موتور جستجو چیست؟

موتورهای جستجو کار می کنند

اجزای موتور جستجو

انواع موتورهای جستجو

کمی تاریخ

مشهورترین موتورهای جستجو اکنون چیست؟

موتور جستجو چیست؟

وظایف موتور جستجو

اجزای موتورهای جستجو

1. جمع آوری داده ها

2. نمایه سازی

3. محاسبه

4- رتبه بندی

موتورهای جستجوگر اینترنتی چیست؟

موتورهای جستجوگر اینترنتی چگونه اطلاعاتی را در اینترنت پیدا می کنند و بر چه اساس مکانهایی را در نتایج جستجو اختصاص می دهند؟

دانشنامه YouTube

زیرنویس

تاریخ

جستجوی اطلاعات به زبان روسی

موتور جستجو چگونه کار می کند

انواع موتور جستجو

بازار موتور جستجو

آسیا

موتورهای جستجوگر روسیه و روسیه

داده های کمی موتور جستجوی Google

موتورهای جستجو با توجه به ممنوعیت های مذهبی

نتایج شخصی شده و حباب های فیلتر

تعصب موتور جستجو

همچنین ببینید

یادداشت

ادبیات

همچنین بخوانید

نحوه تماس با پزشک ، آمبولانس یا اورژانس در خانه

فیس بوک چیست و چرا اینقدر محبوب است از معنی در facebook

از کجا می توان پرونده ها را امن تر و ارزان تر ذخیره کرد

زنگ