زنگ.

کسانی هستند که این خبر را قبل از شما خوانده اند.
مشترک شدن برای دریافت مقالات تازه.
پست الکترونیک
نام
نام خانوادگی
چگونه می خواهید زنگ را بخوانید
بدون هرزنامه

سیستم جستجو - نرم افزار و سخت افزاری پیچیده با رابط وب که توانایی جستجو برای اطلاعات در اینترنت را فراهم می کند.

تمام موتورهای جستجو ترکیبی از آنچه که آنها در سرورهای قدرتمند انتخاب شده قرار داده شده و به کانال های ارتباطی کارآمد متصل می شوند، ترکیب می شود. موتورهای جستجو تماس با اطلاعات بیشتر و موتورهای جستجو (IPS). تعداد بازدیدکنندگان همزمان به طور همزمان به محبوب ترین سیستم ها به هزاران نفر می رسد. معروف ترین میلیون ها نفر از مشتریان. در مواردی که موتور جستجو بر اساس یک دایرکتوری است، آن را یک کاتالوگ نامیده می شود. این بر اساس عملکرد مدیران است. اساس IPS با جستجوی کامل متن، جمع آوری اطلاعات اتوماتیک است. این برنامه توسط برنامه های ویژه انجام می شود. این برنامه ها به صورت دوره ای محتویات تمام منابع اینترنتی را بررسی می کنند. برای انجام این کار، آنها حرکت می کنند، یا به عنوان آنها می گویند، خزنده، توسط منابع مختلف. بر این اساس، چنین برنامه هایی روبات نامیده می شود. نام های دیگر وجود دارد: از آنجا که WWW اختصار بیان وب در سراسر جهان است، پس از آن چنین برنامه ای به طور طبیعی یک عنکبوت به زبان انگلیسی نامیده می شود. - عنکبوت. به تازگی نام های دیگر استفاده می شود: شاخص های خودکار یا دایرکتوری ها. همه این برنامه ها کشف و "دانلود" اطلاعات از URL های مختلف. برنامه ها نوع مشخص شده در هر منبع بعد از یک زمان خاص شرکت کنید. هیچ موتور جستجو قادر به فهرست کل اینترنت نیست. بنابراین، پایگاه های داده ای که در آن آدرس های منابع نمایه شده جمع آوری می شوند، موتورهای جستجو متفاوت متفاوت هستند. با این حال، بسیاری از آنها به دنبال، در صورت امکان، کل فضای شبکه جهانی را در کار خود پوشش می دهند.

برای جستجوی اطلاعات با استفاده از موتور جستجو، کاربر یک پرس و جو جستجو را فرمول می کند. بر اساس درخواست کاربر، موتور جستجو نتایج جستجو را تولید می کند. چنین انتشار جستجو می تواند انواع مختلفی از انواع فایل ها را ترکیب کند، به عنوان مثال: صفحات وب، تصاویر، فایل های ویدئویی. برخی از موتورهای جستجو همچنین اطلاعات را از پایگاه داده های منابع در اینترنت استخراج می کنند.

با توجه به روش های جستجو و خدمات، چهار نوع موتورهای جستجو تقسیم می شوند:

1. سیستم ها با استفاده از روبات های جستجو.

2. سیستم های مدیریت شده توسط انسان

سیستم های 3.Gabrid

سیستم های 4.Metting.

معماری موتور جستجو شامل موارد زیر است: سایت های اینترنتی اسکن اسکن، نماینده ارائه یک جستجوی سریع و یک موتور جستجو - یک رابط گرافیکی برای کاربر.

هدف موتور جستجو، یافتن اسناد حاوی هر کلمه کلیدی یا کلمات هر چیزی مربوط به کلمات کلیدی است. موتور جستجو بهتر از اسناد بیشتری از درخواست کاربر مربوطه است، بازگشت خواهد کرد.

نمونه هایی از موتورهای جستجو

گوگل- یکی از کامل ترین و محبوب ترین IPS خارجی. یکی از ویژگی های متمایز IPS گوگل تکنولوژی برای تعیین میزان ارتباط سند با تجزیه و تحلیل منابع دیگر منابع برای این منبع است. ارجاعات بیشتر به هر صفحه ای که در صفحات دیگر وجود دارد، رتبه بالاتر آن در Google IPS بالاتر است. گوگل از الگوریتم برای محاسبه اقتدار PageRank استفاده می کند. PageRank یکی از عوامل کمکی جستجو برای نتایج جستجو است. PageRank تنها نیست، بلکه یک راه بسیار مهمی برای تعریف نتایج جستجوی سایت برای Google نیست. گوگل از شاخص PageRank به درخواست صفحات برای تعیین روش صدور این صفحات به بازدید کننده در نتایج جستجو استفاده می کند. در سال 2010، شرکت راه اندازی کرد جستجوی صوتی در روسیه. برای جستجو، شما باید بر روی شماره تلفن کنار رشته جستجو کلیک کنید و درخواست خود را تلفظ کنید، تلفن صدای خود را به سرور ارسال می کند، و مرورگر یک رشته را با جستجوی شناخته شده و نتایج جستجو بر روی آن نمایش می دهد.

فهرست مطالب. - محبوب ترین موتور جستجوی داخلی در حال حاضر است. من شروع به کار در سال 1997 کردم. از دایرکتوری خود از منابع اینترنتی پشتیبانی می کند. همچنین بهترین موتور جستجو برای شناسایی تصاویر است. نسخه انگلیسی زبان با دایرکتوری از منابع اینترنتی مجهز شده است. این سیستم تشکیل پرس و جو مستقر است. به طور خاص، نسخه سفارش جستجو در زبان طبیعی مجاز است - در این مورد، تمام انبساط لازم به طور خودکار تولید می شود.

علاوه بر صفحات وب در فرمت HTML، شاخص های شاخص Yandex در فرمت های PDF (Adobe Acrobat)، فرمت متن غنی (RTF)، فرمت های باینری کلمه (.doc)، اکسل (.xls)، PowerPoint (.PPT)، RSS (وبلاگ ها) و وبلاگ ها و انجمن ها).

سیستم جستجو mail.ruشروع به کار در سال 2007 کرد. مقدار فایل شاخص در بهار سال 2009 بیش از 1.5 میلیارد صفحه در سرورهای روسی زبان بود. علاوه بر جستجو برای متون، سیستم به دنبال تصاویر و عبارات ویدئویی ارسال شده در سرورهای تخصصی "خود پر شده" روسی: [email protected]، flamber.ru، 35photo.ru، photoforum.ru، ویدئو @ mail. ru، rutube، loadup، چشم انداز Rambler و آنها مانند. Gogo.ru اجازه می دهد تا شما را به محدود کردن منطقه جستجو از وسایل نقلیه تجاری، سایت های اطلاعات، و همچنین انجمن ها و وبلاگ ها. فرم "Extended Search" همچنین امکان محدود کردن مکان را با انواع خاصی از فایل ها (PDF، Doc، XLS، PPT)، موقعیت موقعیت کلمات مورد نظر در سند یا یک دامنه خاص محدود می کند. در ماه نوامبر 2013 Google Play نسخه جدیدی از برنامه جستجو از Mail.ru وجود داشت که به شما اجازه می دهد از صفحه اصلی به هر شبکه های اجتماعی حرکت کنید و حاوی دسترسی سریع به جستجوی تصاویر، فیلم ها و اخبار باشد. نرم افزار آندروید تبدیل به یک مرورگر مینی شده است، تحت جستجوی موثر برای اطلاعات مورد نظر تیز شده است. این ابزار همچنین آموخته است که به رسمیت شناختن پرسش های جستجو توسط متن نه متن، بلکه توسط صدا. توسعه دهندگان همچنین توجه دارند که آنها یک ویجت ویژه ایجاد کرده اند که می تواند بر روی صفحه اصلی گوشی هوشمند یا رایانه لوحی بر اساس سیستم Google Android قرار گیرد. به این معنی است که این امر حتی برای کاهش زمان صرف شده در جستجو، حتی قوی تر خواهد بود.

Altavista- یکی از قدیمی ترین موتورهای جستجو، یکی از اولین مکان ها را از لحاظ اسناد اشغال می کند - بیش از 350 میلیون نفر. Altavista به شما اجازه می دهد تا یک جستجوی ساده و پیشرفته را اجرا کنید. "کمک" اجازه می دهد تا کاربران حتی آماده آماده به درستی درخواست های ساده و پیچیده را کامپایل کنند.

رمبلر- یکی از اولین IPS روسیه، در سال 1996 افتتاح شد. در پایان سال 2002، مدرنیزاسیون بومی ساخته شد، پس از آن Rambler دوباره وارد یک گروه رهبر جستجو شبکه شد. در حال حاضر حجم شاخص حدود 150 میلیون اسناد است. برای کامپایل پرس و جو های پیچیده، توصیه می شود از حالت "درخواست دقیق" استفاده کنید، که فرصت های فراوانی را برای آماده سازی یک سفارش جستجو با استفاده از آیتم های منو فراهم می کند.

جامه. تا به امروز، پایگاه آن بیش از 20 میلیون اسناد است. سیستم دارای طیف گسترده ای از قابلیت های جستجو است. Aport دارای یک تابع از مترجم داخلی است، به کاربر امکان می دهد تا درخواست ها را فرمول، هر دو در روسیه و در انگلیسی. علاوه بر این، APORT دارای حالت های خاص برای جستجوی تصاویر و فایل های صوتی است.

آخرین مکانیسم های جستجوی نسل، همه کلمات را در صفحه وب یا در مقاله از کنفرانس فهرست می کنند، در حالی که منطقه شاخص قبلا به نام، سرصفحه، اولین خطوط چندگانه و آدرس سند محدود شده است. این امر به طور قابل توجهی امکان شناسایی مواد را با تم های باریک محدود کرد، زیرا نتایج جستجو همیشه داده های واقعی را منعکس نمی کرد. با از بین بردن این ضرر، موتورهای جستجوی مدرن بسیار قابل اعتماد تر از پیشینیان خود هستند.

در زیر مهم ترین ویژگی این است که موتور جستجوی داخلی را بهبود بخشد، بیانگر تعداد اپراتورها و سایر عناصر آماده سازی درخواست ها. چند سال پیش، استفاده فقط دو، در بهترین حالت، سه اپراتور بولین کلاسیک: و (و)، یا (یا) و نه (نه) یافت شد. نزدیک (نزدیک، در مورد) در Alta Vista ظاهر شد و به دنبال آن (به دنبال آن) در OpenText - اپراتورهای بسیار مفید فاصله ای که امکان تعیین پرس و جو را به حداکثر اندازه می دهد. بسیاری از سیستم ها به شما اجازه می دهد تا پایان دادن به اصطلاحات را به چالش بکشید، جستجو را با تاریخ ایجاد سند محدود کنید، فقط در عناصر تعیین شده صفحات وب (عناوین، سرفصل ها، آدرس الکترونیکی، و غیره) جستجو کنید، و همچنین به دقت عبارت. آخرین تحولات همچنین به شما اجازه می دهد فایل های یک نوع خاص را شناسایی کنید (به عنوان مثال، گرافیک یا صوتی) و حساسیت به خط و حروف بزرگ داشته باشید. به طور کلی پذیرفته می شود فرصتی برای جستجوی داده ها در هر زبان است. همه اینها باعث می شود تا یک سفارش جستجو را با درجه بالایی از دقت تهیه کنید، که البته ارتباط نتایج به دست آمده را افزایش می دهد.

در این لحظه محبوب ترین موتورهای جستجو Google و Yandex، مقایسه آنها:

    تعداد صفحات نمایه شده. گوگل 8 میلیارد دلار است و Yandex تنها 2 میلیارد دلار دارد. این، چهار برابر کمتر است. پیروزی برای گوگل

    صفحه نمایه سازی صفحه Google صفحات جدید را در عرض 24 ساعت نشان می دهد، در حالی که Yandex ممکن است برای چند روز نیاز داشته باشد. گوگل دوباره برنده می شود

    ارتباط صادر کننده این ارتباط به عنوان انطباق نتایج نمایش داده شده در صفحه موتور جستجو، درخواست شما قابل درک است. بلافاصله می گویم، برنده دشوار است برای تعیین اینجا. Google نتایج خوبی در بخش خارجی اینترنت نشان داد، اما در Ratet، Yandex همیشه کمی پیش از آن بود.

    خدمات اینترنتی اضافی در اینجا مزیت قطعا پشت Yandex است. او ده ها تن از خدمات مختلفی دارد که به راحتی توسط دسته ها دسته بندی می شوند، در حالی که گوگل کوچکتر است، به علاوه یکپارچگی با اجتماعی وجود دارد شبکه گوگل+، که بسیاری را دوست ندارد

سلام، خوانندگان عزیز! با شما Ekaterina Kalmykova. مقاله امروز به عنوان یک مفهوم به عنوان یک موتور جستجو اختصاص داده خواهد شد، چه چیزی برای آنچه که نیاز دارد. ما همچنین جزئیات گونه های موتورهای جستجو را در اینترنت بررسی می کنیم.

اگر شما یک سوال دارید: "چرا باید در مورد این موتورهای جستجو بدانم؟"، من به این موضوع پاسخ خواهم داد. هنگامی که سوپ خوشمزه را در رستوران می خورید، می خواهم بدانم که کدام مواد تشکیل دهنده آن پخته شده است تا خودتان را در خانه تکرار کنید؟ پس از همه، اگر شما از نتیجه نهایی راضی هستید، یعنی طعم سوپ، پس مطمئنا شما علاقه مند خواهید بود بدانید که چه چیزی منجر به چنین نتیجه ای می شود؟

شما همچنین می توانید در مورد کار با موتور جستجو (PS) بگویید. اگر شما در آینده وبلاگ خود را ایجاد کنید، دانستن کار PS شما مجبور نیستید از متخصصان کمک بگیرید. شما می توانید به طور مستقل پروژه خود را حفظ کنید تا موتور جستجو آن را ببیند و به سایر کاربران نشان دهد. پس از همه، از این است که به حضور منابع شما بستگی دارد و به همین ترتیب درآمد حاصل می شود.

بنابراین، ادامه دهید.

یک موتور جستجو چیست؟

موتور جستجو یک منبع ویژه در اینترنت است که اطلاعات را به کاربر مطابق با درخواست آن ارائه می دهد. به عبارت دیگر، این منبع تمام اطلاعات مربوط به شبکه جهانی، تمام پروژه های وب را جمع آوری می کند و پس از دریافت از کاربر یک پرس و جو خاص، اطلاعات لازم را از جهت آن، به عنوان مثال، در وبلاگ یا سایت موضوعی، جمع آوری می کند.

بنابراین، پس از ایجاد پروژه خود، وظیفه شما به صدور رسیده است، یعنی، در "لیست" یا پایه سیستم پایه. از آنجا که ارتقاء وب سایت در اینترنت بدون استفاده از هیچ موتور جستجو امکان پذیر نیست، بنابراین شما باید از کیفیت منابع خود، بهینه سازی داخلی و خارجی مراقبت کنید. چگونه این کار را انجام دهیم، ما در مقالات زیر صحبت خواهیم کرد. بنابراین نه از دست دادن

در عین حال، اگر تصمیم به ایجاد وبلاگ خود دارید، توصیه می کنم خواندن این مقالات را بخوانید:

از آنجا که منابع وب جدید تقریبا هر روز ظاهر می شوند، سپس پایگاه داده موتورهای جستجو باید به طور مداوم به روز شود. هر سایت تازه ایجاد شده باید توسط یک ربات نمایه شود. صحبت كردن کلمات ساده، دستیاران PS - ربات ها باید منابع جدید را بدانند و این داده ها را به موتور جستجو انتقال دهند.

خوب، در اینجا شما احتمالا حدس زدید که هنگام بازدید از وبلاگ خود، من باید همه چیز را با یک ربات دوست دارم. از این مهمان و به سرنوشت بیشتر شما بستگی دارد.

نحوه ایجاد یک ربات از پروژه شما برای لذت بردن کامل، من در یکی از مقالات زیر خواهم گفت. از دست ندهید، یک اطلاعات جالب و بسیار کنجکاو وجود خواهد داشت که من با شما به اشتراک می گذارم.

کار موتورهای جستجو

تمام کار مربوط به PS با ورودی پرس و جو مورد نظر در نوار جستجو آغاز می شود. چه می توانم برای کاربران جستجو کنم؟ بله، هر چیزی، اعم از دستور العمل کیک با کلم و پایان دادن به سوال ابدی "چگونه می توان پول را بیشتر انجام نمی دهد."

به منظور اینکه منابع شما به عنوان یک پاسخ به این سوال بیرون بیاید، باید از رقبای خود جلوتر شوید. برای انجام این کار و شما باید پرداخت کنید توجه ویژه برای ترویج پروژه خود، که شامل چنین رویدادهایی به عنوان نوشتن محتوای بهینه با کیفیت بالا، یعنی پاسخ به درخواست های مقاله، بهبود عامل رفتاریبه این معناست که خواننده شما علاقه مند به منابع است، این بهبودی در قابلیت استفاده، یعنی راحتی بازدید کننده و بسیاری از عوامل دیگر است. این همه ما با شما یاد می گیریم.

اجزای موتور جستجو

برای مثال، چه چیزی کمک می کند تا موتورهای جستجو، به عنوان مثال، Google Index منبع خود را بررسی کنید؟

  1. نمایندگان کارگران هستند که بخش عمده ای از کار را انجام می دهند - سایت ها و تجزیه و تحلیل سایت ها.
  2. عنکبوت - برنامه ای است که می تواند صفحات منابع وب را دانلود کند و جمع آوری کند اطلاعات کلی درباره ی او.
  3. Crowler (Crawler) - یک برنامه ای است که تمام پیوندها را به صفحات پیدا می کند، حرکت می کند که در آن داده های جدید می خواستند به موتورهای جستجو آشنا نباشند.
  4. Indexer (Indexer) - تجزیه و تحلیل متن، سرفصل ها، سبک و غیره
  5. روبات ها - صفحات محتوای محتوای خود را فهرست کنید، و همچنین مطالب مختلفی را مطالعه کنید.

به منظور شاخص سازی به عنوان شما به شما نیاز دارید و یک سند ویژه "robots.txt" ایجاد کنید. این اجازه می دهد تا سیستم تنها صفحاتی را که شما نیاز دارید را بررسی کنید و آنچه را که نباید مشاهده کنید حذف کنید.

انواع موتورهای جستجو

گزینه های متعددی برای اطلاعات و موتورهای جستجو وجود دارد:

  • کاتالوگ ها یک مقایسه ساده ساده یک قفسه کتاب در کتابخانه است. همه چیز در زیر شاخه ها و دسته های یک موضوع خاص ذخیره می شود. اگر شما چنین موتور جستجو را تجربه کرده اید، سپس به من اعتقاد دارید، اطلاعاتی که پیدا می کنید، بیشتر از مفاهیم مفید و قابل فهم خواهد بود. حدس زده در مورد چه سایت مشترک این سخنرانی است؟ البته درباره ویکی پدیا، که یک کتاب مرجع کامل اطلاعات مفید را جمع آوری کرد.
  • اشاره گرها جستجو برای داده ها به هزینه عبارات کلیدی انجام می شود. در همان زمان راحت و ناراحت کننده است. من فکر می کنم این افراد را درک می کنم، به عنوان مثال، "دختر نشان می دهد کلاس" برای پیدا کردن به عنوان یک دختر نشان می دهد انگشت شست، و چیزی بسیار مناسب در جستجو نیست. 🙂 این نوع جستجو اکثر موتورهای جستجو را مشخص می کند.
  • سیستم های رتبه بندی به دلیل تعداد بازدیدکنندگان، محبوبیت خود را تعیین کنید. البته نه بیشتر بهترین معیاراز آنجایی که همیشه مفید بودن و کیفیت منابع خود را در نظر نمی گیرد. یک نمونه از چنین سیستمی یک منبع اینترنتی Alexa.com است.

سرورهای جستجو نیز به آن تقسیم می شوند عمومی و تخصصی. موتورهای جستجو به اشتراک گذاشته شده داده های اطلاعاتی را بدون هیچ گونه انتخابی برای تمام منابع وب شناخته شده به آنها ارائه می دهند. این شامل Yandex، Rambler، Google است. تخصصی - مرتب سازی مرتب سازی بر اساس زبان مورد استفاده.

همچنین موتورهای جستجو می توانند به اشتراک بگذارند توزیع منطقه ای و جهانی.

تا به امروز، تمام موتورهای جستجو به طور مداوم الگوریتم های خود را برای انتخاب منابع با کیفیت بالا، به طور مداوم بهبود می بخشد.

کمی از تاریخ

در Runet، PS در سال 1996 ظاهر شد - این Aport و Rambler است. یک سال بعد در سال 1997، Yandex تشکیل شد، و یک سال دیگر در سال 1998 یکی دیگر از رقیب ظاهر شد - گوگل. در حال حاضر محبوب ترین Yandex و Google است.

چه موتورهای جستجو در حال حاضر محبوب ترین هستند؟

ما آمار را ارائه می دهیم:

همانطور که می بینید، Yandex همراه با Google و Mail، در حال حاضر محبوب ترین در روسیه است.

بنابراین، شما می توانید جستجوهای بالا را ببینید که باید هنگام ایجاد و ارتقاء پروژه خود حرکت کنید.

موتور جستجو Yandex (Yandex)

اصل کار به شرح زیر است: در رشته جستجو درخواست مورد نظر را وارد کنید، روی «یافتن» کلیک کنید و صدور را ببینید. Yandex 13 میلیون پاسخ به درخواست شما را برداشت. شما همچنین می توانید در تصاویر، ویدئو، Markete جستجو کنید (ستون سمت چپ را ببینید).

علاوه بر این، شما می توانید منطقه را به جستجو سفارشی کنید. برای انجام این کار، شما باید بر روی آیکون کنار صلیب کلیک کنید و منطقه مورد نظر را در پنجره فیلتر انتخاب کنید.

موتور جستجوی گوگل (گوگل)

گوگل با همکاری با Yandex کار می کند. شما می توانید اطلاعات را در بخش های مختلف جستجو کنید: تصاویر، فیلم ها، اخبار، نقشه ها و غیره

اگر روی "ابزار جستجو" کلیک کنید، پانل با تنظیمات باز خواهد شد، جایی که شما می توانید یک منطقه، زبان را انتخاب کنید و برای چه زمانی که اطلاعات را جستجو می کنید.

حالا شما می دانید که سیستم های جستجو در اینترنت وجود دارد، شما همچنین محبوب ترین آنها را دیدید، و در حال حاضر، مسلح با اطلاعاتی که می توانید ارتباطات و تعامل خود را با موتورهای جستجو ایجاد کنید.

امروز همه چیز. مقاله شما چیست؟

تا حالا.

من به شما توصیه می کنم وبلاگ را به روز کنید تا خروجی اخبار تازه را از بین ببرید.

ekaterina kalmykova

یکی از مهمترین و مهمترین خدمات اینترنت هستند.

با کمک موتورهای جستجو، میلیاردها کاربران اینترنت اطلاعات لازم را برای خود پیدا می کنند.

یک موتور جستجو چیست؟

موتور جستجو یک مجتمع نرم افزاری و سخت افزاری است که از الگوریتم های ویژه برای پردازش مقدار زیادی اطلاعات در مورد سایت های مختلف، در مورد محتویات آنها تا هر صفحه استفاده می کند.

موتور جستجو، از نقطه نظر بازدید کنندگان ساده، چنین سایت هوشمند است که حاوی اطلاعات زیادی است و به هر درخواست کاربر پاسخ می دهد.

که در کشورهای مختلف کاربران اینترنت از موتورهای جستجوی مختلف استفاده می کنند. در بخش انگلیسی زبان انگلیسی، محبوب ترین موتور جستجوی گوگل است.

موتورهای جستجو در رونوشت

در روسیه، بیش از نیمی از کاربران سیستم جستجوی Yandex را ترجیح می دهند و گوگل حدود 35 درصد از درخواست ها را تشکیل می دهد. کاربران باقی مانده از Rambler، Mail.ru، Nigma و سایر خدمات استفاده می کنند.

در اوکراین، حدود 60 درصد از کاربران از گوگل استفاده می کنند، سهم حساب های Yandex را برای کمی بیش از 25٪ از درخواست های پردازش شده استفاده می کنند.

بنابراین، هنگام ترویج سایت ها در رونوشت، متخصصان سعی می کنند این سایت را ترویج کنند، با تمرکز بر موتورهای جستجو Yandex و Google.

وظایف موتورهای جستجو

به منظور به حداکثر رساندن دقیق به پاسخ به سوالات از بازدید کنندگان، موتورهای جستجو باید وظایف زیر را انجام دهند:

  1. به سرعت و به طور موثر جمع آوری اطلاعات در مورد صفحات مختلف از سایت های مختلف.
  2. اطلاعات پردازش در مورد این صفحات و تعیین نوع درخواست یا درخواست آنها مربوط است.
  3. به شکل و اخراج صدور جستجو در پاسخ به درخواست های کاربر

اجزای موتورهای جستجو

موتورهای جستجو پیچیده هستند بسته نرم افزاریکه شامل بلوک های اصلی زیر است:

  1. جمع آوری داده ها.
  2. نمایه سازی
  3. محاسبه
  4. اعم

این جدایی مشروط است، زیرا کار موتورهای جستجو مختلف تا حدودی متفاوت از یکدیگر است.

1. جمع آوری داده ها

در این مرحله یک چالش برای پیدا کردن اسناد جدید وجود دارد، برنامه ای برای بازدید و اسکن خود را طراحی کنید.

WebMasters باید به موتورهای جستجو در مورد ظاهر مواد جدید با استفاده از آدرس آدرس صفحه در Adducerka یا برای اطلاع از اعلام صفحات شبکه های اجتماعی داده شود.

شخصا، من استفاده می کنم راه اخیر و من فکر می کنم که این کاملا کافی است.

اظهار نظر. کمی پریشان شده و در مورد اثربخشی قرار دادن اطلاعیه ها در شبکه های اجتماعی با نرخ نمایه سازی صفحات جدید سایت.

من برای کنترل و رفع منحصر به فرد متن در صفحات Site Text.Ru استفاده می کنم.

او به طور کیفی منحصر به فرد را بررسی می کند، آن را رفع می کند و امکان ایجاد یک بنر منحصر به فرد در صفحات سایت شما فراهم می کند.

اما گاهی اوقات در این سرویس یک پردازش بزرگ وجود دارد. من چندین مورد داشتم وقتی که من انتظار یک بررسی منحصر به فرد را نداشتم، مقاله ای را در سایت گذاشتم و آن را در شبکه های اجتماعی سوار کردم.

اگر تأیید منحصر به فرد حدود یک ساعت و بیشتر به تأخیر افتاده بود، درصد ی منحصر به فرد همیشه برابر با 0٪ بود. این بدان معنی است که برای یک ساعت ناقص پس از قرار دادن، صفحه قبلا نمایه شده و در پایگاه داده موتورهای جستجو فهرست شده است.

2. شاخص سازی

موتورهای جستجو، جمع آوری داده ها در صفحات وب جدید، آنها را در پایگاه داده خود قرار دهید. در این مورد، یک شاخص شکل گرفته است، یعنی کلید برای دسترسی سریع در این صفحه، اگر چنین نیازی وجود دارد.

3. محاسبه

پس از ورود به پایگاه داده صفحه، سایت های ما مرحله محاسبه پارامترها و شاخص های مختلف را محاسبه می کنند.

چند نفر از این شاخص ها و چگونگی محاسبه دقیقا، به جز توسعه دهندگان الگوریتم های موتورهای جستجو، هیچ کس نمی تواند باشد.

4. رتبه بندی

سپس، بر اساس پارامترهای محاسبه شده و شاخص ها، تعیین می شود که ارتباط صفحه با این درخواست ها و رتبه بندی این صفحه تعیین شود.

این امر برای شکل گیری سریع و کیفی صفحه نتایج جستجو در این درخواست ها مهم خواهد بود.

موتورهای جستجو به درخواست های کاربر پاسخ می دهند و نتایج را برای آنها به عنوان یک صفحه نتایج جستجو ایجاد می کنند.

لازم به ذکر است که الگوریتم های پردازش داده ها در صفحات، شکل گیری شاخص ها و روش های رتبه بندی به طور مداوم بهبود می یابند. اولویت های تغییر برای رتبه بندی.
موتورهای جستجو به دنبال پاسخ به درخواست های کاربر به طور دقیق با تلاش برای توجه به ماهیت درخواست، منافع یک کاربر خاص، محل اقامت، سن، جنسیت، عادات، تمایز.

به منظور موفقیت به رهبری و توسعه وبلاگ خود، ابتدا باید بدانیم، و با چه الگوریتم هایی که آنها کار می کنند. درک روشنی از پاسخ به این سوالات به ما اجازه می دهد تا وظایف ترویج سایت ها را در موتورهای جستجو حل کنیم. اما بهینه سازی موتور جستجو از سایت ها هنوز پیش رو است، اما در حال حاضر چند نظریه موتورهای جستجو است.

موتورهای جستجو اینترنتی چیست؟

اگر به ویکی پدیا تبدیل شوید، این چیزی است که ما یاد می گیریم:

"موتور جستجو یک مجتمع نرم افزاری و سخت افزاری با یک رابط وب است که توانایی جستجو برای اطلاعات در اینترنت را فراهم می کند."

و در حال حاضر در زبان قابل فهم ما. فرض کنید ما فورا به اطلاعات مربوط به یک موضوع خاص نیاز داریم. به منظور اینکه ما به سرعت آن را پیدا کنیم و موتورهای جستجو را ایجاد کنیم - سایت هایی که وارد فرم پرس و جو جستجو در فرم جستجو می شوند، ما لیستی از سایت هایی را خواهیم داشت که با احتمال زیادی، ما آنچه را که دنبال می کنیم پیدا خواهیم کرد. این لیست نتایج جستجو نامیده می شود. این ممکن است شامل میلیون ها صفحه از 10 سایت در هر یک باشد. وظیفه اصلی وب مستر، حداقل ده نفر را دریافت می کند.

به یاد بیاورید زمانی که شما یا به دنبال شبکه هستید، معمولا آن را در صفحه اول شماره، به ندرت به دوم و حتی بیشتر به بعد برای بعدی بروید. بنابراین، سایت بالاتر این سایت را اشغال می کند، بازدید کنندگان بیشتر به صفحات خود وارد خواهند شد. و ترافیک بزرگ (تعداد بازدید کنندگان در روز)، از جمله امکان خوب است.

چگونه موتورهای جستجو اینترنت اطلاعاتی را در اینترنت پیدا می کنند و چه اصل مکان را در نتایج جستجو توزیع می کند؟

در چند کلمه، موتور موتور جستجو - این یک کل وب است که در آن ربات های عنکبوت به طور مداوم شبکه را اسکن می کنند و تمام متون وارد اینترنت را به یاد می آورند. تجزیه و تحلیل داده ها به دست آمده، موتورهای جستجو اسناد را که مناسب ترین پرس و جو جستجو را انتخاب می کنند انتخاب می کنند، به عنوان مثال مربوطه، که از آن انتشار جستجو تشکیل شده است.

جالب ترین چیز این است که موتورهای جستجو نمی دانند چگونه خواندن. پس چگونه اطلاعات را پیدا می کنند؟ الگوریتم های موتور جستجو به چندین اصل اساسی کاهش می یابد. آنها، اول از همه، توجه به عنوان و شرح مقاله، سرفصل های پاراگراف، تخلیه معنایی در متن و تراکم کلید واژه هااین باید لزوما با موضوع مقاله مطابقت داشته باشد. دقیق تر، این یک مکاتبات است، سایت بالاتر سایت خواهد بود. علاوه بر این، مقدار اطلاعات و بسیاری از عوامل بیشتر مورد توجه قرار گرفته است. به عنوان مثال، اقتدار یک منبع وب، بسته به تعداد و اقتدار سایت هایی که به آن اشاره دارد. قدرت بیشتر، بالاتر در استرداد.

مجموعه ای از اقدامات با هدف بالا بردن موقعیت های سایت در نتایج جستجو برای درخواست های خاص نامیده می شود بهینه سازی موتور جستجو. در حال حاضر یک علم کامل است -. اما در مورد این بعد.

در حال حاضر بسیاری از موتورهای جستجو در جهان وجود دارد. نام محبوب ترین در غرب، این است: گوگل، بینگ و یاهو. در Ratet - Yandex، Mail.ru، Rambler و Nigma. اساسا، کاربران ترجیح می دهند رهبر جهان، و سیستم Yandex تبدیل شده است محبوب ترین در اینترنت روسی زبان.

یک داستان کوچک گوگل در سال 1997 توسط ترک از مسکو ایجاد شد سرگئی بروم و دوست او آمریکایی است لری صفحه در طول تحصیلات خود در دانشگاه استنفورد.

ویژگی گوگل تبدیل شد که در موقعیت اول در جستجوی استرداد نمایش داده شد، نتایج مربوط به جستجوی مربوط به یک دنباله منطقی را نشان داد، در حالی که موتورهای جستجو باقیمانده در مقایسه ساده از کلمات در یک پرس و جو با کلمات در یک صفحه وب مشغول به کار شدند .

در 23 سپتامبر همان سال، سیستم Yandex اعلام شد که از سال 2000 به عنوان یک شرکت جداگانه Yandex آغاز شد.

من بیشتر تایر نخواهم داشت، امیدوارم اکنون کمی روشن شود موتورهای جستجو اینترنتی چیست؟. لازم به ذکر است که الگوریتم های موتور جستجو به طور مداوم در حال توسعه هستند. هر روز، موتورهای جستجو همه بهتر است تعیین نیازهای کاربران و نشان دادن آنها در استرداد اطلاعات مربوطه بر اساس عوامل متعدد (منطقه، که درخواست کاربر قبلا درخواست کرده است، کدام سایت ها در طول فرایند جستجو که به او منتقل شد، بازدید کرد آنها، و غیره).

به زودی Google و Yandex بهتر خواهند بود که ما را بدانیم و آنچه ما در مورد آن فکر می کنیم.

معماری موتور جستجو معمولا شامل موارد زیر است:

دایره المعارف یوتیوب

    1 / 5

    ✪ درس 3: چگونه موتور جستجو کار می کند. مقدمه ای بر جستجوگرها

    ✪ موتور جستجو از داخل

    ✪ Shodan - سیاه گوگل

    ✪ موتور جستجوی CheburaShka \u200b\u200bجایگزین گوگل و Yandex در روسیه خواهد شد

    ✪ درس 1 - چگونه موتور جستجو مرتب شده است

    زیرنویس

تاریخ

دوره شناسی
سال سیستم رویداد
1993 w3catalog؟! در حال اجرا
aliweb در حال اجرا
jumpstation. در حال اجرا
1994 WebCrawler در حال اجرا
Infoseek در حال اجرا
lycos در حال اجرا
1995 Altavista در حال اجرا
داوم پایه
متن باز فهرست وب سایت در حال اجرا
ماژلان در حال اجرا
تحریک کردن در حال اجرا
ساقه در حال اجرا
یاهو در حال اجرا
1996 dogpile در حال اجرا
inktomi پایه
رامبلر پایه
hotbot پایه
از Jeeves بپرسید پایه
1997 نور شمالی در حال اجرا
یاندکس در حال اجرا
1998 گوگل در حال اجرا
1999 AllthereWeb. در حال اجرا
جنکن ها پایه
نایب در حال اجرا
تئوم پایه
vivisimo پایه
2000 بایو پایه
exalead پایه
2003 info.com در حال اجرا
2004 یاهو جستجو کردن. راه اندازی نهایی
A9.com در حال اجرا
sogou در حال اجرا
2005 جستجو MSN راه اندازی نهایی
ask.com در حال اجرا
نیگما در حال اجرا
کالاهای جستجو در حال اجرا
جستجو کردن پایه
2006 ویکیک پایه
quaero پایه
جستجو زنده در حال اجرا
چاچا اجرای (بتا)
guruji.com اجرای (بتا)
2007 ویکیک در حال اجرا
sproose در حال اجرا
جستجوی ویکیا در حال اجرا
blackle.com در حال اجرا
2008 گودال در حال اجرا
توبی در حال اجرا
picollator در حال اجرا
Viewzi. در حال اجرا
cuil در حال اجرا
بوگامی در حال اجرا
جهش ماهی اجرای (بتا)
جنگل در حال اجرا
vadlo در حال اجرا
powerset در حال اجرا
2009 بینگ در حال اجرا
kaz.kz. در حال اجرا
yebol اجرای (بتا)
mugurdy بستن
دیده بانی. در حال اجرا
2010 cuil بستن
Blekko. اجرای (بتا)
Viewzi. بستن
2012 wazzub در حال اجرا
2014 ماهواره اجرای (بتا)

در مرحله اولیه توسعه اینترنت Tim Berners-Lee یک لیست از سرورهای وب ارسال شده در وب سایت CERN را پشتیبانی کرد. سایت ها بیشتر و بیشتر شد و به صورت دستی چنین فهرستی را حفظ کرد، پیچیده تر شد. وب سایت NCSA بخش خاصی بود "چی تازه!" (انگلیسی چه جدید!)، جایی که آنها لینک ها را به سایت های جدید منتشر کردند.

اولین برنامه کامپیوتری برای جستجو در اینترنت یک برنامه وجود داشت قبیله (Eng. Archie - بایگانی بدون نامه "B"). این در سال 1990 توسط آلن پخت، بیل پاشنه (بیل هلان) و جی پیتر دویچ (جی پیتر دویچ)، دانشجویان تحصیل در دانشگاه مک گیل در مونترال ایجاد شد. این برنامه لیست های تمام فایل ها را از تمام سرورهای FTP ناشناس در دسترس دانلود کرده و پایگاه داده ای را که در آن شما می توانید با نام فایل ها جستجو کنید، تهیه کنید. با این حال، برنامه Archie محتویات این فایل ها را فهرست نمی کند، زیرا حجم داده ها خیلی کوچک بود که همه چیز را می توان به راحتی به صورت دستی یافت.

توسعه و توزیع پروتکل شبکه گافر، که در سال 1991 توسط مارک مک کلایل اختراع شد (Mark McCahill) در دانشگاه مینه سوتا، منجر به ایجاد دو برنامه جستجوی جدید شد ورونیکا و jughead مانند Archi، آنها به دنبال نام فایل ها و سرفصل های ذخیره شده در سیستم های شاخص Gopher بودند. ورونیکا (مهندس شاخص خالص خالص جوندگان بسیار آسان به آرشیو کامپیوتری) مجاز به جستجو توسط کلمات کلیدی بسیاری از هدر های منو Gopher در تمام لیست های Gopher. برنامه Jughead (Eng. Jonzy "سلسله مراتب گوزن جهانی") اطلاعات منو را از سرورهای خاص Gopher استخراج کردم. اگر چه نام موتور جستجو Archie رابطه ای با چرخه کمیک نداشت "Archie"با این وجود، ورونیکا و jughead شخصیت های این کمیک هستند.

تا تابستان سال 1993، یک سیستم واحد برای جستجوی وب وجود نداشت، هرچند چندین دایرکتوری تخصصی پشتیبانی شده به صورت دستی پشتیبانی می شد. اسکار نیرستراس (اسکار نیرستراسز) در دانشگاه ژنو تعدادی از سناریوها را در پرل نوشت، که به طور دوره ای این صفحات را کپی کرده و آنها را بازنویسی کرد فرمت استاندارد. این پایه بود w3catalog؟!، اولین سیستم جستجوی ابتدایی شبکه، در تاریخ 2 سپتامبر 1993 راه اندازی شد.

احتمالا اولین ربات جستجو در زبان پرل نوشته شده است "Wanderer Wide Wide Wide" - Matthew Gray (Matthew Gray) از ژوئن 1993. این ربات شاخص جستجو "Wandex" را ایجاد کرد. هدف ربات سرگردان برای اندازه گیری اندازه بود وب جهانی و پیدا کردن تمام صفحات وب حاوی کلمات از پرس و جو. در سال 1993، موتور جستجوی دوم "Aliweb" ظاهر شد. AliWeb از ربات جستجو استفاده نمی کرد، بلکه به جای آن، اطلاعیه ها را از مدیران وب سایت در مورد حضور یک فایل شاخص در سایت های خود در یک فرمت خاص انتظار داشتم.

jumpstation.ایجاد شده در دسامبر 1993 توسط جاناتان فلچر، به دنبال یک صفحه وب و ایجاد شاخص های خود را با استفاده از یک ربات جستجو، و از یک فرم وب به عنوان یک رابط برای فرمول پرسش های جستجو استفاده کرد. این اولین ابزار جستجوی آنلاین بود که ترکیبی از سه مهمترین توابع موتور جستجو (بررسی، نمایه سازی و جستجوی واقعی) را ترکیب کرد. با توجه به منابع محدودی از رایانه های آن زمان، شاخص سازی و بنابراین، جستجو تنها توسط نام و سرصفحه صفحات وب توسط ربات جستجو محدود شده است.

موتورهای جستجو در "حباب Dotcomms" از اواخر دهه 1990 شرکت کردند. چندین شرکت به طور موثر وارد بازار شدند و در طی پیشنهاد عمومی خود درآمد کسب کردند. برخی از بازار موتورهای جستجوی عمومی را رها کردند و به عنوان مثال، تنها با بخش شرکت های بزرگ کار کردند نور شمالی.

گوگل ایده فروش کلمات کلیدی در سال 1998 را تعیین کرد، سپس یک شرکت کوچک بود که کار موتور جستجو را در Goto.com تضمین کرد. این مرحله برای انتقال موتورهای جستجو از رقابت با یکدیگر به یکی از سودآور ترین شرکت های تجاری در اینترنت مشخص شده است. موتورهای جستجو شروع به فروش اولین مکان ها در نتایج جستجو به شرکت های فردی کردند.

موتور جستجوی گوگل از ابتدای سال 2000 موقعیت برجسته ای دارد. این شرکت به دلیل نتایج جستجوی خوب با استفاده از الگوریتم PageRank موقعیت بالایی را به دست آورده است. الگوریتم به صورت عمومی در مقاله "آناتومی موتور جستجو" ارسال شد، نوشته شده توسط سرگئی برین و لری صفحه، بنیانگذاران گوگل. این الگوریتم تکراری صفحات وب را بر اساس ارزیابی تعداد لینک ها در صفحه وب تحت این فرض قرار می دهد که صفحات "خوب" و "مهم" به بیش از دیگران اشاره دارد. رابط Google در سبک اسپارتان طراحی شده است که بر خلاف بسیاری از رقبای خود که موتور جستجو را در یک پورتال وب جاسازی کرده اند، هیچ چیز اضافی وجود ندارد. موتور جستجوی گوگل بسیار محبوب شده است که تقلید سیستم به نظر می رسد، به عنوان مثال، جستجوگر رمز و راز(موتور جستجو مخفی).

جستجو برای اطلاعات در روسیه

در سال 1996، جستجو با توجه به مورفولوژی روسیه در موتور جستجوی Altavista اجرا شد و روسیه اصلی راه اندازی شد موتورهای جستجو Rambler و Aport. در 23 سپتامبر 1997، موتور جستجو Yandex باز شد. در 22 مه 2014، Rostelecom توسط موتور جستجوی ماهواره ای ملی باز شد، که در آن زمان 2015 در آزمایش بتا است. 2015 آوریل 2015 باز شد خدمات جدید ماهواره کودکان به طور خاص برای کودکان با امنیت پیشرفته.

روش های تجزیه و تحلیل خوشه ای و جستجو برای متادیتا محبوبیت زیادی دریافت کرد. از اتومبیل های بین المللی چنین برنامه ای، بزرگترین شهرت دریافت شده است "خوشتی" شرکت vivisimo. در سال 2005، موتور جستجوی نیگما حمایت از خوشه بندی اتوماتیک در روسیه با حمایت دانشگاه ایالتی مسکو راه اندازی شد. در سال 2006، Metamoshin Quintura روسیه باز کرد، خوشه بندی بصری را به شکل ابرهای برچسب ارائه کرد. نایگما همچنین با خوشه بندی بصری آزمایش کرد.

چگونه موتور جستجو کار می کند

اجزای اصلی موتور جستجو: ربات جستجو، Indexer، موتور جستجو.

به عنوان یک قانون، سیستم ها در مراحل کار می کنند. اول، ربات جستجو محتوا را دریافت می کند، سپس Indexer یک شاخص موجود برای جستجوی شاخص را تولید می کند و در نهایت، موتور جستجو عملکرد را برای جستجوی داده های نمایه ارائه می دهد. برای به روز رسانی موتور جستجو، این چرخه نمایه سازی دوباره استفاده می شود.

موتورهای جستجو کار می کنند، ذخیره اطلاعات در مورد بسیاری از صفحات وب که از صفحات HTML دریافت می کنند. ربات جستجو یا "خزنده" (Eng. Crawler) - یک برنامه که به طور خودکار از طریق تمام لینک های موجود در صفحه عبور می کند و آنها را برجسته می کند. Crowler، بر اساس منابع یا بر اساس یک لیست آدرس از پیش تعیین شده، جستجو برای اسناد جدید که هنوز به موتور جستجو شناخته نشده است. صاحب سایت می تواند صفحات خاصی را با استفاده از robots.txt حذف کند که با استفاده از آن شما می توانید فایل های نمایه سازی، صفحات یا دایرکتوری های سایت را ممنوع کنید.

موتور جستجو محتوای هر صفحه را برای نمایه سازی بیشتر تحلیل می کند. واژه ها را می توان از سرفصل ها، متن صفحه یا زمینه های خاص استخراج کرد. Indexer یک ماژول است که صفحه را تجزیه و تحلیل می کند، که قبلا با استفاده از الگوریتم های واژگانی و مورفولوژیکی خود شکسته شده است. تمام عناصر صفحه وب به طور جداگانه گسترش یافته و تجزیه و تحلیل می شوند. داده های وب صفحات در پایگاه داده فهرست برای استفاده در درخواست های بعدی ذخیره می شوند. این شاخص به شما اجازه می دهد تا به سرعت اطلاعات مربوط به درخواست کاربر را پیدا کنید. تعدادی از موتورهای جستجو شبیه به فروشگاه Google صفحه اصلی کل یا بخشی از آن، به اصطلاح حافظه پنهان نیز هست اطلاعات مختلف درباره صفحه وب سیستم های دیگر مشابه AltaVista هر کلمه ای از هر صفحه یافت می شوند. استفاده از حافظه پنهان کمک می کند تا سرعت استخراج اطلاعات را از صفحات بازدید شده در حال حاضر افزایش دهد. صفحات ذخیره شده همیشه حاوی متن است که کاربر در آن پرسید درخواست جستجو. این می تواند مفید باشد زمانی که صفحه وب به روز شده است، یعنی دیگر متن درخواست کاربر را شامل نمی شود و صفحه در حافظه پنهان قدیمی است. این وضعیت با از دست دادن لینک ها همراه است (ENG. linkrot) و دوستانه به کاربر (قابلیت استفاده) Google رویکرد. این بدان معنی است که صدور قطعات متن کوتاه از حافظه پنهان حاوی متن پرس و جو است. اصل کوچکترین تعجب معتبر است، کاربر معمولا انتظار دارد که کلمات مورد نظر را در متون صفحات به دست آمده ( گزینه های کاربر) علاوه بر این، استفاده از صفحات ذخیره شده، جستجو را تسریع می کند، صفحات حافظه پنهان ممکن است حاوی اطلاعاتی باشند که دیگر در دسترس نیست.

موتور جستجو با فایل های خروجی به دست آمده از Indexer کار می کند. موتور جستجو درخواست های کاربر را می گیرد، آنها را با استفاده از یک شاخص پردازش می کند و نتایج جستجو را باز می گرداند.

هنگامی که یک کاربر وارد یک پرس و جو موتور جستجو (معمولا با استفاده از کلمات کلیدی)، سیستم بررسی شاخص خود را و لیستی از مناسب ترین صفحات وب (مرتب شده بر اساس هر معیار)، معمولا با حاشیه نویسی کوتاه حاوی یک هدر سند و گاهی اوقات بخشی از متن شاخص جستجو بر اساس یک روش خاص بر اساس اطلاعاتی که از صفحات وب بازیابی شده است، بر اساس یک روش خاص است. از سال 2007، موتور جستجوی گوگل اجازه می دهد تا شما را به جستجو برای زمان، ایجاد اسناد دلخواه (فراخوانی منو ابزار جستجو و جهت محدوده زمانی). اکثر موتورهای جستجو از استفاده از اپراتورهای بولین در پرس و جو ها پشتیبانی می کنند و نه، نه، که به شما اجازه می دهد لیست کلمات کلیدی مورد نظر را روشن یا گسترش دهید. در این مورد، سیستم دقیقا همانطور که معرفی شد، کلمات یا عبارات را جستجو می کند. برخی از موتورهای جستجو این فرصت را دارند جستجوی تقریبیدر این مورد، کاربران منطقه جستجو را گسترش می دهند، مشخص کردن فاصله به کلمات کلیدی. نیز وجود دارد جستجوی مفهومیکه از تجزیه و تحلیل آماری از استفاده از کلمات و عبارات دلخواه در متون صفحات وب استفاده می کند. این سیستم ها امکان پذیر است که پرس و جو ها را در زبان طبیعی کامپایل کنند. یک مثال از چنین موتور جستجو از وب سایت COM میپرسد.

سودمندی موتور جستجو بستگی به ارتباط صفحات موجود توسط آن دارد. حداقل میلیون ها صفحات وب و ممکن است شامل یک کلمه یا عبارت خاص باشد، اما بعضی از آنها می توانند بیشتر مورد توجه، محبوب یا معتبر تر از دیگران باشند. اکثر موتورهای جستجو از روش های رتبه بندی برای بازنشستگی لیست "بهترین" استفاده می کنند. موتورهای جستجو تصمیم می گیرند کدام صفحات مربوط به آن هستند، و در چه نظم باید به روش های مختلف نشان داده شود. روش های جستجو، و همچنین اینترنت خود را در طول زمان تغییر دهید. بنابراین دو نوع اصلی از موتورهای جستجو ظاهر شد: سیستم کلمات کلیدی از پیش تعریف شده و سلسله مراتبی و سلسله مراتبی که در آن یک شاخص معکوس بر اساس تجزیه و تحلیل متن تولید می شود.

اکثر موتورهای جستجو شرکت های تجاری هستند که به هزینه تبلیغات سود می برند، در برخی از موتورهای جستجو، شما می توانید اولین مکان ها را در هزینه های اضافی برای کلمات کلیدی مشخص خریداری کنید. کسانی که موتورهای جستجو را برای این روش برای صدور نتایج پول نمی گیرند، کسب درآمد تبلیغات متنیدر همان زمان پیام های تبلیغاتی مطابق با درخواست کاربر است. چنین تبلیغاتی در صفحه با لیستی از نتایج جستجو نمایش داده می شود و موتورهای جستجو با هر کاربر با کلیک بر روی پیام های تبلیغاتی کسب می کنند.

انواع موتورهای جستجو

چهار نوع موتورهای جستجو وجود دارد: با روبات های جستجو، مدیریت شده توسط انسان، هیبرید و متا سیستم ها.

  • سیستم ها با استفاده از روبات های جستجو
شامل سه بخش است: Krauller ("ربات"، "ربات" یا "عنکبوت")، موتور جستجو و موتور جستجو. Crowler برای جلوگیری از شبکه و ایجاد صفحات وب مورد نیاز است. فهرست - یک آرشیو بزرگ از کپی صفحات وب. هدف نرم افزار - نتایج جستجو را ارزیابی کنید. با توجه به این واقعیت که ربات جستجو در این مکانیزم به طور مداوم شبکه را بررسی می کند، اطلاعات بیشتر مرتبط است. اکثر موتورهای جستجوی مدرن سیستم های این نوع هستند.
  • man-driven (کاتالوگ منابع)
این موتورهای جستجو لیست صفحات وب را دریافت می کنند. دایرکتوری حاوی آدرس، عنوان و شرح مختصری از سایت است. دایرکتوری منابع به دنبال نتایج تنها از توصیف صفحه ارائه شده توسط آن توسط Webmasters است. مزیت دایرکتوری ها این است که تمام منابع به صورت دستی بررسی می شوند، بنابراین کیفیت محتوای نسبت به نتایج حاصل از سیستم نوع اول به طور خودکار بهتر می شود. اما همچنین یک معایب وجود دارد - به روز رسانی این دایرکتوری ها به صورت دستی انجام می شود و می تواند به طور قابل ملاحظه ای پشت وضعیت واقعی امور باشد. رتبه بندی صفحه نمی تواند فورا تغییر کند به عنوان نمونه هایی از چنین سیستم هایی، می توانید به ارمغان بیاورید کاتالوگ یاهو ، DMOZ و کهکشان.
  • سیستم های هیبریدی
چنین موتورهای جستجو مانند یاهو، Google، MSN توابع سیستم ها را با استفاده از روبات های جستجو ترکیب می کنند و سیستم های مدیریت شده توسط انسان را مدیریت می کنند.
  • سیستم متا
سیستم های Metapoisk ترکیب و رتبه بندی چندین موتورهای جستجو را در یک بار. این موتورهای جستجو مفید بود زمانی که هر موتور جستجو شده است شاخص منحصر به فرد، و موتورهای جستجو کمتر "هوشمند" بودند. از آنجایی که جستجو بسیار بهبود یافته است، نیاز به آنها کاهش یافته است. مثال ها: metacrawler و جستجوی MSN

بازار موتور جستجو

گوگل محبوب ترین موتور جستجو در جهان با سهم بازار 68.69٪ است. بینگ موقعیت دوم را می گیرد، سهم آن 12.26٪ است.

محبوب ترین موتورهای جستجو در جهان:

سیستم جستجو سهم بازار در ژوئیه 2014 سهم بازار در اکتبر 2014 سهم بازار در سپتامبر 2015
گوگل 68,69 % 58,01 % 69,24%
بایو 17,17 % 29,06 % 6,48%
بینگ 6,22 % 8,01 % 12,26%
یاهو 6,74 % 4,01 % 9,19%
aol 0,13 % 0,21 % 1,11%
تحریک کردن 0,22 % 0,00 % 0,00 %
پرسیدن. 0,13 % 0,10 % 0,24%

آسیا

در کشورهای آسیای شرقی و در روسیه، گوگل موتور جستجوی محبوب ترین نیست. به عنوان مثال، در چین، محبوب تر است موتور جستجو SOSO؟!.

حدود 70 درصد از ساکنان یاهو در کره جنوبی توسط پورتال جستجو از توسعه خود استفاده می کنند ژاپن و یاهو تایوان - بسیار سیستم های محبوب به ترتیب در ژاپن و تایوان جستجو کنید.

روسیه و موتورهای جستجو روسی و روسی

به گفته LiveInternet در ماه ژوئن 2015 در پوشش از پرس و جوهای جستجوی روسی زبان:

  • همه صحبت کردن:
    • یاهو (0.1٪) و متعلق به این شرکت های جستجو شرکت: inktomi، Altavista، AllthereWeb.
  • انگلیسی زبان و بین المللی:
    • askjeeves. (مکانیسم تئوم)
  • روسی زبان - بیشتر "بیشتر" موتورهای جستجوگر جستجو در روسیه و به دنبال متون در بسیاری از زبانها - اوکراین، بلاروس، انگلیسی، تاتار و دیگران است. آنها از سیستم های "همه صحبت کردن" نشان می دهند که تمام اسناد را در یک ردیف نشان می دهند، این واقعیت که، به طور عمده، منابع واقع در مناطق دامنه نمایه می شوند، جایی که زبان روسی غالب می شود، و یا سایر روش ها روبات های خود را با سایت های روسی زبان محدود می کنند.

برخی از موتورهای جستجو از الگوریتم های جستجوی خارجی استفاده می کنند.

داده های کمی از موتور جستجوی گوگل

تعداد کاربران اینترنت و موتورهای جستجو و نیازهای کاربر برای این سیستم ها به طور مداوم در حال رشد است. برای افزایش سرعت جستجو برای اطلاعات مورد نظر، موتورهای جستجو بزرگ شامل تعداد زیادی از سرورها هستند. سرورها معمولا به مراکز سرور (مراکز داده) گروه بندی می شوند. موتورهای جستجو محبوب، مراکز سرور در سراسر جهان پراکنده می شوند.

در اکتبر 2012، گوگل این پروژه را "جایی که اینترنت زندگی می کند" راه اندازی کرد، جایی که کاربران فرصت را برای آشنا شدن با مراکز پردازش این شرکت آشنا می کنند.

درباره کار مراکز جستجو جستجو سیستم گوگل زیر شناخته شده است:

  • کل قدرت کلیه مراکز داده Google، تا سال 2011، در 220 مگاوات تخمین زده شد.
  • هنگامی که در سال 2008، گوگل برنامه ریزی کرد تا یک مجتمع جدید در اورگان را باز کند، متشکل از سه ساختمان با مساحت 6.5 میلیون متر مربع، در مجله مجله هارپر محاسبه شده است که چنین پیچیده ای از انرژی بیش از 100 مگاوات برق مصرف می کند قابل مقایسه با مصرف انرژی شهر با جمعیت 300000 انسان است.
  • تعداد تقریبی سرورهای Google در سال 2012 1،000،000 است.
  • هزینه های گوگل در مراکز داده به مبلغ 1.9 میلیارد دلار در سال 2006 و در سال 2007 - 2.4 میلیارد دلار بود.

اندازه هفته جهانی، یک گوگل نمایه شده برای دسامبر 2014، حدود 4.36 میلیارد صفحه است.

موتورهای جستجو با توجه به ممنوعیت های مذهبی

گسترش جهانی اینترنت و افزایش محبوبیت لوازم برقی به ویژه در جهان عربی و مسلمان، به ویژه در کشورهای خاورمیانه و شبه قاره هند، به توسعه موتورهای جستجوی محلی کمک کرد که سنت های اسلامی را در نظر گرفتند. چنین موتورهای جستجو شامل فیلترهای ویژه ای هستند که به کاربران کمک نمی کند تا سایت های ممنوعه را وارد کنند، مانند سایت هایی با پورنوگرافی، و به آنها اجازه می دهند از آن سایت هایی استفاده کنند که محتویات آنها بر خلاف ایمان اسلامی نیست. مدت کوتاهی قبل از ماه مسلمان ماه رمضان، در ژوئیه 2013، جهان ارائه شد هارلاگوگلینگ - یک سیستم که کاربران را فقط به لینک های "حق" Freebies می دهد، فیلتر کردن نتایج جستجو به دست آمده از سایر موتورهای جستجو مانند Google و Bing. دو سال پیش، در سپتامبر 2011، موتور جستجو Ialalal راه اندازی شد، طراحی شده برای خدمت به کاربران خاورمیانه. با این حال، این خدمات جستجو به دلیل عدم تامین مالی، من مجبور شدم به زودی بسته شود.

فقدان سرمایه گذاری و سرعت آهسته فناوری های گسترش در جهان اسلام مانع پیشرفت شد و مانع موفقیت یک موتور جستجوی جدی اسلامی شد. شکست آشکار سرمایه گذاری های بزرگ در پروژه های وب شیوه زندگی مسلمان، یکی از آنها بود ماوسلر. او میلیون ها دلار از سرمایه گذاران، مانند سرمایه گذاران اینترنتی را دریافت کرد، و در حال حاضر - مطابق با آخرین پیام از Ialalal قبل از آنکه بسته شود، با یک ایده مشکوک که "فیس بوک بعدی یا گوگل فقط در آن ظاهر می شود، خارج می شود کشورهای خاورمیانه، اگر از جوانان درخشان ما حمایت می کنید. " با این وجود، کارشناسان اینترنت اسلامی در تعریف آنچه که مسابقات و یا مطابقت با شریعت را مطابقت می دهند، مشغول به کار نیستند و وب سایت ها را به عنوان "حلال" یا "هارم" طبقه بندی می کنند. تمام موتورهای جستجوی سابق و واقعی اسلام به سادگی به طور خاص مجموعه داده های نمایه شده هستند یا موتورهای جستجوی اصلی مانند Google، Yahoo و Bing، با یک سیستم فیلتر کردن خاص است که از کاربران برای دسترسی به سایت های حرم استفاده می کند، مانند سایت های مربوط به ارتفاع LGBT، قمار و هر گونه دیگر، موضوع آن ضد اسلامی است.

در میان دیگر موتورهای جستجوی مذهبی، یک یهودی مشترک هستند - نسخه یهودی Google و SeekFind.org - یک سایت مسیحی که شامل فیلترهایی است که از کاربران محافظت می کند که می توانند ایمان خود را تضعیف یا تضعیف کنند.

نتایج شخصی و حباب های فیلتر

بسیاری از موتورهای جستجو مانند Google و Bing از الگوریتم های حدس زدن انتخابی از اطلاعاتی که کاربر می خواهند بر اساس اقدامات گذشته خود در سیستم می خواهند استفاده کنند. به عنوان یک نتیجه، وب سایت ها تنها اطلاعاتی را نشان می دهند که با منافع گذشته کاربر سازگار است. این اثر "حباب فیلترها" نامیده شد.

همه اینها به این واقعیت منجر می شود که کاربران بر خلاف دیدگاه اطلاعات خود بسیار کمتر هستند و به صورت ذاتی در "حباب اطلاعاتی" خود جدا می شوند. بنابراین، "اثر حباب" می تواند پیامدهای منفی برای تشکیل افکار مدنی داشته باشد.

موتورهای جستجو تعصب

با وجود این واقعیت که موتورهای جستجو برای ارزیابی وب سایت ها بر اساس برخی از ترکیبات محبوبیت و ارتباط آنها برنامه ریزی شده اند، در واقع، مطالعات تجربی نشان می دهد که عوامل سیاسی، اقتصادی و اجتماعی مختلف بر صدور جستجو تاثیر می گذارد.

چنین تعصب می تواند نتیجه مستقیم فرایندهای اقتصادی و تجاری باشد: شرکت هایی که در موتور جستجو تبلیغ می شوند می توانند در نتایج جستجوی معمول در آن محبوب تر شوند. حذف نتایج جستجو که قوانین محلی را برآورده نمی کند، نمونه ای از نفوذ فرایندهای سیاسی است. به عنوان مثال، گوگل برخی از وب سایت های نئو نازی را در فرانسه و آلمان نمایش نمی دهد، جایی که انکار هولوکاست غیرقانونی است.

تعصب نیز ممکن است نتیجه فرایندهای اجتماعی باشد، زیرا الگوریتم های موتور جستجو اغلب برای از بین بردن دیدگاه های غیر فرمت به نفع نتایج "محبوب" بیشتر توسعه می یابند. الگوریتم های نمایه سازی موتورهای اصلی اصلی به سایت های آمریکایی اولویت می دهند.

جستجو بمب - یک مثال از تلاش برای مدیریت نتایج جستجو برای دلایل سیاسی، اجتماعی یا تجاری.

همچنین ببینید

  • qwika
  • کتابخانه الکترونیکی # لیست لیست ها و موتورهای جستجو
  • نوار ابزار توسعه دهنده وب

یادداشت

ادبیات

  • Ashmanov I. S.، Ivanov A. A. ارتقاء سایت در موتورهای جستجو. - M: ویلیامز، 2007. - 304 پ. - ISBN 978-5-8459-1155-1.
  • Baikov v.D. اینترنت. جستجو برای اطلاعات ارتقاء وب سایت - سنت پترزبورگ. : BHV-Petersburg، 2000. - 288 پ. - ISBN 5-8206-0095-9.
  • Kolisnichenko D. N. موتورهای جستجو و ارتقاء وب سایت ها در اینترنت. - M: دیالکتیک، 2007. - 272 پ. - ISBN 978-5-8459-1269-5.
  • Lande D.V. جستجو برای دانش در اینترنت. - متر: دیالکتیک، 2005. - 272 پ. - ISBN 5-8459-0764-0.
  • Lande D.V.، Skarsky A. A.، Bezsessustnov I. V. اینترنت: ناوبری در شبکه های پیچیده: مدل ها و الگوریتم ها. - m: librok (urss سرمقاله)، 2009. - 264 p. - ISBN 978-5-397-00497-8.
  • چو H.، Rosenthal M.

زنگ.

کسانی هستند که این خبر را قبل از شما خوانده اند.
مشترک شدن برای دریافت مقالات تازه.
پست الکترونیک
نام
نام خانوادگی
چگونه می خواهید زنگ را بخوانید
بدون هرزنامه