DZWONEK

Są tacy, którzy czytają te wiadomości przed tobą.
Subskrybuj, aby otrzymywać świeże artykuły.
E-mail
Imię
Nazwisko
Jak chcesz przeczytać Dzwon
Bez spamu

System wyszukiwania - kompleks oprogramowania i sprzętu z interfejsem internetowym, który umożliwia wyszukiwanie informacji w Internecie.

Wszystkie wyszukiwarki łączy fakt, że znajdują się na specjalnie dedykowanych potężnych serwerach i są powiązane z wydajnymi kanałami komunikacji. Wyszukiwarki zwane także systemami wyszukiwania informacji (IPS). Liczba jednocześnie obsługiwanych osób odwiedzających najpopularniejsze systemy sięga wielu tysięcy. Najbardziej znane obsługują miliony klientów dziennie. W przypadkach, gdy wyszukiwarka oparta jest na katalogu, nazywa się to katalogiem. Opiera się na pracy moderatorów. Sercem wyszukiwarki pełnotekstowej jest automatyczne zbieranie informacji. Realizowany jest przez specjalne programy. Programy te okresowo sprawdzają zawartość wszystkich zasobów internetowych. Aby to zrobić, poruszają się lub, jak mówią, czołgają się po różnych zasobach. W związku z tym takie programy nazywane są robotami. Istnieją inne nazwy: ponieważ WWW jest skrótem wyrażenia World Wide Web, naturalne jest nazwanie takiego programu pająkiem po angielsku. - Pająk. Ostatnio używane są inne nazwy: automatyczne indeksy lub katalogi. Wszystkie te programy sprawdzają i „pobierają” informacje z różnych adresów URL. Programy określony typ odwiedź każdy zasób po pewnym czasie. Żadna wyszukiwarka nie jest w stanie zindeksować całego Internetu. Dlatego bazy danych, w których gromadzone są adresy indeksowanych zasobów, różnią się w zależności od wyszukiwarki. Niemniej jednak wielu z nich stara się, w miarę możliwości, objąć całą swoją przestrzeń w swojej pracy.

Aby wyszukać informacje za pomocą wyszukiwarki, użytkownik formułuje zapytanie wyszukiwania. Na podstawie żądania użytkownika wyszukiwarka generuje stronę wyników wyszukiwania. Takie wyniki wyszukiwania mogą łączyć różne typy plików, na przykład: strony internetowe, obrazy, pliki wideo. Niektóre wyszukiwarki pobierają również dane z internetowych katalogów zasobów i baz danych.

Według metod wyszukiwania i konserwacji podzielono cztery typy wyszukiwarek:

1. systemy wykorzystujące roboty wyszukujące.

2. systemy napędzane przez człowieka

3. Systemy hybrydowe

4. systemy meta.

Architektura systemu wyszukiwania obejmuje: robota przeszukującego strony internetowe, indeksatora zapewniającego szybkie wyszukiwanie oraz wyszukiwarkę - interfejs graficzny dla użytkownika.

Celem wyszukiwarki jest znalezienie dokumentów zawierających słowa kluczowe lub słowa, które są w jakiś sposób powiązane ze słowami kluczowymi. Wyszukiwarka jest lepsza, tym więcej dokumentów związanych z żądaniem użytkownika zwróci.

Przykłady wyszukiwarek

Google- Jeden z najbardziej kompleksowych i popularnych zagranicznych systemów IPS. Charakterystyczną cechą IPS Google jest technologia określania stopnia trafności dokumentu poprzez analizę linków z innych źródeł do tego zasobu. Im więcej linków do strony znajduje się na innych stronach, tym wyższa jest jej ocena na IPS Google. Google stosuje algorytm obliczania uprawnień PageRank. PageRank jest jednym z czynników wspierających ranking witryn w wynikach wyszukiwania. PageRank to nie jedyny, ale bardzo ważny sposób określania pozycji witryn w wynikach wyszukiwania Google. Google używa metryki PageRank stron znalezionych na żądanie, aby określić sposób wyświetlania stron użytkownikom w wynikach wyszukiwania W 2010 r. Firma rozpoczęła wyszukiwanie głosowe w Rosji. Aby przeprowadzić wyszukiwanie, musisz nacisnąć przycisk obok paska wyszukiwania w telefonie i wysłać zapytanie, telefon wyśle \u200b\u200bTwój głos na serwer, a przeglądarka wyświetli wiersz z rozpoznanym żądaniem i wynikami wyszukiwania.

Yandex - obecnie najpopularniejsza krajowa wyszukiwarka. Rozpoczął pracę w 1997 roku. Prowadzi własny katalog zasobów internetowych. Jest to również najlepsza wyszukiwarka do identyfikacji ilustracji. Wersja angielska zawiera katalog zasobów internetowych. Ma wdrożony system generowania żądań. W szczególności dozwolone jest wpisywanie recepty wyszukiwania w języku naturalnym - w tym przypadku wszystkie niezbędne rozszerzenia są wprowadzane automatycznie.

Oprócz stron HTML Yandex indeksuje dokumenty w formacie PDF (Adobe Acrobat), Rich Text Format (RTF), binarnym Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (blogi i fora).

Wyszukiwarka Mail.rurozpoczął pracę w 2007 roku. Objętość pliku indeksu na wiosnę 2009 roku wyniosła ponad 1,5 miliarda stron znajdujących się na serwerach w języku rosyjskim. Oprócz wyszukiwania tekstów system wyszukuje ilustracje i klipy wideo zamieszczane na wyspecjalizowanych rosyjskich serwerach „samozapełniających się”: Photo Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Video Mail.Ru, RuTube, Loadup, Rambler Vision i tym podobne. Gogo.ru pozwala ograniczyć wyszukiwanie do witryn komercyjnych, stron informacyjnych, a także forów i blogów. Formularz wyszukiwania zaawansowanego umożliwia także ograniczenie wyszukiwania do niektórych typów plików (PDF, DOC, XLS, PPT), lokalizacji wyszukiwanych słów w dokumencie lub określonej domeny. W listopadzie 2013 r. W Google Play Pojawiła się nowa wersja aplikacji wyszukującej Mail.Ru, która umożliwia przełączanie z ekranu głównego na dowolne sieci społecznościowe i zapewnia szybki dostęp do wyszukiwania za pomocą zdjęć, filmów i wiadomości. Aplikacja na Androida zamieniła się w mini-przeglądarkę, zaostrzoną przez skuteczne wyszukiwanie niezbędnych informacji. Narzędzie nauczyło się także rozpoznawać zapytania wyszukiwane nie przez tekst, ale przez głos. Programiści zauważają również, że stworzyli specjalny widget, który można umieścić na ekranie głównym smartfona lub tabletu w oparciu o system Google Android. Rozumie się, że spowoduje to dalsze zmniejszenie czasu poświęcanego na wyszukiwanie.

Altavista- Jedna z najstarszych wyszukiwarek jest jedną z pierwszych pod względem dokumentów - ponad 350 milionów. AltaVista pozwala na proste i zaawansowane wyszukiwanie. „Pomoc” pozwala nawet nieprzeszkolonym użytkownikom poprawnie komponować proste i złożone zapytania.

Wędrowiec- Jeden z pierwszych rosyjskich IPS, otwarty w 1996 roku. Pod koniec 2002 r. Dokonano radykalnej modernizacji, po czym Rambler ponownie wszedł do grona liderów wyszukiwania sieci. Obecnie indeks liczy około 150 milionów dokumentów. Do przygotowywania złożonych zapytań zaleca się korzystanie z trybu „Zapytanie szczegółowe”, który zapewnia wiele możliwości kompilacji wyszukiwania przy użyciu pozycji menu.

APORT. Dziś jego baza danych zawiera ponad 20 milionów dokumentów. System ma szeroki zakres możliwości wyszukiwania. APORT ma funkcję wbudowanego tłumacza, co daje użytkownikowi możliwość formułowania żądań, zarówno w języku rosyjskim, jak i języki angielskie. Ponadto APORT ma specjalne tryby wyszukiwania ilustracji i plików audio.

Wyszukiwarki najnowszej generacji indeksują wszystkie słowa na stronie internetowej lub w artykule z konferencji, podczas gdy wcześniej obszar indeksowania był zwykle ograniczony do tytułu, nagłówków, pierwszych kilku wierszy i adresu dokumentu. To znacznie ograniczyło możliwość identyfikacji materiałów na wąski temat, ponieważ wyniki wyszukiwania nie zawsze odzwierciedlały rzeczywiste dane. Eliminując tę \u200b\u200bwadę, nowoczesne wyszukiwarki stały się znacznie bardziej niezawodne niż ich poprzednicy.

Kolejną najważniejszą cechą jest ulepszenie wewnętrznego mechanizmu wyszukiwania, który wyraża się we wzroście liczby operatorów i innych elementów kompilacji zapytań. Kilka lat temu użyto tylko dwóch, co najwyżej, trzech klasycznych operatorów boolowskich: AND (i), OR (lub) i NOT (nie). Teraz w pobliżu Alta Vista są W POBLIŻU (w pobliżu, w pobliżu), aw OpenText - OBSERWOWANE PRZEZ (następnie) - niezwykle użyteczne operatory odległości, które umożliwiają określenie zapytania w maksymalnym zakresie. Wiele systemów pozwala na skrócenie terminów, ograniczenie wyszukiwania do daty utworzenia dokumentu, wyszukiwanie słów kluczowych tylko w wyznaczonych elementach stron internetowych (tytuł, nagłówki, adres e-mail itp.), A także wyszukiwanie dokładnej frazy. Najnowsze osiągnięcia pozwalają także na identyfikację plików określonego typu (na przykład grafiki lub dźwięku) i są wrażliwe na małe i wielkie litery. Wyszukiwanie danych w dowolnym języku staje się powszechne. Wszystko to umożliwia skompilowanie kolejności wyszukiwania z dużą dokładnością, co oczywiście zwiększa trafność wyników.

W tej chwili najpopularniejsze wyszukiwarki Google i Yandex, porównaj je:

    Liczba zaindeksowanych stron. Google ma 8 miliardów, a Yandex tylko 2 miliardy. To znaczy cztery razy mniej. Zwycięstwo dla Google.

    Szybkość indeksowania stron. Google indeksuje nowe strony w ciągu dnia, a Yandex może to potrwać kilka dni. Google wygrywa ponownie.

    Istotność wydania. Trafność odnosi się do trafności wyników wyświetlanych na stronie wyszukiwarki do Twojego żądania. Muszę od razu powiedzieć, że trudno jest tutaj określić zwycięzcę. Google pokazał dobre wyniki w zagranicznym segmencie Internetu, ale w RuNet Yandex zawsze był trochę przed nami.

    Dodatkowe usługi internetowe. Tutaj przewaga jest zdecydowanie dla Yandex. Ma dziesiątki różnych usług, które są wygodnie pogrupowane w kategorie, podczas gdy Google ma mniej, a także integracja z portalami społecznościowymi sieć google+, których wielu nie lubi.

Witajcie drodzy czytelnicy! Jestem Ekaterina Kalmykova. Dzisiejszy artykuł zostanie poświęcony takiej koncepcji, jak wyszukiwarka, co to jest i do czego służy. Rozważymy również szczegółowo odmiany wyszukiwarek w Internecie.

Jeśli masz pytanie: „Dlaczego powinienem wiedzieć o tych wyszukiwarkach?”, Odpowiem w ten sposób. Kiedy jesz pyszną zupę w restauracji, czy chcesz wiedzieć, jakie składniki przygotowuje się samodzielnie w domu? W końcu, jeśli jesteś zadowolony z efektu końcowego, czyli smaku zupy, to na pewno byłbyś zainteresowany, aby wiedzieć, co doprowadziło do tego wyniku?

Możesz także powiedzieć o pracy z wyszukiwarką (PS). Jeśli utworzysz swojego bloga w przyszłości, znając pracę PS, nie będziesz musiał zwracać się o pomoc do specjalistów. Będziesz mógł samodzielnie prowadzić swój projekt w taki sposób, aby wyszukiwarka go zobaczyła i wyświetliła innym użytkownikom. W końcu obecność twojego zasobu i odpowiednio zarobki będą zależeć od tego.

Więc zacznijmy.

Co to jest wyszukiwarka?

Wyszukiwarka to specjalny zasób w Internecie, który dostarcza informacje użytkownikowi zgodnie z jego żądaniem. Oznacza to, że zasób ten gromadzi wszystkie dane w sieci globalnej, wszystkie projekty internetowe, a gdy użytkownik otrzyma określone żądanie, dostarcza niezbędnych informacji, wysyłając je na przykład na blog tematyczny lub stronę internetową.

Tak więc po utworzeniu projektu twoje zadanie będzie w SERP, to znaczy na „liście” lub bazie danych wyszukiwarki. Ponieważ promocja witryny w Internecie jest po prostu niemożliwa bez użycia jakiejkolwiek wyszukiwarki, dlatego musisz zadbać o jakość swojego zasobu, jego wewnętrzną i zewnętrzną optymalizację. Jak to zrobić, porozmawiamy w następujących artykułach. Więc nie przegap.

W międzyczasie, jeśli zdecydujesz się stworzyć własnego bloga, polecam przeczytanie następujących artykułów:

Ponieważ nowe zasoby internetowe pojawiają się prawie codziennie, odpowiednio baza danych wyszukiwarek powinna być stale aktualizowana. Każda nowo utworzona witryna musi być indeksowana przez robota. Mówiąc w prostych słowach, Asystenci PS - roboty powinny zapoznać się z nowym zasobem i przenieść te dane do samej wyszukiwarki.

Cóż, tutaj zapewne zgadłeś, że kiedy odwiedzał twojego bloga z robotem, powinien mu się wszystkim podobać. Twój przyszły los będzie zależeć od tego gościa.

W jednym z poniższych artykułów opowiem, jak sprawić, by robot z twojego projektu był w pełni zachwycony. Nie przegap, będą ciekawe i bardzo ciekawe informacje, którymi się z tobą podzielę.

Wyszukiwarki

Cała praca związana z PS zaczyna się od wpisania zapytania w wierszu wyszukiwania. Czego mogą szukać użytkownicy? Tak, wszystko od przepisu na ciasto z kapustą, a kończąc na wiecznym pytaniu „jak zarobić więcej pieniędzy, nie robiąc nic więcej”.

Aby Twój zasób wyszedł jako odpowiedź na pytanie, musisz wyprzedzić konkurencję. Aby to zrobić, musisz zwrócić szczególną uwagę na promocję swojego projektu, która obejmuje działania takie jak pisanie treści zoptymalizowanych pod względem jakości, to znaczy odpowiadanie na prośby o artykuły, poprawianie czynnika behawioralnego, to znaczy, aby czytelnik był zainteresowany zasobem, to poprawia użyteczność, to znaczy wygoda odwiedzających i wiele innych czynników. Wszyscy nauczymy się, jak to zrobić z tobą.

Komponenty wyszukiwarki

A co pomaga wyszukiwarkom, na przykład, temu samemu Googleowi w indeksowaniu zasobów?

  1. Agenci to pracownicy wykonujący większość pracy - indeksujący i analizujący witryny.
  2. Pająki to program, który może pobierać strony z zasobu internetowego i zbierać ogólne informacje na jego temat.
  3. Przeszukiwacz (przeszukiwacz) - program, który wyszukuje wszystkie linki na stronach, klikając, w którym wyszukuje nowe dane nieznane wyszukiwarkom.
  4. Indeksator - analizuje tekst, nagłówki, styl itp.
  5. Roboty - indeksują strony treści, a także badają różne linki.

Aby indeksowanie przebiegało zgodnie z potrzebami, tworzysz specjalny dokument „robots.txt”. Pozwala systemowi sprawdzić tylko te strony, których potrzebujesz, i usunąć to, czego nie powinno być widoczne.

Rodzaje wyszukiwarek

Istnieje kilka opcji dla systemów wyszukiwania informacji:

  • Katalogi. Proste porównanie wyszukiwania to półka na książki w bibliotece. Wszystko jest tam przechowywane w podkategoriach i kategoriach określonego przedmiotu. Jeśli znajdziesz się w takiej wyszukiwarce, uwierz mi, informacje, które tam znajdziesz, będą bardziej niż przydatne i zrozumiałe dla twojej percepcji. Zgadnij, która wspólna strona w pytaniu? Oczywiście o Wikipedii, która zgromadziła cały katalog przydatnych informacji.
  • Wyszukaj indeksy. Wyszukiwanie danych odbywa się kosztem kluczowych fraz. Jest to jednocześnie wygodne i niewygodne. Myślę, że ludzie, którzy mnie szukają, na przykład „Dziewczyna pokazuje klasę”, zrozumieją mnie, że dowiem się, jak dziewczyna pokazuje kciuk do góry, a podczas wyszukiwania wychodzi coś niezbyt przyzwoitego. 🙂 Ten typ wyszukiwania charakteryzuje większość wyszukiwarek.
  • Systemy oceny. Określ swoją popularność na podstawie liczby odwiedzin. Oczywiście nie jest to najlepsze kryterium, ponieważ nie zawsze brana jest pod uwagę przydatność i jakość samego zasobu. Przykładem takiego systemu jest alexa.com.

Wyszukiwarki są również podzielone na ogólne i specjalistyczne. Ogólne wyszukiwarki sortują informacje bez żadnego wyboru według wszystkich znanych zasobów internetowych. Należą do nich Yandex, Rambler, Google. Specjalistyczny - sortuj według używanego języka.

Wyszukiwarki można również podzielić na dystrybucja regionalna i globalna.

Do tej pory wszystkie wyszukiwarki stale ulepszają algorytmy wyboru odpowiednich zasobów o wysokiej jakości.

Trochę historii

W Runet PS pojawił się w 1996 roku - to Aport i Rambler. Rok później, w 1997 roku, powstała Yandex, a rok później w 1998 roku pojawił się inny konkurent - Google. W tej chwili najpopularniejsze to Yandex i Google.

Które wyszukiwarki są teraz najbardziej popularne?

Oto statystyki:

Jak widać, teraz w Rosji najpopularniejszy jest Yandex, podobnie jak Google i Mail.

Dzięki temu możesz zobaczyć najpopularniejsze wyszukiwania, na których powinieneś się skupić podczas tworzenia i promowania swojego projektu.

Wyszukiwarka Yandex (Yandex)

Zasada działania jest następująca: wpisz zapytanie w pasku wyszukiwania, kliknij „Znajdź” i zobacz wyniki. Yandex zebrał 13 milionów odpowiedzi na twoje zapytanie. Możesz także wyszukiwać na zdjęciach, filmach i rynkach (patrz lewa kolumna).

Dodatkowo możesz skonfigurować region do wyszukiwania. Aby to zrobić, kliknij ikonę obok krzyża na pasku wyszukiwania i wybierz żądany region w oknie filtru.

Wyszukiwarka Google (Google)

Google działa na zasadzie analogii z Yandex. Możesz wyszukiwać informacje w różnych sekcjach: zdjęcia, filmy, wiadomości, mapy itp.

Jeśli klikniesz „Narzędzia wyszukiwania”, otworzy się panel z ustawieniami, w którym możesz wybrać region, język i czas wyszukiwania informacji.

Teraz wiesz, jakie wyszukiwarki istnieją w Internecie, widziałeś też najpopularniejsze z nich, a teraz, uzbrojony w informacje, możesz nawiązywać połączenia i interakcje z wyszukiwarkami.

To wszystko na dzisiaj. Jak ci się podoba ten artykuł?

Cześć wszystkim.

Radzę zaktualizować bloga, aby nie przegapić najnowszych wiadomości.

Ekaterina Kalmykova

Są jedną z głównych i najważniejszych usług internetowych.

Za pomocą wyszukiwarek miliardy internautów znajdują potrzebne informacje.

Co to jest wyszukiwarka?

System wyszukiwania to kompleks sprzętowo-programowy, który wykorzystuje specjalne algorytmy do przetwarzania ogromnej ilości informacji o różnych witrynach, o ich zawartości aż do każdej strony.

Wyszukiwarka, z punktu widzenia zwykłych odwiedzających, jest tak inteligentną witryną, która zawiera wiele informacji i udziela odpowiedzi na wszelkie żądania użytkowników.

W różnych krajach internauci korzystają z różnych wyszukiwarek. W anglojęzycznym segmencie Internetu najbardziej popularna jest wyszukiwarka Google.

Wyszukiwarki w RuNet

W Rosji ponad połowa użytkowników woli wyszukiwarkę Yandex, a Google odpowiada za około 35% wyszukiwań. Inni użytkownicy korzystają z Rambler, Mail.ru, Nigma i innych usług.

Na Ukrainie około 60% użytkowników korzysta z Google, konta Yandex stanowią nieco ponad 25% przetworzonych wniosków.

Dlatego promując witryny w Runecie, specjaliści starają się promować witrynę, koncentrując się na wyszukiwarkach Yandex i Google.

Zadania wyszukiwarek

Aby jak najdokładniej odpowiedzieć na pytania odwiedzających, wyszukiwarki muszą wykonać następujące zadania:

  1. Szybko i skutecznie zbieraj informacje o różnych stronach różnych witryn.
  2. Przetwarzaj informacje o tych stronach i określ, które zapytania lub zapytania odpowiadają.
  3. Generuj i wydawaj wyniki wyszukiwania w odpowiedzi na żądania użytkowników.

Komponenty wyszukiwarki

Wyszukiwarki to złożony pakiet oprogramowania, który składa się z następujących głównych bloków:

  1. Zbieranie danych
  2. Indeksowanie
  3. Kalkulacja.
  4. Nośny.

Podział ten jest warunkowy, ponieważ praca różnych wyszukiwarek jest nieco inna.

1. Zbieranie danych

Na tym etapie zadaniem jest znalezienie nowych dokumentów, zaplanowanie ich wizyt i skanów.

Webmasterzy muszą poinformować wyszukiwarki o pojawieniu się nowych materiałów, publikując adres strony w dodatku lub aby kierować zapowiedziami stron w sieciach społecznościowych.

Osobiście używam tej drugiej metody i uważam, że to wystarczy.

Komentarz. Trochę rozproszony i mówić o skuteczności umieszczania ogłoszeń portale społecznościowe szybkość indeksowania nowych stron w witrynie.

Korzystam z usługi text.ru do kontrolowania i poprawiania niepowtarzalności tekstu na stronach mojej witryny.

Jakościowo sprawdza wyjątkowość, naprawia ją i umożliwia umieszczenie baneru wyjątkowości na stronach witryny.

Ale czasami jest duża kolejka do przetworzenia w tej usłudze. Miałem kilka przypadków, w których nie spodziewałem się zweryfikować niepowtarzalności, opublikowałem artykuł na stronie i uruchomiłem go w sieciach społecznościowych.

Jeśli sprawdzenie niepowtarzalności było opóźnione o około godzinę lub dłużej, wówczas procent unikalności wynosił zawsze 0%. Oznacza to, że w mniej niż godzinę po umieszczeniu strona została już zindeksowana i zapisana w bazie danych wyszukiwarek.

2. Indeksowanie

Wyszukiwarki, zbierając dane na nowych stronach internetowych, umieszczają je w swojej bazie danych. W takim przypadku tworzony jest indeks, czyli klucz do szybkiego dostępu do danych o tej stronie, jeśli zajdzie taka potrzeba.

3. Obliczenia

Po wejściu do bazy danych strony naszych witryn przechodzą etap obliczania różnych parametrów i wskaźników.

Nikt nie może powiedzieć, ile z tych wskaźników i jak są obliczone, aby powiedzieć dokładnie, z wyjątkiem samych twórców algorytmów wyszukiwarek.

4. Ranking

Następnie, na podstawie obliczonych parametrów i wskaźników, określa się znaczenie strony dla niektórych żądań oraz jej ranking.

Będzie to ważne dla szybkiego tworzenia wysokiej jakości strony wyników wyszukiwania dla tych żądań.

Wyszukiwarki generują odpowiedzi na zapytania użytkowników i tworzą dla nich wyniki w postaci strony wyników wyszukiwania.

Należy zauważyć, że algorytmy przetwarzania danych o stronach, tworzeniu wskaźników i metod rankingu są stale ulepszane. Priorytety, według których następuje ranking.
Wyszukiwarki starają się odpowiadać na zapytania użytkowników tak dokładnie, jak to możliwe, starając się uwzględnić charakter zapytania, interesy konkretnego użytkownika, jego miejsce zamieszkania, wiek, płeć, zwyczaje, skłonności.

Aby skutecznie utrzymywać i rozwijać bloga, musimy przede wszystkim wiedzieć, na jakich algorytmach działają. Jasne zrozumienie odpowiedzi na te pytania pozwoli nam z powodzeniem rozwiązać problemy związane z promocją witryny w wyszukiwarkach. Ale mowa o witrynach do optymalizacji wyszukiwarek jest wciąż przed nami, ale na razie trochę teorii na temat wyszukiwarek.

Co to są wyszukiwarki internetowe?

Jeśli przejdziemy do Wikipedii, dowiemy się:

„Wyszukiwarka to kompleks oprogramowania i sprzętu z interfejsem sieciowym, który umożliwia wyszukiwanie informacji w Internecie”.

A teraz w języku, który rozumiemy. Powiedzmy, że pilnie potrzebujemy informacji na określony temat. Abyśmy mogli go szybko znaleźć i stworzyć wyszukiwarki - witryny, w których po wpisaniu zapytania w formularzu wyszukiwania otrzymamy listę witryn, na których z dużym prawdopodobieństwem znajdziemy to, czego szukamy. Ta lista nosi nazwę wyników wyszukiwania. Może składać się z milionów stron z 10 witrynami na każdej. Głównym zadaniem webmastera jest zdobycie co najmniej pierwszej dziesiątki.

Pamiętaj, że kiedy szukasz czegoś w sieci, zwykle znajdujesz to na pierwszej stronie wyników, rzadko przechodząc do drugiej, a zwłaszcza następnej. Oznacza to, że im wyższa witryna, tym więcej osób odwiedza jej strony. Duży ruch (liczba odwiedzających dziennie) to między innymi okazja.

W jaki sposób wyszukiwarki internetowe znajdują informacje w Internecie i na jakiej zasadzie dystrybuują miejsca w wynikach wyszukiwania?

W kilku słowach, wyszukiwarka internetowa - To cała sieć, w której roboty-pająki nieustannie skanują sieć i zapamiętują wszystkie teksty, które trafiają do Internetu. Analizując uzyskane dane, wyszukiwarki wybierają dokumenty, które są najbardziej odpowiednie dla zapytania wyszukiwania, tj. Istotne, z których powstają wyniki wyszukiwania.

Najciekawsze jest to, że wyszukiwarki nie potrafią czytać. Jak więc znajdują informacje? Algorytmy wyszukiwarek sprowadzają się do kilku podstawowych zasad. Przede wszystkim zwracają uwagę na tytuł i opis artykułu, nagłówki akapitów, nacisk semantyczny w tekście i gęstość słowa kluczowe, które muszą koniecznie odpowiadać tematowi artykułu. Im dokładniejsze dopasowanie, tym wyższa będzie strona w wynikach wyszukiwania. Ponadto należy wziąć pod uwagę ilość informacji i wiele innych czynników. Na przykład autorytet zasobu internetowego, w zależności od liczby i autorytetu witryn z nim linkujących. Im więcej autorytetu, tym wyższy problem.

Nazywa się zestaw środków mających na celu podniesienie pozycji witryny w wynikach wyszukiwania niektórych zapytań optymalizacja wyszukiwarki. To jest cała nauka. Ale o tym później.

W tej chwili istnieje wiele wyszukiwarek na świecie. Wymienię najpopularniejsze. Na zachodzie jest to: Google, Bing i Yahoo. W RuNet - Yandex, Mail.ru, Rambler i Nigma. Zasadniczo użytkownicy wolą światowego lidera, a system Yandex stał się najbardziej popularny w rosyjskojęzycznym Internecie.

Trochę historii. Google został utworzony w 1997 roku przez rodowitego mieszkańca Moskwy Siergiej Brin i jego przyjaciel amerykański Larry Page podczas studiów na Uniwersytecie Stanforda.

Osobliwością Google było to, że wyświetlał najbardziej trafne wyniki wyszukiwania w logicznej kolejności na pierwszych pozycjach w wynikach wyszukiwania, podczas gdy reszta wyszukiwarek była zaangażowana w proste porównanie słów w zapytaniu ze słowami na stronie internetowej.

23 września tego samego roku ogłoszono system Yandex, który od 2000 roku zaczął istnieć jako osobna firma Yandex.

Nie będę się już tym przejmować, mam nadzieję, że teraz jest to trochę jasne jakie są wyszukiwarki internetowe. Warto powiedzieć, że algorytmy wyszukiwarek stale się zmieniają. Każdego dnia wyszukiwarki lepiej określają potrzeby użytkowników i pokazują im najistotniejsze informacje na podstawie wielu czynników (regionalność, jakie żądania użytkownik już poprosił, które strony odwiedził podczas wyszukiwania, dokąd od nich poszedł itp.).

Wkrótce Google i Yandex będą wiedzieli lepiej od nas, czego potrzebujemy i o czym myślimy.!

Architektura wyszukiwarek zazwyczaj obejmuje:

Encyklopedyczny YouTube

    1 / 5

    ✪ Lekcja 3: Jak działa wyszukiwarka. Wprowadzenie do SEO

    ✪ Wyszukiwarka w środku

    ✪ Shodan - czarny google

    ✪ Wyszukiwarka CHEBURASHKA zastąpi Google i Yandex w Rosji

    ✪ Lekcja 1 - Jak działa wyszukiwarka

    Napisy na filmie obcojęzycznym

Fabuła

Chronologia
Rok System Zdarzenie
1993 W3Catalog ?! Uruchomić
Alliweb Uruchomić
Jumpstation Uruchomić
1994 Webcrawler Uruchomić
Infoseek Uruchomić
Lycos Uruchomić
1995 Altavista Uruchomić
Daum Baza
Otwórz tekst Indeks sieci Uruchomić
Magellan Uruchomić
Podniecać Uruchomić
Sapo Uruchomić
Wieśniak! Uruchomić
1996 Dogpile Uruchomić
Inktomi Baza
Wędrowiec Baza
Hotbot Baza
Zapytaj jeeves Baza
1997 Północne światło Uruchomić
Yandex Uruchomić
1998 Google Uruchomić
1999 Alltheweb Uruchomić
Genieknows Baza
Naver Uruchomić
Teoma Baza
Vivisimo Baza
2000 Baidu Baza
Exalead Baza
2003 Info.com Uruchomić
2004 Wieśniak! Szukaj Ostateczne uruchomienie
A9.com Uruchomić
Sogou Uruchomić
2005 Wyszukiwanie MSN Ostateczne uruchomienie
Ask.com Uruchomić
Nigma Uruchomić
Goodsearch Uruchomić
Poszukaj mnie Baza
2006 wikiseek Baza
Quaero Baza
Wyszukiwanie na żywo Uruchomić
ChaCha Uruchom (wersja beta)
Guruji.com Uruchom (wersja beta)
2007 wikiseek Uruchomić
Sproose Uruchomić
Szukaj w Wikii Uruchomić
Blackle.com Uruchomić
2008 Duckucko idź Uruchomić
Tooby Uruchomić
Picollator Uruchomić
Viewzi Uruchomić
Cuil Uruchomić
Boogami Uruchomić
Skalawa Uruchom (wersja beta)
Forestle Uruchomić
Vadlo Uruchomić
Zestaw zasilający Uruchomić
2009 Bing Uruchomić
KAZ.KZ Uruchomić
Yebol Uruchom (wersja beta)
Mugurdy Zamknięcie
Zwiadowca Uruchomić
2010 Cuil Zamknięcie
Blekko Uruchom (wersja beta)
Viewzi Zamknięcie
2012 Wazub Uruchomić
2014 Satelita Uruchom (wersja beta)

Na wczesnym etapie rozwoju Internetu Tim Berners-Lee prowadził listę serwerów internetowych hostowanych na stronie CERN. Witryn było coraz więcej, a ręczne prowadzenie takiej listy stawało się coraz trudniejsze. Witryna NCSA miała specjalną sekcję „Co nowego!” (Eng. Co nowego!), Gdzie opublikowali linki do nowych stron.

Pierwszym programem komputerowym do przeszukiwania Internetu był program Archie (English archie - archiwum bez litery „b”). Został stworzony w 1990 r. Przez Alana Emtagea, Billa Heelana i J. Petera Deutscha, studentów informatyki na Uniwersytecie McGill w Montrealu. Program pobrał listy wszystkich plików ze wszystkich dostępnych anonimowych serwerów FTP i zbudował bazę danych, w której można wyszukiwać według nazwy pliku. Jednak program Archie nie indeksował zawartości tych plików, ponieważ wolumen danych był tak mały, że wszystko można było łatwo znaleźć ręcznie.

Rozwój i dystrybucja protokół sieciowy Gopher, wynaleziony w 1991 roku przez Marka McCahilla z University of Minnesota, doprowadził do stworzenia dwóch nowych programów wyszukiwania, Weronika i kuglarz. Podobnie jak Archie, szukali nazw plików i nagłówków przechowywanych w systemach indeksowych Gopher. Weronika Bardzo łatwy zorientowany na gryzonie indeks całej sieci do skomputeryzowanych archiwów) umożliwiło wyszukiwanie słów kluczowych w większości pozycji menu Gopher na wszystkich listach Gopher. Program Jughead Universal Gopher Hierarchy Excavation And Display Jonzy'ego) pobiera informacje o menu z określonych serwerów Gopher. Chociaż nazwa wyszukiwarki Archie nie była związana z cyklem komiksowym. „Archie”Jednak Veronica i Jughead są bohaterami tych komiksów.

Do lata 1993 r. Wciąż nie było systemu przeszukiwania sieci, chociaż wiele wyspecjalizowanych katalogów było utrzymywanych ręcznie. Oscar Nierstrasz z University of Geneva napisał wiele skryptów Perla, które okresowo kopiowały te strony i przepisywały je w standardowy format. Stało się podstawą W3Catalog ?!, pierwsza prymitywna wyszukiwarka internetowa uruchomiona 2 września 1993 r.

Prawdopodobnie pierwszym robotem wyszukiwawczym napisanym w Perlu był Wanderer World Wide Web, bot autorstwa Matthew Graya z czerwca 1993 r. Ten robot utworzył indeks wyszukiwania „Wandex”. Celem Wędrowca było zmierzenie wielkości sieci WWW i znalezienie wszystkich stron internetowych zawierających słowa z zapytania. W 1993 roku pojawiła się druga wyszukiwarka Aliweb. Aliweb nie korzystał z wyszukiwarki, lecz zamiast tego oczekiwał od administratorów stron powiadomień o obecności pliku indeksu na swoich stronach internetowych w określonym formacie.

JumpstationUtworzony w grudniu 1993 roku przez Jonathana Fletchera, przeszukiwał strony internetowe i budował ich indeksy za pomocą wyszukiwarki, a także używał formularza internetowego jako interfejsu do formułowania zapytań. Było to pierwsze narzędzie do wyszukiwania w Internecie, które łączyło trzy najważniejsze funkcje wyszukiwarki (sprawdzanie poprawności, indeksowanie i faktyczne wyszukiwanie). Ze względu na ograniczone zasoby komputerów w tym czasie indeksowanie, a zatem i wyszukiwanie, ograniczały się tylko do nazw i tytułów stron internetowych znalezionych przez robota wyszukiwania.

Wyszukiwarki uczestniczyły w Dotcom Bubble pod koniec lat 90. Kilka firm skutecznie weszło na rynek, osiągając rekordowe zyski podczas pierwszej oferty publicznej. Niektórzy porzucili rynek publicznych wyszukiwarek i zaczęli współpracować tylko z sektorem korporacyjnym, na przykład Północne światło.

Google przyjął pomysł sprzedaży słów kluczowych w 1998 roku, potem była to mała firma, która udostępniła wyszukiwarkę na goto.com. Ten krok oznaczał dla wyszukiwarek przejście od konkurowania ze sobą do jednego z najbardziej dochodowych przedsięwzięć biznesowych w Internecie. Wyszukiwarki zaczęły sprzedawać pierwsze miejsca w wynikach wyszukiwania poszczególnym firmom.

Google jest widoczny od początku 2000 roku. Firma osiągnęła wysoką pozycję dzięki dobrym wynikom wyszukiwania wykorzystującym algorytm PageRank. Algorytm został zaprezentowany publicznie w artykule Anatomy of Search Engine, napisanym przez Sergeya Brina i Larry'ego Page'a, założycieli Google. Ten iteracyjny algorytm szereguje strony internetowe na podstawie oszacowania liczby hiperłączy do strony internetowej, zakładając, że strony „dobre” i „ważne” są połączone bardziej niż inne. Interfejs Google został zaprojektowany w stylu spartańskim, w którym nie ma nic zbędnego, w przeciwieństwie do wielu jego konkurentów, którzy wbudowali wyszukiwarkę w portal internetowy. Wyszukiwarka Google stała się tak popularna, że \u200b\u200bnaśladuje systemy takie jak Poszukiwacz tajemnicy(tajna wyszukiwarka).

Szukaj informacji w języku rosyjskim

W 1996 r. Przeprowadzono wyszukiwanie z uwzględnieniem rosyjskiej morfologii w wyszukiwarce Altavista i uruchomiono oryginalne rosyjskie wyszukiwarki Rambler i Aport. 23 września 1997 r. Otwarto wyszukiwarkę Yandex. 22 maja 2014 r. Rostelecom uruchomił krajową wyszukiwarkę Sputnik, która jest obecnie w fazie testów beta w 2015 r. 22 kwietnia 2015 roku został otwarty nowa usługa Satelita. Dzieci specjalnie dla dzieci o podwyższonym bezpieczeństwie.

Dużą popularność zyskały metody analizy skupień i wyszukiwania metadanych. Największą sławą spośród międzynarodowych maszyn takiego planu „Clusty” Firma Vivisimo. W 2005 r. W Rosji, przy wsparciu Moskiewskiego Uniwersytetu Państwowego, uruchomiono wyszukiwarkę Nigma, która obsługuje automatyczne klastrowanie. W 2006 r. Otwarto rosyjską metamachinę Quintura, oferującą wizualne grupowanie w formie chmury tagów. Nigma eksperymentowała również z klastrowaniem wizualnym.

Jak działa wyszukiwarka

Główne elementy wyszukiwarki: robot wyszukujący, indeksator, wyszukiwarka.

Z reguły systemy działają etapami. Najpierw robot wyszukujący otrzymuje treść, następnie indeksator generuje indeks do przeszukiwania, a na koniec wyszukiwarka zapewnia funkcjonalność wyszukiwania indeksowanych danych. Aby zaktualizować wyszukiwarkę, cykl indeksowania jest powtarzany.

Wyszukiwarki działają poprzez przechowywanie informacji o wielu stronach internetowych, które otrzymują ze stron HTML. Robot do wyszukiwania lub „robot” to program, który automatycznie przechodzi przez wszystkie linki znalezione na stronie i je wybiera. Przeszukiwacz, na podstawie linków lub na podstawie wstępnie zdefiniowanej listy adresów, wyszukuje nowe dokumenty, które nie są jeszcze znane systemowi wyszukiwania. Właściciel witryny może wykluczyć niektóre strony za pomocą pliku robots.txt, za pomocą którego można zapobiec indeksowaniu plików, stron lub katalogów witryny.

Wyszukiwarka analizuje zawartość każdej strony w celu dalszego indeksowania. Słowa można wyodrębnić z nagłówków, tekstu strony lub pól specjalnych - metatagów. Indeksator to moduł, który analizuje stronę po rozbiciu jej na części przy użyciu własnych algorytmów leksykalnych i morfologicznych. Wszystkie elementy strony internetowej są wyodrębnione i przeanalizowane osobno. Dane strony internetowej są przechowywane w bazie danych indeksu do wykorzystania w kolejnych zapytaniach. Indeks pozwala szybko znaleźć informacje na żądanie użytkownika. Wiele wyszukiwarek, takich jak Google, przechowuje całą stronę źródłową lub jej część, tzw. Pamięć podręczną, a także różne informacje o stronie internetowej. Inne systemy, takie jak system AltaVista, przechowują każde słowo każdej znalezionej strony. Korzystanie z pamięci podręcznej pomaga przyspieszyć ekstrakcję informacji z już odwiedzonych stron. Strony buforowane zawsze zawierają tekst podany przez użytkownika wyszukiwana fraza. Może to być przydatne, jeśli strona internetowa została zaktualizowana, tzn. Nie zawiera już tekstu żądania użytkownika, a strona w pamięci podręcznej jest nadal stara. Ta sytuacja jest związana z utratą linków. linkrot) oraz przyjazne dla użytkownika (użyteczność) podejście Google. Zakłada się, że krótkie fragmenty tekstu zawierające tekst zapytania są zwracane z pamięci podręcznej. Obowiązuje zasada najmniejszego zaskoczenia, użytkownik zwykle spodziewa się zobaczyć wyszukiwane słowa w tekstach otrzymanych stron ( Oczekiwania użytkowników) Oprócz tego, że korzystanie ze stron w pamięci podręcznej przyspiesza wyszukiwanie, strony w pamięci podręcznej mogą zawierać informacje, które nie są już nigdzie dostępne.

Wyszukiwarka współpracuje z plikami wyjściowymi otrzymanymi z indeksu. Wyszukiwarka akceptuje zapytania użytkowników, przetwarza je za pomocą indeksu i zwraca wyniki wyszukiwania.

Gdy użytkownik wprowadza zapytanie do wyszukiwarki (zwykle za pomocą słów kluczowych), system sprawdza jego indeks i wyświetla listę najbardziej odpowiednich stron internetowych (posortowanych według niektórych kryteriów), zwykle z krótką adnotacją zawierającą tytuł dokumentu, a czasem fragmenty tekstu. Indeks wyszukiwania jest budowany przy użyciu specjalnej techniki opartej na informacjach uzyskanych ze stron internetowych. Od 2007 r. Wyszukiwarka Google umożliwia wyszukiwanie według czasu, tworzenie poszukiwanych dokumentów (wywoływanie menu „Narzędzia wyszukiwania” i określanie zakresu czasowego). Większość wyszukiwarek obsługuje użycie operatorów logicznych AND, OR, NOT w zapytaniach, co pozwala zawęzić lub rozwinąć listę wyszukiwanych słów kluczowych. W takim przypadku system wyszuka słowa lub frazy dokładnie tak, jak zostały wprowadzone. Niektóre wyszukiwarki mają taką możliwość przybliżone wyszukiwanie, w tym przypadku użytkownicy rozszerzają wyszukiwanie, wskazując odległość do słów kluczowych. Istnieje również poszukiwanie koncepcyjnektóra wykorzystuje analizę statystyczną użycia wyszukiwanych słów i wyrażeń w tekstach stron internetowych. Systemy te umożliwiają tworzenie zapytań w języku naturalnym. Przykładem takiej wyszukiwarki jest ask com.

Przydatność wyszukiwarki zależy od trafności znalezionych stron. Chociaż miliony stron internetowych mogą zawierać słowa lub frazy, niektóre z nich mogą być bardziej trafne, popularne lub autorytatywne niż inne. Większość wyszukiwarek używa metod rankingowych, aby uszeregować „najlepsze” wyniki na górze listy. Wyszukiwarki decydują, które strony są bardziej odpowiednie i w jakiej kolejności wyniki powinny być wyświetlane na różne sposoby. Metody wyszukiwania, takie jak sam Internet, zmieniają się z czasem. Tak więc istniały dwa główne typy wyszukiwarek: systemy predefiniowanych i hierarchicznie uporządkowanych słów kluczowych oraz systemy, w których indeks odwrócony jest generowany na podstawie analizy tekstu.

Większość wyszukiwarek to przedsiębiorstwa komercyjne, które czerpią zyski z reklamy, w niektórych wyszukiwarkach można kupić za opłatą pierwsze miejsca w wynikach wyszukiwania dla danych słów kluczowych. Te wyszukiwarki, które nie pobierają pieniędzy za kolejność wyników, zarabiają na reklamach kontekstowych, a komunikaty reklamowe odpowiadają żądaniom użytkownika. Takie reklamy są wyświetlane na stronie z listą wyników wyszukiwania, a wyszukiwarki zarabiają za każdym razem, gdy użytkownik kliknie wiadomości reklamowe.

Rodzaje wyszukiwarek

Istnieją cztery typy wyszukiwarek: roboty wyszukiwarek kierowane przez człowieka, hybrydowe i meta-systemy.

  • systemy korzystające z wyszukiwarek
Składają się z trzech części: robota („bot”, „robot” lub „pająk”), oprogramowania indeksującego i wyszukiwarki. Przeszukiwacz jest potrzebny do ominięcia sieci i tworzenia list stron internetowych. Indeks to duże archiwum kopii stron internetowych. Celem oprogramowania jest ocena wyników wyszukiwania. Ze względu na fakt, że robot wyszukujący w tym mechanizmie stale bada sieć, informacje są bardziej odpowiednie. Większość nowoczesnych wyszukiwarek to systemy tego typu.
  • systemy napędzane przez człowieka (katalogi zasobów)
Te wyszukiwarki pobierają listy stron internetowych. Katalog zawiera adres, tytuł i krótki opis strony. Katalog zasobów wyszukuje wyniki tylko z opisów stron przesłanych mu przez webmasterów. Zaletą katalogów jest to, że wszystkie zasoby są sprawdzane ręcznie, dlatego jakość zawartości będzie lepsza w porównaniu z wynikami uzyskanymi przez system pierwszego typu automatycznie. Jest jednak pewna wada - katalogi te są aktualizowane ręcznie i mogą znacznie opóźnić się w stosunku do rzeczywistej sytuacji. Pozycja strony nie może się zmienić natychmiast. Przykłady takich systemów obejmują katalog Yahoo , dmoz i Galaxy.
  • systemy hybrydowe
Wyszukiwarki takie jak Yahoo, Google, MSN łączą funkcje systemów wykorzystujących roboty wyszukiwarek i systemy sterowane przez człowieka.
  • systemy meta
Meta-wyszukiwarki łączą i szeregują wyniki kilku wyszukiwarek jednocześnie. Te wyszukiwarki były przydatne, gdy każda z nich miała unikalny indeks, a wyszukiwarki były mniej „inteligentne”. Ponieważ wyszukiwanie zostało znacznie poprawione, zapotrzebowanie na nie zmalało. Przykłady: Metakrawler i MSN Search.

Rynek wyszukiwarek

Google jest najpopularniejszą wyszukiwarką na świecie z udziałem w rynku 68,69%. Bing zajmuje drugie miejsce, jego udział wynosi 12,26%.

Najpopularniejsze wyszukiwarki na świecie:

System wyszukiwania Udział w rynku w lipcu 2014 r Udział w rynku październik 2014 r Udział w rynku wrzesień 2015 r
Google 68,69 % 58,01 % 69,24%
Baidu 17,17 % 29,06 % 6,48%
Bing 6,22 % 8,01 % 12,26%
Wieśniak! 6,74 % 4,01 % 9,19%
AOL 0,13 % 0,21 % 1,11%
Podniecać 0,22 % 0,00 % 0,00 %
Zapytać 0,13 % 0,10 % 0,24%

Azja

W krajach Azji Wschodniej i Rosji Google nie jest najpopularniejszą wyszukiwarką. Na przykład w Chinach jest bardziej popularny. wyszukiwarka Soso ?!.

W Korei Południowej około 70% mieszkańców Yahoo! korzysta z portalu wyszukiwarki własnego projektu. Japonia i Yahoo! Tajwan to najpopularniejsze wyszukiwarki odpowiednio w Japonii i na Tajwanie.

Wyszukiwarki rosyjskie i rosyjskojęzyczne

Według LiveInternet w czerwcu 2015 r. Na temat zapytań w języku rosyjskim:

  • Wielojęzyczny:
    • Wieśniak! (0,1%) i wyszukiwarki należące do tej firmy: Inktomi, AltaVista, Alltheweb
  • Angielski i międzynarodowy:
    • Askjeeves (Mechanizm Teoma)
  • Rosyjskojęzyczna - większość wyszukiwarek „rosyjskojęzycznych” indeksuje i wyszukuje teksty w wielu językach - ukraińskim, białoruskim, angielskim, tatarskim i innych. Różnią się od „wielojęzycznych” systemów indeksujących wszystkie dokumenty z rzędu tym, że indeksują głównie zasoby znajdujące się w strefach domenowych, w których dominuje język rosyjski, lub w inny sposób ograniczają swoje roboty do stron w języku rosyjskim.

Niektóre wyszukiwarki używają zewnętrznych algorytmów wyszukiwania.

Wyszukiwarka Google Dane ilościowe

Liczba użytkowników Internetu i wyszukiwarek oraz wymagania użytkowników dotyczące tych systemów stale rosną. Aby zwiększyć szybkość wyszukiwania niezbędnych informacji, duże wyszukiwarki zawierają dużą liczbę serwerów. Serwery są zazwyczaj pogrupowane w centra serwerów (centra danych). Dzięki popularnym wyszukiwarkom centra serwerów są rozproszone po całym świecie.

W październiku 2012 r. Google uruchomił projekt „Gdzie mieszka Internet”, w którym użytkownicy mają możliwość zapoznania się z centrami danych tej firmy.

O pracy wyszukiwania centrów danych system Google Znane są następujące:

  • Łączna moc wszystkich centrów danych Google na 2011 r. Została oszacowana na 220 MW.
  • Kiedy Google planowało otworzyć nowy kompleks w Oregonie w 2008 roku, składający się z trzech budynków o łącznej powierzchni 6,5 miliona m², magazyn Harper's oszacował, że tak duży kompleks zużywa ponad 100 MW energii elektrycznej, co jest porównywalne z zużyciem energii w mieście o populacji 300 000 mieszkańców osoba.
  • Szacunkowa liczba serwerów Google w 2012 r. Wynosi 1 000 000.
  • Wydatki Google na centra danych wyniosły 1,9 mld USD w 2006 r. I 2,4 mld USD w 2007 r.

Internet zindeksowany przez Google na grudzień 2014 r. Ma około 4,36 miliarda stron.

Wyszukiwarki zakazów religijnych

Globalne rozprzestrzenianie się Internetu i rosnąca popularność urządzeń elektronicznych w świecie arabskim i muzułmańskim, w szczególności w krajach Bliskiego Wschodu i subkontynentu indyjskiego, przyczyniły się do rozwoju lokalnych wyszukiwarek uwzględniających tradycje islamskie. Takie wyszukiwarki zawierają specjalne filtry, które pomagają użytkownikom nie wchodzić na zabronione strony, na przykład strony z pornografią, i pozwalają im korzystać tylko z tych witryn, których treść nie jest sprzeczna z wiarą islamską. Krótko przed muzułmańskim miesiącem ramadan, w lipcu 2013 r., Świat został wprowadzony Halalgoogling - system, który daje użytkownikom tylko halal „poprawne” linki, filtrując wyniki wyszukiwania otrzymane z innych wyszukiwarek, takich jak Google i Bing. Dwa lata wcześniej, we wrześniu 2011 r., Uruchomiono wyszukiwarkę I’mHalal, która ma służyć użytkownikom na Bliskim Wschodzie. Jednak to usługa wyszukiwania według właściciela musiał wkrótce zostać zamknięty z powodu braku funduszy.

Brak inwestycji i wolne tempo rozpowszechniania technologii w świecie muzułmańskim utrudniały postęp i utrudniały sukces poważnej islamskiej wyszukiwarki. Niepowodzenie wielkich inwestycji w muzułmańskie projekty związane ze stylem życia jest oczywiste, a jednym z nich był Muxlim. Otrzymał miliony dolarów od inwestorów, takich jak Rite Internet Ventures, a teraz - zgodnie z najnowszą wiadomością od I'mHalal przed zamknięciem - wpadł na wątpliwy pomysł, że „następny Facebook lub Google może pojawić się tylko na Bliskim Wschodzie, jeśli wspieracie naszą błyskotliwą młodzież ”. Niemniej eksperci od islamskiego Internetu od lat decydują o tym, co odpowiada lub nie przestrzega szariatu, i klasyfikują strony internetowe jako „halal” lub „haram”. Wszystkie poprzednie i obecne islamskie wyszukiwarki są po prostu specjalnie zindeksowanym zbiorem danych lub są głównymi wyszukiwarkami, takimi jak Google, Yahoo i Bing, z pewnym systemem filtrowania, który uniemożliwia użytkownikom uzyskanie dostępu do witryn hara, takich jak jako strony o nagości, LGBT, hazardzie i niektórych innych, których temat jest uważany za antyislamski.

Do innych wyszukiwarek zorientowanych religijnie należą Jewogle, żydowska wersja Google oraz SeekFind.org, chrześcijańska witryna zawierająca filtry chroniące użytkowników przed treściami, które mogą podważyć lub osłabić ich wiarę.

Wyniki osobiste i filtry bąbelkowe

Wiele wyszukiwarek, takich jak Google i Bing, wykorzystuje algorytmy do selektywnego odgadywania, jakie informacje użytkownik chciałby zobaczyć na podstawie swoich wcześniejszych działań w systemie. W rezultacie strony internetowe wyświetlają tylko informacje zgodne z przeszłymi zainteresowaniami użytkownika. Ten efekt nazywa się „bąbelkiem filtrującym”.

Wszystko to prowadzi do tego, że użytkownicy otrzymują znacznie mniej informacji, które są sprzeczne z ich punktem widzenia i zostają intelektualnie odizolowani we własnej „bańce informacyjnej”. Zatem „efekt bąbelkowy” może mieć negatywne konsekwencje dla kształtowania opinii obywatelskiej.

Błąd wyszukiwarki

Chociaż wyszukiwarki są zaprogramowane do pozycjonowania stron internetowych na podstawie pewnego połączenia popularności i trafności, w rzeczywistości badania eksperymentalne wskazują, że na wyniki wyszukiwania wpływają różne czynniki polityczne, gospodarcze i społeczne.

Takie uprzedzenie może być bezpośrednim wynikiem procesów ekonomicznych i handlowych: firmy reklamowane w wyszukiwarce mogą stać się bardziej popularne w wyniku regularnego wyszukiwania w niej. Usuwanie wyników wyszukiwania niezgodnych z lokalnymi przepisami stanowi przykład wpływu procesów politycznych. Na przykład Google nie wyświetli niektórych neonazistowskich stron internetowych we Francji i Niemczech, gdzie zaprzeczanie Holokaustowi jest nielegalne.

Odchylenie może być również konsekwencją procesów społecznych, ponieważ algorytmy wyszukiwarek są często zaprojektowane tak, aby wykluczyć niesformatowane punkty widzenia na korzyść bardziej „popularnych” wyników. Algorytmy indeksowania dla głównych wyszukiwarek dają pierwszeństwo witrynom amerykańskim.

Bomba wyszukiwania jest jednym z przykładów próby zarządzania wynikami wyszukiwania z powodów politycznych, społecznych lub handlowych.

Zobacz też

  • Qwika
  • Biblioteka elektroniczna # Listy bibliotek i wyszukiwarek
  • Pasek narzędzi dla programistów stron internetowych

Notatki

Literatura

  • Aszmanow I.S., Iwanow A.A. Promocja strony w wyszukiwarkach. - M .: Williams, 2007. - 304 s. - ISBN 978-5-8459-1155-1.
  • Baykov V.D. Internet Szukać informacji. Promocja strony internetowej. - SPb. : BHV-Petersburg, 2000. - 288 s. - ISBN 5-8206-0095-9.
  • Kolisnichenko D.N. Wyszukiwarki i promocja stron internetowych w Internecie. - M .: Dialektyka, 2007. - 272 s. - ISBN 978-5-8459-1269-5.
  • Lande D.V. Szukaj wiedzy w Internecie. - M .: Dialektyka, 2005 r. - 272 str. - ISBN 5-8459-0764-0.
  • Lande D.V., Snarsky A.A., Bezsudnov I.V. Internet: Nawigacja w złożonych sieciach: modele i algorytmy. - M .: Librocom (Editorial URSS), 2009. - 264 s. - ISBN 978-5-397-00497-8.
  • Chu H., Rosenthal M.

DZWONEK

Są tacy, którzy czytają te wiadomości przed tobą.
Subskrybuj, aby otrzymywać świeże artykuły.
E-mail
Imię
Nazwisko
Jak chcesz przeczytać Dzwon
Bez spamu