LA CAMPANA

C'è chi ha letto questa notizia prima di te.
Iscriviti per ricevere gli ultimi articoli.
E-mail
Nome
Cognome
Come vuoi leggere The Bell
Niente spam

Sistema di ricerca - un complesso software e hardware con un'interfaccia web, che consente la ricerca di informazioni su Internet.

Tutti i motori di ricerca sono accomunati dal fatto di trovarsi su potenti server appositamente dedicati e sono legati a canali di comunicazione efficaci. Motori di ricerca chiamati anche sistemi di recupero delle informazioni (ISS). Il numero di visitatori serviti contemporaneamente ai sistemi più popolari raggiunge molte migliaia. I più famosi servono milioni di clienti al giorno. Nei casi in cui un motore di ricerca è basato su directory, viene chiamato directory. Si basa sul lavoro dei moderatori. Al centro della ISS con la ricerca full-text c'è la raccolta automatica di informazioni. Viene eseguito da programmi speciali. Questi programmi esaminano periodicamente i contenuti di tutte le risorse Internet. Per fare ciò, si muovono, o come si suol dire, strisciano, su risorse diverse. Di conseguenza, tali programmi sono chiamati robot. Ci sono altri nomi: poiché WWW è un'abbreviazione dell'espressione World Wide Web, è naturale chiamare un programma del genere uno spider in inglese. - ragno. Recentemente sono stati usati altri nomi: indici automatici o directory. Tutti questi programmi esaminano e "scaricano" informazioni da diversi URL. Programmi del tipo specificato visita ogni risorsa dopo un certo tempo. Nessun motore di ricerca è in grado di indicizzare l'intera Internet. Pertanto, i database in cui vengono raccolti gli indirizzi delle risorse indicizzate sono diversi per i diversi motori di ricerca. Tuttavia, molti di loro si sforzano, se possibile, di coprire nel loro lavoro l'intero spazio del World Wide Web.

Per cercare informazioni utilizzando un motore di ricerca, l'utente formula una query di ricerca. In base alla richiesta dell'utente, il motore di ricerca genera una pagina dei risultati di ricerca. Tali risultati di ricerca possono combinare diversi tipi di file, ad esempio: pagine web, immagini, file video. Alcuni motori di ricerca estraggono anche dati da database e directory di risorse su Internet.

In base ai metodi di ricerca e di servizio, si dividono quattro tipi di motori di ricerca:

1.Sistemi che utilizzano robot di ricerca.

2.sistemi controllati dall'uomo

3.sistemi ibridi

4.meta-sistemi.

L'architettura del motore di ricerca include: un robot di ricerca che esegue la scansione dei siti Internet, un indicizzatore che fornisce una ricerca rapida e un motore di ricerca, un'interfaccia grafica per l'utente.

Lo scopo di un motore di ricerca è trovare documenti contenenti parole chiave o parole in qualsiasi modo correlate a parole chiave. Il motore di ricerca è migliore, più documenti rilevanti per la richiesta dell'utente verranno restituiti.

Esempi di motori di ricerca

Google- uno degli IPS stranieri più completi e apprezzati. Una caratteristica distintiva di Google ISS è la tecnologia per determinare il grado di rilevanza di un documento analizzando i collegamenti da altre fonti a questa risorsa. Più link a una pagina ci sono su altre pagine, maggiore è il suo posizionamento nell'IPS di Google. Google utilizza un algoritmo per calcolare l'autorità del PageRank. Il PageRank è uno dei fattori che contribuiscono al posizionamento dei siti nei risultati di ricerca. Il PageRank non è l'unico, ma molto importante, modo per determinare la posizione di un sito nei risultati di ricerca di Google. Google utilizza il PageRank delle pagine che colpisce per determinare l'ordine in cui tali pagine vengono visualizzate nei risultati di ricerca. Nel 2010, la società ha lanciato la ricerca vocale in Russia. Per cercare, devi premere il pulsante sul tuo telefono accanto alla barra di ricerca e pronunciare la tua richiesta, il telefono invierà il tuo voto al server e il browser visualizzerà una riga con la tua richiesta riconosciuta e i risultati della ricerca.

Яndex Attualmente è il motore di ricerca nazionale più popolare. Ha iniziato a lavorare nel 1997. Mantiene il proprio catalogo di risorse Internet. È anche il miglior motore di ricerca per identificare le illustrazioni. La versione in lingua inglese è fornita con una directory di risorse Internet. Dispone di un ampio sistema per la generazione di una richiesta. In particolare, è consentito inserire una prescrizione di ricerca in un linguaggio naturale - in questo caso, tutte le estensioni necessarie vengono eseguite automaticamente.

Oltre alle pagine Web HTML, Yandex indicizza i documenti in PDF (Adobe Acrobat), Rich Text Format (RTF), Word binario (.doc), Excel (.xls), PowerPoint (.ppt), RSS (blog e forum).

Società di motori di ricerca Mail.ruha iniziato a lavorare nel 2007. Il volume del file indice nella primavera del 2009 ammontava a oltre 1,5 miliardi di pagine situate su server in lingua russa. Oltre alla ricerca di testi, il sistema cerca illustrazioni e video clip pubblicati su server russi specializzati "compilati da sé": Photo @ Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Video @ Mail.Ru, RuTube, Loadup, Rambler Vision e simili. Gogo.ru ti consente di limitare la tua ricerca a siti commerciali, siti di informazione, nonché forum e blog. Il modulo "Ricerca avanzata" consente inoltre di limitare le ricerche a determinati tipi di file (PDF, DOC, XLS, PPT), la posizione delle parole cercate in un documento o un dominio specifico. Novembre 2013 in Google Play è apparsa una nuova versione dell'applicazione di ricerca di Mail.Ru, che consente di passare dalla schermata principale a qualsiasi social network e contiene un accesso rapido per la ricerca di immagini, video e notizie. L'applicazione Android si è trasformata in un mini-browser progettato per trovare in modo efficiente le informazioni di cui hai bisogno. L'utilità ha anche imparato a riconoscere le query di ricerca impostate non dal testo, ma dalla voce. Gli sviluppatori notano inoltre di aver creato un widget speciale che può essere posizionato nella schermata iniziale di uno smartphone o tablet basato sul sistema Google Android. L'implicazione è che ciò ridurrà ulteriormente il tempo impiegato per la ricerca.

AltaVista- uno dei motori di ricerca più antichi occupa uno dei primi posti in termini di volume di documenti: oltre 350 milioni. AltaVista consente ricerche semplici e avanzate. "Aiuto" consente anche agli utenti inesperti di formulare correttamente query semplici e complesse.

Rambler- uno dei primi IPS russi, aperto nel 1996. Alla fine del 2002, è stata effettuata una modernizzazione radicale, dopo di che Rambler è entrato di nuovo nel gruppo dei leader nella ricerca in rete. Attualmente, il volume dell'indice è di circa 150 milioni di documenti. Per comporre query complesse, si consiglia di utilizzare la modalità "Query dettagliata", che offre ampie opportunità per compilare una prescrizione di ricerca utilizzando le voci di menu.

APORT... Oggi il volume del suo database supera i 20 milioni di documenti. Il sistema dispone di un'ampia gamma di funzionalità di ricerca. APORT ha la funzione di traduttore integrato, questo dà all'utente la possibilità di formulare richieste, sia in russo che inglese... Inoltre, APORT dispone di modalità speciali per la ricerca di illustrazioni e file audio.

L'ultima generazione di motori di ricerca indicizza tutte le parole di una pagina web o di un articolo di un convegno, mentre in precedenza l'area dell'indicizzazione era solitamente limitata al titolo, ai titoli, alle prime righe e all'indirizzo del documento. Ciò ha limitato in modo significativo la capacità di identificare i materiali su un argomento ristretto, poiché i risultati della ricerca non sempre riflettevano i dati effettivi. Eliminando questa lacuna, i motori di ricerca moderni sono diventati molto più affidabili dei loro predecessori.

La prossima caratteristica più importante è il miglioramento del motore di ricerca interno, che si esprime in un aumento del numero di operatori e altri elementi di composizione delle query. Alcuni anni fa, erano in uso solo due, al massimo, tre operatori booleani classici: AND (e), OR (o) e NOT (non). Ora ci sono NEAR (near, near) in Alta Vista e FOLLOWED BY (following) in OpenText - operatori di distanza estremamente utili che ti consentono di rendere la tua query il più specifica possibile. Molti sistemi consentono di troncare le terminazioni dei termini, limitare la ricerca in base alla data di creazione del documento, cercare parole chiave solo negli elementi designati delle pagine Web (titolo, intestazioni, indirizzo e-mail, ecc.) E cercare anche la frase esatta. Gli ultimi sviluppi consentono anche di rilevare file di un certo tipo (ad esempio, grafica o audio) e sono sensibili alle lettere minuscole e maiuscole. La capacità di cercare dati in qualsiasi lingua sta diventando comune. Tutto ciò consente di redigere una ricetta di ricerca con un alto grado di accuratezza, il che, ovviamente, aumenta la rilevanza dei risultati ottenuti.

Sul questo momento i motori di ricerca più popolari Google e Yandex, confrontiamoli:

    Numero di pagine indicizzate. Google ha 8 miliardi e Yandex ne ha solo 2 miliardi. Cioè quattro volte di meno. Vincere per Google.

    Velocità di indicizzazione della pagina. Google indicizza le nuove pagine entro 24 ore, mentre Yandex potrebbe richiedere diversi giorni. Ancora una volta Google vince.

    Rilevanza dell'emissione. La pertinenza si riferisce alla corrispondenza dei risultati visualizzati nella pagina del motore di ricerca alla tua query. Devo dire subito che qui è difficile determinare il vincitore. Google ha mostrato buoni risultati nel segmento estero di Internet, ma in Runet Yandex è sempre stato un po 'avanti.

    Servizi Internet aggiuntivi. Qui il vantaggio è chiaramente con Yandex. Ha dozzine di servizi diversi che sono convenientemente raggruppati in categorie, mentre Google ne ha meno, inoltre c'è l'integrazione con il social network Google+, che a molte persone non piace.

Ciao cari lettori! Ekaterina Kalmykova con te. L'articolo di oggi sarà dedicato a un concetto come un motore di ricerca, a cosa è, a cosa serve. Daremo anche un'occhiata più da vicino ai tipi di motori di ricerca su Internet.

Se hai una domanda: "Perché devo sapere di questi motori di ricerca?" Risponderò in questo modo. Quando mangi una deliziosa zuppa in un ristorante, ti piacerebbe sapere di quali ingredienti è composta per poterla ripetere anche tu a casa? Dopotutto, se sei soddisfatto del risultato finale, cioè del gusto della zuppa, allora probabilmente ti interesserebbe sapere cosa ha portato a un tale risultato?

Puoi anche dire di lavorare con un motore di ricerca (PS). Se crei il tuo blog in futuro, quindi conoscendo il lavoro del PS, non dovrai cercare aiuto da specialisti. Puoi gestire autonomamente il tuo progetto in questo modo in modo che il motore di ricerca possa vederlo e mostrarlo ad altri utenti. Dopotutto, il traffico verso la tua risorsa e, di conseguenza, i guadagni dipenderanno da questo.

Quindi iniziamo.

Cos'è un motore di ricerca?

Un motore di ricerca è una risorsa speciale su Internet che fornisce informazioni all'utente in base alla sua richiesta. Cioè, questa risorsa raccoglie tutti i dati sulla rete globale, tutti i progetti web e, quando viene ricevuta una determinata richiesta da parte dell'utente, fornisce le informazioni richieste necessarie inviandole, ad esempio, a un blog oa un sito web tematico.

Quindi, dopo aver creato il tuo progetto, il tuo compito entrerà nella SERP, cioè la “lista” o la base del motore di ricerca. Poiché la promozione del sito Web su Internet non è semplicemente possibile senza l'utilizzo di un motore di ricerca, quindi, dovrai prenderti cura della qualità della tua risorsa, della sua ottimizzazione interna ed esterna. Parleremo di come farlo nei seguenti articoli. Quindi da non perdere.

Nel frattempo, se decidi di creare il tuo blog, ti consiglio di leggere questi articoli:

Poiché le nuove risorse web compaiono quasi ogni giorno, di conseguenza, la base dei motori di ricerca deve essere costantemente aggiornata. Ogni nuovo sito creato deve essere indicizzato da un robot. A proposito di in parole semplici, Assistenti PS: i robot devono familiarizzare con la nuova risorsa e trasferire questi dati al motore di ricerca stesso.

Bene, qui probabilmente hai intuito che quando un robot visita il tuo blog, dovrebbe apprezzare tutto. Il tuo destino futuro dipenderà da questo ospite.

Ti dirò come rendere il robot del tuo progetto assolutamente felice in uno dei seguenti articoli. Non perdetevela, ci saranno informazioni interessanti e molto interessanti, che condividerò con voi.

I motori di ricerca funzionano

Tutto il lavoro relativo al motore di ricerca inizia con l'inserimento della query richiesta nella barra di ricerca. Cosa possono cercare gli utenti? Qualunque cosa, da una ricetta per torte di cavolo e per finire con l'eterna domanda "come fare più soldi senza fare nulla".

Affinché la tua risorsa venga fuori come risposta a una domanda, devi stare al passo con i tuoi concorrenti. Per questo, devi prestare particolare attenzione alla promozione del tuo progetto, che include attività come la scrittura di contenuti ottimizzati di alta qualità, cioè rispondere alle richieste di articoli, migliorare il fattore comportamentale, cioè, in modo che il tuo lettore sia interessato a essere sulla risorsa, questo sta migliorando l'usabilità, cioè la comodità del visitatore e molti altri fattori. Impareremo tutti a farlo con te.

Componenti del motore di ricerca

E cosa aiuta i motori di ricerca, ad esempio, Google a indicizzare la tua risorsa?

  1. Gli agenti sono dipendenti che svolgono la maggior parte del lavoro: indicizzano e analizzano i siti.
  2. Spiders (spider) - un programma che può scaricare pagine di una risorsa web e raccogliere informazione Generale su di lui.
  3. Crawlers (crawler) - un programma che trova tutti i link nelle pagine, dopodiché cerca nuovi dati non familiari ai motori di ricerca.
  4. Indicizzatore: analizza testo, intestazioni, stile, ecc.
  5. Robot: indicizza le pagine dei tuoi contenuti ed esplora una varietà di link.

Affinché l'indicizzazione avvenga nel modo desiderato, crei un documento speciale "robots.txt". Consente al sistema di controllare solo le pagine che ti servono e di rimuovere ciò che non dovresti vedere.

Tipi di motori di ricerca

Esistono diverse opzioni per i sistemi di recupero delle informazioni:

  • Directory. Un semplice confronto di ricerca è uno scaffale in una libreria. Tutto è memorizzato lì in sottocategorie e categorie di un determinato argomento. Se ti trovi in \u200b\u200bun simile motore di ricerca, allora credimi, le informazioni che troverai saranno più che utili e comprensibili per la tua percezione. Indovina quale sito comune in questione? Ovviamente su Wikipedia, che ha raccolto un'intera directory di informazioni utili.
  • Puntatori di ricerca. La ricerca dei dati viene eseguita utilizzando frasi chiave. Questo è allo stesso tempo comodo e scomodo. Penso che le persone che mi stanno cercando, ad esempio, "La ragazza mostra la classe", mi capiranno, per scoprire come una ragazza mostra il pollice in alto e qualcosa di non molto decente viene fuori dalla ricerca. 🙂 Questo tipo di ricerca caratterizza la maggior parte dei motori di ricerca.
  • Sistemi di valutazione. Determina la tua popolarità in base al numero di visite. Naturalmente, questo non è il criterio migliore, poiché non sempre si tiene conto dell'utilità e della qualità della risorsa stessa. Un esempio di un tale sistema è la risorsa Internet alexa.com.

Anche i server di ricerca sono suddivisi in generale e specializzato... I motori di ricerca generali ordinano i dati delle informazioni senza alcun ordinamento tra tutte le risorse web a loro note. Questi includono Yandex, Rambler, Google. Specializzato: ordina in base alla lingua utilizzata.

Inoltre, i motori di ricerca possono essere suddivisi in distribuzione regionale e globale.

Oggi tutti i motori di ricerca migliorano costantemente i propri algoritmi per la selezione di risorse rilevanti e di alta qualità.

Un po 'di storia

In Runet PS è apparso nel 1996 - questi sono Aport e Rambler. Un anno dopo, nel 1997, è stata costituita Yandex e un anno dopo, nel 1998, è apparso un altro concorrente: Google. Al momento, i più popolari sono Yandex e Google.

Quali sono i motori di ricerca più popolari adesso?

Ecco le statistiche:

Come puoi vedere, Yandex è ora il più popolare in Russia, insieme a Google e Mail.

Pertanto, puoi vedere le ricerche principali su cui dovresti concentrarti durante la creazione e la promozione del tuo progetto.

Motore di ricerca Yandex (Yandex)

Il principio di funzionamento è il seguente: inserire la query richiesta nella casella di ricerca, fare clic su "Trova" e vedere i risultati. Yandex ha raccolto 13 milioni di risposte alla tua richiesta. Puoi anche cercare in immagini, video, mercato (guarda la colonna di sinistra).

Inoltre, puoi configurare la regione per la tua ricerca. Per fare ciò, fare clic sull'icona accanto alla croce nella barra di ricerca e selezionare la regione desiderata nella finestra del filtro.

Motore di ricerca di Google

Google funziona per analogia con Yandex. Puoi cercare informazioni in diverse sezioni: immagini, video, notizie, mappe, ecc.

Se clicchi su "Strumenti di ricerca", si aprirà un pannello con le impostazioni, dove potrai selezionare una regione, una lingua e quanto tempo ci vuole per cercare le informazioni.

Ora sai quali motori di ricerca esistono su Internet, hai visto anche quelli più popolari e ora, armato di informazioni, puoi stabilire le tue connessioni e l'interazione con i motori di ricerca.

È tutto per oggi. Come ti piace l'articolo?

Arrivederci a tutti

Ti consiglio di aggiornare il tuo blog per non perderti le ultime novità.

Ekaterina Kalmykova

Sono uno dei principali e più importanti servizi Internet.

Con l'aiuto dei motori di ricerca, miliardi di utenti Internet trovano le informazioni di cui hanno bisogno.

Cos'è un motore di ricerca?

Il motore di ricerca è un complesso software e hardware che utilizza algoritmi speciali per elaborare un'enorme quantità di informazioni su una varietà di siti, sul loro contenuto fino a ciascuna pagina.

Un motore di ricerca, dal punto di vista dei normali visitatori, è un sito così intelligente che contiene molte informazioni e risponde a qualsiasi domanda degli utenti.

In diversi paesi, gli utenti di Internet utilizzano diversi motori di ricerca. Nel segmento di lingua inglese di Internet, il motore di ricerca più popolare è Google.

Motori di ricerca in Runet

In Russia, più della metà degli utenti preferisce il motore di ricerca Yandex e Google rappresenta circa il 35% delle query. Il resto degli utenti utilizza Rambler, Mail.ru, Nigma e altri servizi.

In Ucraina, circa il 60% degli utenti utilizza Google, mentre Yandex rappresenta poco più del 25% delle richieste elaborate.

Pertanto, quando si promuovono siti su Runet, gli esperti cercano di promuovere il sito, concentrandosi sui motori di ricerca Yandex e Google.

Attività del motore di ricerca

Per rispondere alle domande dei visitatori nel modo più accurato possibile, i motori di ricerca dovrebbero eseguire le seguenti attività:

  1. Raccogli informazioni in modo rapido ed efficiente su varie pagine di siti diversi.
  2. Elaborare le informazioni su queste pagine e determinare a quale richiesta o richieste corrispondono.
  3. Genera ed emetti risultati di ricerca in risposta alle richieste degli utenti.

Componenti dei motori di ricerca

I motori di ricerca sono complessi pacchetto software, che si compone dei seguenti blocchi principali:

  1. Raccolta dati.
  2. Indicizzazione.
  3. Calcolo.
  4. Ranging.

Questa divisione è condizionale, poiché il lavoro dei diversi motori di ricerca è leggermente diverso l'uno dall'altro.

1. Raccolta dati

In questa fase, il compito è trovare nuovi documenti, fare un piano per visitarli e scansionarli.

I webmaster devono far conoscere ai motori di ricerca l'emergere di nuovi materiali inserendo l'indirizzo della pagina nell'add-on o guidando l'annuncio della pagina sui social network.

Personalmente, utilizzo quest'ultimo metodo e penso che questo sia abbastanza.

Un commento. Divagherò un po 'e ti parlerò dell'efficacia di pubblicare annunci in social networks sulla velocità di indicizzazione delle nuove pagine del sito.

Utilizzo il servizio text.ru per controllare e correggere l'unicità del testo sulle pagine del mio sito.

Controlla qualitativamente l'unicità, la corregge e permette di posizionare un banner di unicità sulle pagine del tuo sito.

Ma a volte questo servizio ha una lunga coda per l'elaborazione. Ho avuto diversi casi in cui non ho aspettato un controllo di unicità, ho pubblicato un articolo sul sito e l'ho inviato ai social network.

Se il controllo di unicità è stato ritardato di circa un'ora o più, la percentuale di unicità era sempre 0%. Ciò significa che in meno di un'ora dopo il posizionamento, la pagina è già stata indicizzata e inserita nel database del motore di ricerca.

2. Indicizzazione

I motori di ricerca raccolgono dati su nuove pagine web e li inseriscono nel loro database. In questo caso, viene formato un indice, ovvero una chiave per accesso veloce ai dati in questa pagina, se necessario.

3. Calcolo

Dopo essere entrati nel database, le pagine dei nostri siti passano attraverso la fase di calcolo di vari parametri e indicatori.

Quanti di questi indicatori e come sono calcolati per dire esattamente, ad eccezione degli stessi sviluppatori degli algoritmi dei motori di ricerca, nessuno può.

4. Classifica

Quindi, sulla base dei parametri e degli indicatori calcolati, viene determinata la rilevanza della pagina per determinate richieste e viene eseguita la classificazione di questa pagina.

Ciò sarà importante per la formazione rapida e di alta qualità della pagina dei risultati di ricerca per queste query.

I motori di ricerca generano risposte alle domande degli utenti e generano risultati per loro sotto forma di una pagina dei risultati di ricerca.

Va notato che gli algoritmi per l'elaborazione dei dati delle pagine, la formazione di indicatori e i metodi di classificazione vengono costantemente migliorati. Le priorità per la classifica stanno cambiando.
I motori di ricerca si sforzano di rispondere alle richieste degli utenti nel modo più accurato possibile, cercando di tenere conto della natura della richiesta, degli interessi di un particolare utente, del suo luogo di residenza, età, sesso, abitudini, inclinazioni.

Per mantenere e sviluppare con successo il nostro blog, dobbiamo prima di tutto sapere e con quali algoritmi funzionano. Una chiara comprensione delle risposte a queste domande ci consentirà di risolvere con successo i problemi di promozione del sito web nei motori di ricerca. Ma la conversazione sull'ottimizzazione dei siti per i motori di ricerca è ancora avanti, ma per ora una piccola teoria sui motori di ricerca.

Cosa sono i motori di ricerca su Internet?

Se ci rivolgiamo a Wikipedia, ecco cosa impariamo:

"Un motore di ricerca è un complesso software e hardware con un'interfaccia web che consente di cercare informazioni su Internet".

E ora in una lingua che capiamo. Diciamo che abbiamo urgentemente bisogno di informazioni su un determinato argomento. In modo che possiamo trovarlo rapidamente e creare motori di ricerca - siti in cui inserendo una query di ricerca nel modulo di ricerca, ci verrà fornito un elenco di siti su cui, con un alto grado di probabilità, troveremo ciò che stiamo cercando. Questo elenco è chiamato risultati di ricerca. Può essere costituito da milioni di pagine di 10 siti ciascuna. Il compito principale di un webmaster è entrare almeno nella top ten.

Ricorda che quando cerchi qualcosa sul web, di solito lo trovi nella prima pagina dei risultati di ricerca, raramente vai alla seconda e ancor più nelle successive. Ciò significa che più alto è il sito, più visitatori arriveranno alle sue pagine. E il traffico elevato (numero di visitatori al giorno) è, tra le altre cose, una buona opportunità.

In che modo i motori di ricerca Internet trovano informazioni su Internet e su quale base assegnano i posti nei risultati di ricerca?

In poche parole, motore di ricerca su Internet - questa è un'intera rete in cui i robot ragno scansionano costantemente il web e ricordano tutti i testi che entrano in Internet. Analizzando i dati ottenuti, i motori di ricerca selezionano i documenti più rilevanti per la query di ricerca, cioè quelli rilevanti, dai quali si formano i risultati della ricerca.

La cosa più interessante è che i motori di ricerca non possono leggere. Allora come trovano le informazioni? Gli algoritmi dei motori di ricerca si riducono a pochi principi di base. Prima di tutto, prestano attenzione al titolo e alla descrizione dell'articolo, ai titoli dei paragrafi, ai punti salienti semantici nel testo e alla densità parole chiave, che deve necessariamente corrispondere all'oggetto dell'articolo. Più accurata è questa corrispondenza, più alto sarà il sito nei risultati di ricerca. Inoltre, si tiene necessariamente conto della quantità di informazioni e di molti altri fattori. Ad esempio, l'autorità di una risorsa web, che dipende dal numero e dall'autorità dei siti che si collegano ad essa. Più autorità hai, più alto sarà il tuo ranking.

Viene chiamato un insieme di misure volte ad aumentare la posizione del sito nei risultati di ricerca per determinate query ottimizzazione del motore di ricerca... Questa è un'intera scienza -. Ma ne riparleremo più avanti.

Al momento, ci sono molti motori di ricerca nel mondo. Nominerò i più popolari. Ad ovest, questi sono: Google, Bing e Yahoo. In Runet - Yandex, Mail.ru, Rambler e Nigma. Fondamentalmente, gli utenti danno la preferenza al leader mondiale e il sistema Yandex è diventato il più popolare nell'Internet di lingua russa.

Un po 'di storia. Google è stata fondata nel 1997 da un nativo di Mosca Sergey Brin e il suo amico americano Larry Page durante i loro studi alla Stanford University.

La particolarità di Google era che mostrava i risultati di ricerca più rilevanti in una sequenza logica alle prime posizioni nei risultati di ricerca, mentre il resto dei motori di ricerca era impegnato in un semplice confronto di parole in una query con parole su una pagina web.

Il 23 settembre dello stesso anno è stato annunciato il sistema Yandex, che dal 2000 ha iniziato ad esistere come società separata "Yandex".

Non ti annoierò più, spero che sia un po 'chiaro ora cosa sono i motori di ricerca in Internet... Va detto che gli algoritmi dei motori di ricerca sono in continua evoluzione. Ogni giorno i motori di ricerca sono in grado di determinare meglio le esigenze degli utenti e di mostrare loro nei risultati di ricerca le informazioni più rilevanti in base a molti fattori (regionalità, che interroga l'utente ha già richiesto, quali siti ha visitato durante la ricerca, dove è andato da loro, ecc.).

Presto Google e Yandex sapranno meglio di noi di cosa abbiamo bisogno e cosa pensiamo.!

L'architettura del motore di ricerca include in genere:

YouTube enciclopedico

    1 / 5

    ✪ Lezione 3: come funziona il motore di ricerca. Introduzione alla SEO

    ✪ Motore di ricerca dall'interno

    ✪ Shodan - Google nero

    ✪ Il motore di ricerca CHEBURASHKA sostituirà Google e Yandex in Russia

    ✪ Lezione 1 - Come funziona il motore di ricerca

    Sottotitoli

Storia

Cronologia
Anno Sistema Evento
1993 W3Catalog?! In esecuzione
Aliweb In esecuzione
JumpStation In esecuzione
1994 WebCrawler In esecuzione
Infoseek In esecuzione
Lycos In esecuzione
1995 AltaVista In esecuzione
Daum Base
Apri il testo Indice web In esecuzione
Magellan In esecuzione
Eccitare In esecuzione
SAPO In esecuzione
Yahoo! In esecuzione
1996 Dogpile In esecuzione
Inktomi Base
Rambler Base
HotBot Base
Chiedi a jeeves Base
1997 Luce del Nord In esecuzione
Yandex In esecuzione
1998 Google In esecuzione
1999 AlltheWeb In esecuzione
GenieKnows Base
Naver In esecuzione
Teoma Base
Vivisimo Base
2000 Baidu Base
Exalead Base
2003 Info.com In esecuzione
2004 Yahoo! Ricerca Lancio finale
A9.com In esecuzione
Sogou In esecuzione
2005 Ricerca MSN Lancio finale
Ask.com In esecuzione
Nygma In esecuzione
GoodSearch In esecuzione
Cercami Base
2006 wikiseek Base
Quaero Base
Ricerca diretta In esecuzione
ChaCha Lancio (beta)
Guruji.com Lancio (beta)
2007 wikiseek In esecuzione
Sproose In esecuzione
Wikia Search In esecuzione
Blackle.com In esecuzione
2008 DuckDuckGo In esecuzione
Tooby In esecuzione
Picollator In esecuzione
Viewzi In esecuzione
Cuil In esecuzione
Boogami In esecuzione
LeapFish Lancio (beta)
Forestle In esecuzione
VADLO In esecuzione
Powerset In esecuzione
2009 Bing In esecuzione
KAZ.KZ In esecuzione
Yebol Lancio (beta)
Mugurdy Chiusura
Scout In esecuzione
2010 Cuil Chiusura
Blekko Lancio (beta)
Viewzi Chiusura
2012 WAZZUB In esecuzione
2014 Satellitare Lancio (beta)

Agli albori di Internet, Tim Berners-Lee manteneva un elenco di server web ospitati sul sito web del CERN. C'erano sempre più siti e diventava sempre più difficile mantenere un tale elenco manualmente. Il sito web dell'NCSA aveva una novità speciale! (English What "s New!), Dove hanno pubblicato collegamenti a nuovi siti.

Il primo programma per computer c'era un programma per la ricerca in Internet Archie (L'inglese archie è un archivio senza la lettera "in"). È stato creato nel 1990 da Alan Emtage, Bill Heelan e J. Peter Deutsch, studenti di informatica alla McGill University di Montreal. Il programma ha scaricato un elenco di tutti i file da tutti i server FTP anonimi disponibili e ha creato un database che può essere cercato in base ai nomi dei file. Tuttavia, il programma di Archie non indicizzava il contenuto di questi file, poiché la quantità di dati era così piccola che tutto poteva essere facilmente trovato manualmente.

Sviluppo e distribuzione protocollo di rete Gopher, inventato nel 1991 da Mark McCahill presso l'Università del Minnesota, ha portato alla creazione di due nuovi programmi di ricerca, Veronica e Jughead. Come Archie, hanno cercato nomi di file e intestazioni archiviati nei sistemi di indice Gopher. Veronica (ing. Indice molto semplice a livello di rete orientato ai roditori per gli archivi computerizzati) consentiva ricerche di parole chiave per la maggior parte dei titoli di menu Gopher in tutti gli elenchi Gopher. Programma Jughead (ing. Scavo e esposizione della gerarchia universale di Jonzy) ha recuperato le informazioni del menu da specifici server Gopher. Sebbene il nome del motore di ricerca Archie non avesse nulla a che fare con il ciclo dei fumetti "Archie"tuttavia Veronica e Jughead sono i personaggi di questi fumetti.

Nell'estate del 1993 non esisteva ancora un sistema per la ricerca sul web, sebbene numerose directory specializzate fossero mantenute manualmente. Oscar Nierstrasz dell'Università di Ginevra ha scritto una serie di script Perl che periodicamente copiava queste pagine e le riscriveva in formato standard... Questa è diventata la base per W3Catalog?!, il primo motore di ricerca primitivo del Web, lanciato il 2 settembre 1993.

Probabilmente il primo crawler ad essere scritto in Perl è stato il "World Wide Web Wanderer", il bot di Matthew Gray del giugno 1993. Questo robot ha creato l'indice di ricerca Wandex. L'obiettivo del robot Wanderer era misurare le dimensioni world Wide Web e trova tutte le pagine web che contengono le parole della query. Nel 1993 apparve il secondo motore di ricerca, Aliweb. Aliweb non ha utilizzato un crawler, ma ha invece atteso le notifiche dagli amministratori del sito Web sulla presenza di un file di indice in un determinato formato sui propri siti.

JumpStation, creato nel dicembre 1993 da Jonathan Fletcher, cercava pagine web e costruiva i propri indici con un crawler e utilizzava un modulo web come interfaccia per formulare le ricerche. È stato il primo strumento di ricerca su Internet a combinare le tre funzioni essenziali di un motore di ricerca (convalida, indicizzazione e ricerca effettiva). A causa delle limitate risorse dei computer in quel momento, l'indicizzazione e, di conseguenza, le ricerche erano limitate solo ai titoli e ai titoli delle pagine web trovati dal robot di ricerca.

I motori di ricerca hanno partecipato alla bolla delle dot-com della fine degli anni '90. Diverse aziende sono entrate con successo nel mercato, generando profitti record durante la loro offerta pubblica iniziale. Alcuni hanno abbandonato il mercato dei motori di ricerca open source e hanno iniziato a lavorare solo con il settore aziendale, ad esempio, Luce del Nord.

Google ha adottato l'idea di vendere parole chiave nel 1998, quando era una piccola azienda che alimentava il motore di ricerca su goto.com. La mossa ha preannunciato un passaggio per i motori di ricerca dalla competizione tra loro a una delle iniziative imprenditoriali più redditizie su Internet. I motori di ricerca hanno iniziato a vendere le prime posizioni nei risultati di ricerca a singole aziende.

Il motore di ricerca di Google è stato importante sin dai primi anni 2000. L'azienda ha raggiunto una posizione elevata grazie a buoni risultati di ricerca utilizzando l'algoritmo PageRank. L'algoritmo è stato presentato al pubblico nell'articolo "The Anatomy of Search Engine", scritto da Sergey Brin e Larry Page, fondatori di Google. Questo algoritmo iterativo classifica le pagine Web in base a una stima del numero di collegamenti ipertestuali a una pagina Web, assumendo più collegamenti a pagine "buone" e "importanti" rispetto ad altri. L'interfaccia di Google è spartana e non ha nulla di superfluo, a differenza di molti dei suoi concorrenti che hanno integrato un motore di ricerca in un portale web. Il motore di ricerca di Google è diventato così popolare che c'erano sistemi che lo imitano, ad esempio, Cercatore di mistero(motore di ricerca segreto).

Cerca informazioni in russo

Nel 1996 è stata implementata una ricerca tenendo conto della morfologia russa sul motore di ricerca Altavista e dell'originale russo motori di ricerca Rambler e Aport. Il 23 settembre 1997 è stato lanciato il motore di ricerca Yandex. Il 22 maggio 2014 Rostelecom ha lanciato il motore di ricerca nazionale Sputnik, che al momento del 2015 è in beta testing. Il 22 aprile 2015 è stato inaugurato nuovo servizio Satellitare. Bambini appositamente per bambini con maggiore sicurezza.

I metodi di analisi dei cluster e di ricerca dei metadati sono diventati molto popolari. Tra le auto internazionali di questo tipo, la più famosa è quella ricevuta "Clusty" azienda Vivisimo... Nel 2005, con il supporto dell'Università statale di Mosca, è stato lanciato in Russia il motore di ricerca "Nigma", che supporta il clustering automatico. Nel 2006 è stata aperta la metamacchina russa Quintura, che offre cluster visivi sotto forma di tag cloud. Nygma ha anche sperimentato il raggruppamento visivo.

Come funziona il motore di ricerca

I componenti principali di un motore di ricerca: robot di ricerca, indicizzatore, motore di ricerca.

In genere, i sistemi funzionano in fasi. Innanzitutto, il crawler riceve il contenuto, quindi l'indicizzatore genera un indice ricercabile e, infine, il motore di ricerca fornisce la funzionalità per cercare i dati indicizzati. Per aggiornare il motore di ricerca, questo ciclo di indicizzazione viene ripetuto.

I motori di ricerca funzionano memorizzando le informazioni su molte pagine web che recuperano dalle pagine HTML. Un crawler o "crawler" è un programma che passa automaticamente attraverso tutti i link trovati in una pagina e li evidenzia. Il crawler, in base ai collegamenti o in base a un elenco predeterminato di indirizzi, cerca nuovi documenti che non sono ancora noti al motore di ricerca. Il proprietario del sito può escludere determinate pagine utilizzando il file robots.txt, che può essere utilizzato per impedire l'indicizzazione di file, pagine o directory del sito.

Il motore di ricerca analizza il contenuto di ogni pagina per un'ulteriore indicizzazione. Le parole possono essere estratte da intestazioni, testo della pagina o campi speciali - meta tag. Un indicizzatore è un modulo che analizza una pagina dopo averla scomposta in parti utilizzando i propri algoritmi lessicali e morfologici. Tutti gli elementi della pagina web vengono isolati e analizzati separatamente. I dati sulle pagine Web vengono archiviati in un database di indice per essere utilizzati nelle query successive. L'indice consente di trovare rapidamente informazioni sulla richiesta di un utente. Alcuni motori di ricerca come Google memorizzano la pagina originale in tutto o in parte, la cosiddetta cache, oltre a varie informazioni sulla pagina web. Altri sistemi, come il sistema AltaVista, memorizzano ogni parola di ogni pagina che trovano. L'utilizzo della cache aiuta a velocizzare il recupero delle informazioni dalle pagine già visitate. Le pagine memorizzate nella cache contengono sempre il testo specificato dall'utente query di ricerca... Ciò può essere utile nel caso in cui la pagina web sia stata aggiornata, ovvero non contenga più il testo della richiesta dell'utente e la pagina nella cache sia ancora vecchia. Questa situazione è legata alla perdita di link (ing. linkrot) e l'approccio user-friendly (usabilità) di Google. Ciò implica il recupero di brevi porzioni di testo dalla cache contenente il testo della richiesta. Si applica il principio della minima sorpresa, l'utente solitamente si aspetta di vedere le parole di ricerca nei testi delle pagine ricevute ( Aspettative degli utenti). Oltre ad accelerare le ricerche utilizzando le pagine memorizzate nella cache, le pagine nella cache possono contenere informazioni che non sono più disponibili altrove.

Il motore di ricerca funziona con i file di output ricevuti dall'indicizzatore. Il motore di ricerca accetta le query degli utenti, le elabora utilizzando un indice e restituisce i risultati della ricerca.

Quando un utente inserisce una query in un motore di ricerca (solitamente utilizzando parole chiave), il sistema ne verifica l'indice e produce un elenco delle pagine web più adatte (ordinate secondo un criterio), solitamente con una breve annotazione contenente il titolo del documento e talvolta parti del testo. L'indice di ricerca è costruito utilizzando una tecnica speciale basata sulle informazioni estratte dalle pagine web. Dal 2007 il motore di ricerca di Google consente di effettuare ricerche in base al tempo, creare i documenti desiderati (richiamare il menu "Strumenti di ricerca" e specificare l'intervallo di tempo). La maggior parte dei motori di ricerca supporta l'uso degli operatori booleani AND, OR, NOT nelle query, che consente di perfezionare o espandere l'elenco delle parole chiave cercate. In questo caso, il sistema cercherà le parole o le frasi esattamente come sono state inserite. Alcuni motori di ricerca hanno l'opzione ricerca approssimativa, in questo caso, gli utenti espandono la ricerca specificando la distanza dalle parole chiave. Ci sono anche ricerca concettuale, che utilizza l'analisi statistica dell'uso di parole e frasi cercate nei testi delle pagine web. Questi sistemi consentono di comporre query in linguaggio naturale. Un esempio di un tale motore di ricerca è ask com.

L'utilità di un motore di ricerca dipende dalla rilevanza delle pagine che trova. Sebbene milioni di pagine web possano includere una parola o una frase, alcune potrebbero essere più pertinenti, popolari o autorevoli di altre. La maggior parte dei motori di ricerca utilizza tecniche di posizionamento per portare i risultati "migliori" in cima alla lista. I motori di ricerca decidono quali pagine sono più rilevanti e in quale ordine devono essere visualizzati i risultati, in modi diversi. I metodi di ricerca, come Internet stesso, cambiano nel tempo. È così che sono apparsi due tipi principali di motori di ricerca: sistemi di parole chiave predefinite e ordinate gerarchicamente e sistemi in cui viene generato un indice invertito basato sull'analisi del testo.

La maggior parte dei motori di ricerca sono imprese commerciali che traggono profitto dalla pubblicità, in alcuni motori di ricerca è possibile acquistare i primi posti nella SERP per le parole chiave date a pagamento. Quei motori di ricerca che non fanno pagare per l'ordine di consegna dei risultati, guadagnano pubblicità contestualementre i messaggi pubblicitari corrispondono alla richiesta dell'utente. Tali annunci vengono visualizzati su una pagina con un elenco di risultati di ricerca e i motori di ricerca guadagnano ogni volta che un utente fa clic sugli annunci.

Tipi di motori di ricerca

Esistono quattro tipi di motori di ricerca: robotici, guidati dall'uomo, ibridi e meta-sistemi.

  • sistemi di motori di ricerca
Sono costituiti da tre parti: il crawler ("bot", "robot" o "spider"), l'indice e il software del motore di ricerca. È necessario un crawler per eseguire la scansione della rete e creare elenchi di pagine web. L'Indice è un grande archivio di copie di pagine web. Lo scopo del software è valutare i risultati della ricerca. A causa del fatto che il robot di ricerca in questo meccanismo esplora costantemente la rete, le informazioni sono più rilevanti. La maggior parte dei motori di ricerca moderni sono di questo tipo.
  • sistemi gestiti dall'uomo (directory delle risorse)
Questi motori di ricerca ricevono elenchi di pagine web. La directory contiene l'indirizzo, il titolo e una breve descrizione del sito. La directory delle risorse cerca solo i risultati dalle descrizioni delle pagine inviate dai webmaster. Il vantaggio dei cataloghi è che tutte le risorse vengono controllate manualmente, quindi, la qualità del contenuto sarà migliore rispetto ai risultati ottenuti automaticamente dal sistema del primo tipo. Ma c'è anche uno svantaggio: l'aggiornamento di questi cataloghi viene eseguito manualmente e può risultare notevolmente inferiore rispetto allo stato reale delle cose. Le classifiche delle pagine non possono cambiare all'istante. Esempi di tali sistemi sono directory di Yahoo , dmoz e Galaxy.
  • sistemi ibridi
I motori di ricerca come Yahoo, Google, MSN combinano le funzioni dei motori di ricerca e dei sistemi guidati dall'uomo.
  • meta-sistemi
I metasearch combinano e classificano i risultati di più motori di ricerca contemporaneamente. Questi motori di ricerca erano utili quando ogni motore di ricerca lo aveva indice univocoe i motori di ricerca erano meno intelligenti. Poiché la ricerca è migliorata molto ora, la loro necessità è diminuita. Esempi: MetaCrawler e MSN Search.

Mercato dei motori di ricerca

Google è il motore di ricerca più popolare al mondo con una quota di mercato del 68,69%. Bing è al secondo posto con una quota del 12,26%.

I motori di ricerca più popolari al mondo:

Sistema di ricerca Quota di mercato a luglio 2014 Quota di mercato nell'ottobre 2014 Quota di mercato a settembre 2015
Google 68,69 % 58,01 % 69,24%
Baidu 17,17 % 29,06 % 6,48%
Bing 6,22 % 8,01 % 12,26%
Yahoo! 6,74 % 4,01 % 9,19%
Aol 0,13 % 0,21 % 1,11%
Eccitare 0,22 % 0,00 % 0,00 %
Chiedi 0,13 % 0,10 % 0,24%

Asia

Nei paesi dell'Asia orientale e in Russia, Google non è il motore di ricerca più popolare. In Cina, ad esempio, è più popolare motore di ricerca Soso ?!.

In Corea del Sud, il portale di ricerca di Naver è utilizzato da circa il 70% di Yahoo! Giappone e Yahoo! Taiwan - il più sistemi popolari rispettivamente per le ricerche in Giappone e Taiwan.

Russia e motori di ricerca in lingua russa

Secondo i dati di LiveInternet del giugno 2015 sulla portata delle query di ricerca in lingua russa:

  • Tutto in lingue:
    • Yahoo! (0,1%) e motori di ricerca di proprietà di questa società: Inktomi, AltaVista, Alltheweb
  • Di lingua inglese e internazionale:
    • AskJeeves (Meccanismo Teoma)
  • Di lingua russa - la maggior parte dei motori di ricerca "di lingua russa" indicizza e cerca testi in molte lingue - ucraino, bielorusso, inglese, tartaro e altre. Differiscono dai sistemi "tutto lingue" che indicizzano tutti i documenti di seguito, in quanto indicizzano principalmente le risorse situate in zone di dominio dominate dalla lingua russa, o in altri modi limitano i loro robot a siti in lingua russa.

Alcuni motori di ricerca utilizzano algoritmi di ricerca esterni.

Dati quantitativi del motore di ricerca Google

Il numero di utenti Internet e motori di ricerca e le esigenze degli utenti per questi sistemi è in costante crescita. Per aumentare la velocità di ricerca delle informazioni necessarie, i motori di ricerca di grandi dimensioni contengono un gran numero di server. I server sono generalmente raggruppati in centri server (data center). I motori di ricerca popolari hanno centri server sparsi in tutto il mondo.

Nell'ottobre 2012, Google ha lanciato il progetto Where the Internet Lives, che offre agli utenti l'opportunità di esplorare i data center dell'azienda.

Informazioni sul lavoro di ricerca nei data center sistema di Google è noto quanto segue:

  • La capacità totale di tutti i data center di Google, a partire dal 2011, è stata stimata in 220 MW.
  • Quando Google pianificò di aprire un nuovo complesso di 6,5 milioni di m² in Oregon nel 2008, Harper's Magazine ha calcolato che un complesso così grande consuma oltre 100 megawatt di elettricità, che è paragonabile al consumo di energia di una città di 300.000. persona.
  • Il numero stimato di server Google nel 2012 è di 1.000.000.
  • Google spende in data center nel 2006 - $ 1,9 miliardi e nel 2007 - $ 2,4 miliardi.

La dimensione del World Wide Web, indicizzata da Google a dicembre 2014, è di circa 4,36 miliardi di pagine.

Motori di ricerca che considerano i divieti religiosi

La diffusione globale di Internet e l'aumento della popolarità dispositivi elettronici nel mondo arabo e musulmano, in particolare nei paesi del Medio Oriente e del subcontinente indiano, ha contribuito allo sviluppo di motori di ricerca locali che tengono conto delle tradizioni islamiche. Tali motori di ricerca contengono filtri speciali che aiutano gli utenti a non accedere a siti vietati, ad esempio siti con pornografia, e consentono loro di utilizzare solo quei siti il \u200b\u200bcui contenuto non è in contraddizione con la fede islamica. Poco prima del mese musulmano del Ramadan, nel luglio 2013, è stato presentato il mondo Halalgoogling - un sistema che fornisce agli utenti solo link "corretti" halal, filtrando i risultati di ricerca ricevuti da altri motori di ricerca come Google e Bing. Due anni prima, nel settembre 2011, è stato lanciato il motore di ricerca I'mHalal per servire gli utenti in Medio Oriente. Tuttavia, questo servizio di ricerca avrebbe dovuto chiudere presto, secondo il proprietario, per mancanza di fondi.

La mancanza di investimenti e il ritmo lento della diffusione della tecnologia nel mondo musulmano hanno ostacolato il progresso e ostacolato il successo di un serio motore di ricerca islamico. L'ovvio fallimento di enormi investimenti in progetti web sullo stile di vita musulmano, uno dei quali è stato Muxlim... Ha ricevuto milioni di dollari da investitori come Rite Internet Ventures e ora - secondo l'ultimo messaggio di I'mHalal prima della chiusura - ha la dubbia idea che “il prossimo Facebook o Google potrebbe essere solo in Medio Oriente. se sostieni la nostra brillante giovinezza ". Tuttavia, gli esperti islamici di Internet hanno passato molti anni a definire cosa è o non è conforme alla Shariah ea classificare i siti web come "halal" o "haram". Tutti i motori di ricerca islamici precedenti e attuali sono semplicemente un insieme di dati appositamente indicizzato, oppure sono i principali motori di ricerca come Google, Yahoo e Bing, con un sistema di filtraggio utilizzato per impedire agli utenti di accedere a siti haraam come come siti su nudità, LGBT, gioco d'azzardo e qualsiasi altro, il cui argomento è considerato anti-islamico.

Tra gli altri motori di ricerca orientati alla religione, Jewogle è comune. versione google e SeekFind.org, un sito cristiano che include filtri per proteggere gli utenti da contenuti che potrebbero minare o indebolire la loro fede.

Risultati personalizzati e bolle di filtro

Molti motori di ricerca, come Google e Bing, utilizzano algoritmi per indovinare selettivamente quali informazioni un utente vorrebbe vedere in base alle proprie azioni passate sul sistema. Di conseguenza, i siti Web visualizzano solo informazioni coerenti con gli interessi passati dell'utente. Questo effetto è chiamato bolla del filtro.

Tutto ciò porta al fatto che gli utenti ricevono informazioni molto meno contrastanti e si isolano intellettualmente nella loro "bolla informativa". Pertanto, l '“effetto bolla” può avere conseguenze negative per la formazione dell'opinione civile.

Bias del motore di ricerca

Sebbene i motori di ricerca siano programmati per classificare i siti Web in base a una combinazione di popolarità e rilevanza, in realtà la ricerca sperimentale indica che vari fattori politici, economici e sociali influenzano i risultati della ricerca.

Questo pregiudizio può essere il risultato diretto di processi economici e commerciali: le aziende che fanno pubblicità su un motore di ricerca possono diventare più popolari nei risultati di ricerca organici all'interno di quel motore di ricerca. La rimozione dei risultati di ricerca non conformi alle leggi locali è un esempio dell'influenza dei processi politici. Ad esempio, Google non mostrerà alcuni siti web neonazisti in Francia e Germania, dove la negazione dell'Olocausto è illegale.

Il bias può anche essere una conseguenza dei processi sociali, poiché gli algoritmi dei motori di ricerca sono spesso progettati per escludere punti di vista informali a favore di risultati più "popolari". Gli algoritmi di indicizzazione per i principali motori di ricerca danno la priorità ai siti americani.

La bomba di ricerca è un esempio di un tentativo di gestire i risultati di ricerca per motivi politici, sociali o commerciali.

Guarda anche

  • Qwika
  • Libreria elettronica # Elenchi di librerie e motori di ricerca
  • Dashboard per sviluppatori web

Appunti

Letteratura

  • Ashmanov I.S., Ivanov A.A. Promozione di siti web nei motori di ricerca. - M .: Williams, 2007 .-- 304 p. - ISBN 978-5-8459-1155-1.
  • Baikov V.D. La rete. Cerca per informazioni. Promozione del sito web. - SPb. : BHV-Pietroburgo, 2000-288 p. - ISBN 5-8206-0095-9.
  • Kolisnichenko D.N. Motori di ricerca e promozione di siti web su Internet. - M .: Dialectics, 2007 - 272 p. - ISBN 978-5-8459-1269-5.
  • Lande D.V. Cerca la conoscenza su Internet. - M .: Dialectics, 2005 - 272 p. - ISBN 5-8459-0764-0.
  • Lande D.V., Snarskiy A.A., Bezsudnov I.V. Internetics: navigazione in reti complesse: modelli e algoritmi. - M .: Librokom (Editorial URSS), 2009 - 264 p. - ISBN 978-5-397-00497-8.
  • Chu H., Rosenthal M.

LA CAMPANA

C'è chi ha letto questa notizia prima di te.
Iscriviti per ricevere gli ultimi articoli.
E-mail
Nome
Cognome
Come vuoi leggere The Bell
Niente spam