LA CLOCHE

Il y a ceux qui ont lu cette nouvelle avant vous.
Abonnez-vous pour recevoir les derniers articles.
Email
Nom
Nom de famille
Comment voulez-vous lire The Bell
Pas de spam

Envoyez votre bon travail dans la base de connaissances est simple. Utilisez le formulaire ci-dessous

bon travail vers le site "\u003e

Les étudiants, les étudiants diplômés, les jeunes scientifiques utilisant la base de connaissances dans leurs études et leurs travaux vous seront très reconnaissants.

Documents similaires

    Outils de recherche d'informations sur Internet. Exigences de base et méthodes de recherche d'informations. La structure et les caractéristiques des services de recherche. Moteurs de recherche mondiaux WWW (World Wide Web). Planification de la recherche et de la collecte d'informations sur Internet.

    résumé, ajouté le 02/11/2010

    Caractéristiques des méthodes de recherche d'informations sur Internet, à savoir l'utilisation de liens hypertextes, moteurs de recherche et des outils spéciaux. Analyse des nouvelles ressources Internet. L'histoire de l'émergence et la description des moteurs de recherche occidentaux et russes.

    résumé ajouté le 05/12/2010

    Description et classification des systèmes modernes de recherche d'informations. Documents hypertextes. Examen et évaluations des principaux moteurs de recherche du monde. Développement d'un système de recherche d'informations qui démontre le mécanisme de recherche d'informations sur Internet.

    thèse, ajoutée le 16/06/2015

    Analyse des capacités des moteurs de recherche Yandex et Google, leur comparaison en termes d'utilité. L'histoire de la création des moteurs de recherche, les caractéristiques de leur interface, les outils de recherche et les algorithmes. Formation d'une question et d'un critère pour y répondre.

    résumé, ajouté le 05/07/2011

    Prise en compte des moteurs de recherche Internet comme un complexe logiciel et matériel avec une interface Web permettant de rechercher des informations. Types de moteurs de recherche: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Yandex, Bing et Rambler.

    résumé ajouté le 05/10/2013

    La structure et les principes de création d'Internet, de recherche et de stockage d'informations. L'histoire de l'émergence et de la classification des systèmes de recherche d'informations. Le principe de fonctionnement et les caractéristiques des moteurs de recherche Google, Yandex, Rambler, Yahoo. Recherche par URL.

    term paper, ajouté le 29/03/2013

    L'essence et le principe de l'Internet mondial. Recherche d'informations sur les paramètres dans système Google... Systèmes de recherche d'informations spécialisés: "KtoTam", "Tagoo", "Truveo", "Kinopoisk", "Ulov-Umov". Utilisation appropriée des moteurs de recherche.

    présentation ajoutée le 16/02/2015

    Stockage de données sur Internet. Documents hypertextes, types de fichiers. Fichiers graphiques, leurs types et leurs caractéristiques. Moteurs de recherche et règles de recherche d'informations. Enquête auprès des moteurs de recherche sur Internet. Tout sur les moteurs de recherche Yandex, Google, Rambler.

    term paper ajouté le 26/03/2011

Informations générales.

Actuellement, Internet réunit des centaines de millions de serveurs qui hébergent des milliards de sites différents et fichiers individuelscontenant divers types d'informations. C'est un dépôt géant d'informations. Il existe différentes méthodes de recherche d'informations sur Internet.

Recherchez une adresse connue. Les adresses requises sont extraites des répertoires. Connaissant l'adresse, il suffit de la saisir dans la barre d'adresse du navigateur.

www.gov.ru est un serveur des autorités de l'État russe.

Construction de l'adresse par l'utilisateur. Connaissant le système de formation d'une adresse sur Internet, vous pouvez créer des adresses lors de la recherche de sites Web.

Un domaine thématique ou géographique doit être ajouté au mot-clé (le nom d'une entreprise, d'une entreprise, d'une organisation ou un simple nom anglais) et l'intuition doit être incluse.

Adresses des sites Web commerciaux:

www.cnn.com (CNN World News),

www.sony.com (société SONY),

www.mtv.com (MTV Music News).

Adresses des établissements d'enseignement:

www.ntu.edu ( Université nationale ETATS-UNIS).

Adresses des serveurs régionaux:

www.poland.net (Pologne),

www.israil.net (Israël).

Moteurs de recherche Internet

Pour rechercher des informations sur Internet, des systèmes spéciaux de recherche d'informations ont été mis au point. Les moteurs de recherche ont une adresse commune et s'affichent sous la forme d'une page Web contenant des outils spéciaux d'organisation de la recherche (chaîne de recherche, répertoire des sujets, liens). Pour appeler le moteur de recherche, il suffit de saisir son adresse dans la barre d'adresse du navigateur.

Selon la méthode d'organisation de l'information, les systèmes de recherche d'informations sont divisés en deux types: classification (rubriques) et dictionnaire.

Les rubriques (classificateurs) sont des moteurs de recherche qui utilisent une organisation hiérarchique (arborescente) des informations. Lors de la recherche d'informations, l'utilisateur regarde à travers les en-têtes thématiques, rétrécissant progressivement le champ de recherche (par exemple, si vous avez besoin de trouver la signification d'un mot, vous devez d'abord trouver un dictionnaire dans le classificateur, puis trouver le mot souhaité).

Les moteurs de recherche de dictionnaires sont de puissants systèmes matériels et logiciels automatiques. Avec leur aide, les informations sur Internet sont visualisées (scannées). Les données sur l'emplacement de telle ou telle information sont saisies dans des livres-index spéciaux. En réponse à une requête, une recherche est effectuée selon la chaîne de requête. En conséquence, l'utilisateur se voit proposer les adresses (URL) auxquelles le mot de recherche ou le groupe de mots a été trouvé au moment de l'analyse. En choisissant l'un des liens URL suggérés, vous pouvez accéder au document trouvé. La plupart des moteurs de recherche modernes sont mixtes.

Le plus célèbre et systèmes populaires chercher:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Il existe des systèmes spécialisés dans la recherche ressources d'information dans diverses directions.

Rechercher des personnes sur Internet:

www.whowhere.ru ww. bigfoot.com

Recherche de groupes de discussion (Usenet):

www.dejanews.com

Moteurs de recherche par sujet:

Rechercher un logiciel:

Rechercher dans les archives de fichiers:

http: // ftpseach. city.ru, http: // ftpsearch. licos.com

Annuaires (collections thématiques de liens avec annotations):

http://www.atrus.ru

Souvent, une recherche efficace d'informations peut être effectuée à l'aide d'annuaires régionaux - des serveurs spécialisés contenant des données sur les entreprises ou les ressources Web d'une ville ou d'une région. Par exemple, pour Saint-Pétersbourg, un tel répertoire se trouve à l'adresse http://www.spb.ru.

Une liste des IPS est disponible sur www.monk. newmail.ru

Une liste plus détaillée des moteurs de recherche et des annuaires est présentée dans le tableau. 3.2.

Demander des règles d'exécution

Dans chaque moteur de recherche consultez la section Aide pour obtenir des informations sur la recherche et la composition d'une chaîne de requête. Vous trouverez ci-dessous des informations sur un langage de requête «moyen» typique.

Demande simple.

Entrez un mot définissant le sujet de recherche. Par exemple, dans le moteur de recherche Rambler.ru, il suffit de saisir: automatique.

Certains documents contiennent les mots spécifiés dans la demande. Toutes les formes de mots de la langue russe sont reconnues, en règle générale, la casse des lettres est ignorée.

Vous pouvez utiliser le caractère "*" ou "?" Dans la requête. Signe "?" dans le mot-clé, un caractère est remplacé, qui peut être remplacé par n'importe quelle lettre, et "*" - une séquence de caractères.

Par exemple, la requête automatique * vous permettra de trouver des documents contenant les mots automatique, automatique, etc.

Demande complexe.

Il est souvent nécessaire de combiner des mots-clés pour obtenir des informations plus spécifiques. Dans ce cas, des mots de liaison supplémentaires, des fonctions, des opérateurs, des symboles, des combinaisons d'opérateurs, séparés par des crochets, sont utilisés.

Par exemple, la requête musique & (beatles | beatles) signifie que l'utilisateur recherche des documents contenant les mots musique et beatles ou musique et les beatles.

Le tableau 3.1 montre les règles de formation des requêtes adoptées dans le système Aport (http://www.aport.ru).

Tableau 3.1

Opérateurs pour générer des requêtes

Opérateur Synonymes Un commentaire
ET ET & Documents contenant les deux mots clés... Vous n'êtes pas obligé de l'écrire. Par exemple, requête: informatique et manuel équivaut à un manuel informatique
OU OU | Une recherche est effectuée pour les documents qui utilisent l'un des mots spécifiés ou les deux mots en même temps
NE PAS PAS - ~ La recherche est limitée aux documents qui ne contiennent pas le mot après l'opérateur
" " " " Les guillemets doubles ou simples vous permettent de trouver une phrase
Date \u003d date: date \u003d La recherche est limitée aux documents compris dans la plage de dates spécifiée. Exemple 1.Date de la monnaie \u003d 01/02 / 2002-01 / 03/2002. Sur cette demande, des documents contenant le mot «devise» et ayant une date du 1er février 2002 au 1er mars 2002 seront émis. Exemple 2. date \u003d 01/03/2002 devise Exemple 3. date:<02/03/2002 валюта

Tableau 3.2

Liste des moteurs de recherche et répertoires

Adresse La description
www.excite.com Moteur de recherche avec critiques de sites et guides
www.alta-vista.com Serveur de recherche, capacités de recherche avancées disponibles
www.hotbot.com Rechercher un serveur
www.poland.net www.israil.net Serveurs de recherche régionaux de Pologne, Israël
www.ifoseek.com Moteur de recherche (facile à utiliser)
www.ipl.org Bibliothèque Internet Publik, une bibliothèque publique gérée par le projet World Village
www.wisewire.com WiseWire - Recherche d'intelligence artificielle
www.webcrawler.com WebCrawler - moteur de recherche, facile à utiliser
www.yahoo.com Répertoire Web et interface pour accéder à la recherche en texte intégral sur le serveur AltaVista
www.aport.ru Aport - serveur de recherche en russe
www.yandex.ru Yandex - serveur de recherche en russe
www.rambler.ru Rambler - serveur de recherche en russe
Ressources d'aide en ligne
www.yellow.com Pages Jaunes Internet
moine. newmail.ru Moteurs de recherche de différents profils
www.top200.ru 200 meilleurs sites Web
www.allru.net
www.ru Catalogue des ressources Internet russes
www.allru.net/z09. htm Ressources pédagogiques
www.students.ru Serveur d'étudiants russes
www.cdo.ru/index_new. aspic Centre d'apprentissage à distance
www.open. ac. Royaume-Uni Université ouverte de Grande-Bretagne
www.ntu.edu Université nationale des États-Unis
www.translate.ru Traducteur de texte électronique
www.pomorsu.ru/guide. library.html Liste des liens vers les bibliothèques réseau
www.elibrary.ru Bibliothèque électronique scientifique
www.citforum.ru Bibliothèque électronique
www.infamed.com/psy Tests psychologiques
www.pokoleniye.ru Site Web de la Fédération de l'éducation Internet
www.metod. narod.ru Ressources pédagogiques
www.spb. osi.ru/ic/distant Formation à distance sur Internet
www.examen.ru Examens et tests
www.kbsu.ru/~book/ Manuel d'informatique
Mega. km.ru Encyclopédies et dictionnaires

Recherche d'informations sur Internet: pièges

Les problèmes qui n'apparaissent pas à la surface ne se font souvent sentir qu'après coup, après une certaine étape des travaux de prospection terminée et, éventuellement, sur la base de ses résultats, une décision a déjà été prise. Qu'est-ce qui empêche de rendre la situation transparente dès le début du fonctionnement d'un système de recherche d'informations (SSI) particulier? La réponse est assez simple: le manque d'informations complètes de ce type de la part du développeur. La conséquence directe de ceci est l'inexactitude des données reçues et leur perte incontrôlée. Il est rare de trouver un moteur de recherche sur le Web qui ne dispose pas de certaines fonctionnalités «non documentées». Il semblerait que l'utilisateur n'ait pas tant besoin d'informations, à savoir:

comment se déroule le remplissage de la base de données IPS et quel est son volume;

gamme complète de capacités linguistiques de recherche du système;

les principales caractéristiques de la présentation des résultats de recherche, tout d'abord, l'algorithme de classement des enregistrements à partir de la liste des réponses à une requête de recherche.

Hélas, la source de ces informations n'est généralement pas un document disponible à partir de la page d'accueil d'un moteur de recherche, mais des publications d'auteurs individuels disséminés sur le Web, des livres et des magazines informatiques. Les raisons de cet état de choses, apparemment, peuvent être attribuées non seulement à la négligence du développeur, mais aussi à un facteur appelé politique marketing. En termes simples, fournir à un moteur de recherche les informations les plus complètes sur lui-même n'a pas toujours un effet positif sur son classement. Néanmoins, dans certains cas, l'utilisateur est tout à fait capable de prendre la situation sous contrôle. Il est souvent possible de découvrir les caractéristiques du travail d'un service de recherche sélectionné grâce à des tests. La construction de requêtes de test spéciales qui clarifient rapidement exactement cet aspect du fonctionnement du système qui est le plus important pour la tâche en cours est dans de nombreux cas non triviale. Nous consacrerons notre discussion à la manière d'éviter certains problèmes lors de l'utilisation d'IPS. Les moteurs de recherche Internet bien connus seront considérés comme des exemples pour illustrer la présentation.

16.Recherche d'informations sur Internet

Les informations publiées sur le World Wide Web sont calculées dans une énorme quantité d'octets. Pour rechercher des informations sur le World Wide Web, des sites Web spéciaux sont utilisés - des systèmes de recherche d'informations. Ils permettent aux mots-clés de trouver des ressources d'information liées aux mots-clés. Il peut s'agir de texte contenant des mots-clés ou d'une image graphique de l'un des mots-clés. Des exemples de systèmes de recherche d'informations sont Google et Yandex.

Rechercher une information - l'une des tâches les plus demandées dans la pratique que tout internaute doit résoudre.

Il existe trois manières principales de trouver des informations sur Internet:

1. Spécification de l'adresse de la page.

3. Se référant au moteur de recherche (serveur de recherche).

Méthode 1: Spécifier l'adresse de la page

Il s'agit du moyen de recherche le plus rapide, mais vous ne pouvez l'utiliser que si vous connaissez l'adresse exacte du document ou du site où se trouve le document.

N'oubliez pas la possibilité de rechercher dans une page Web ouverte dans la fenêtre du navigateur (Edition-Rechercher sur cette page ...)

C'est le moyen le moins pratique, car il peut être utilisé pour rechercher des documents dont le sens n'est que proche du document actuel.

Méthode 3: Se référer à un moteur de recherche

Grâce aux liens hypertextes, vous pouvez voyager à l'infini dans l'espace informationnel du Web, passant d'une page Web à une autre, mais étant donné que plusieurs millions de pages Web ont été créées dans le monde, il n'est guère possible de trouver les informations nécessaires à leur sujet de cette manière.

Des moteurs de recherche spéciaux viennent à la rescousse (ils sont aussi appelés moteurs de recherche). Les adresses des moteurs de recherche sont bien connues de tous sur Internet. Actuellement, les moteurs de recherche suivants sont populaires dans la partie russophone de l'Internet: Yandex (yandex.ru), Google (google.ru) et Rambler (rambler.ru

Système de recherche - un site Web qui vous permet de rechercher des informations sur Internet.

La plupart des moteurs de recherche recherchent des informations sur le World Wide Web, mais il existe également des systèmes qui peuvent rechercher des fichiers sur des serveurs ftp, des produits dans des magasins en ligne et des informations dans les groupes de discussion Usenet.

Par le principe de l'action Les moteurs de recherche sont divisés en deux types: les répertoires de recherche et les index de recherche.

Rechercher dans les répertoires servir pour la recherche thématique.

Les informations sur ces serveurs sont structurées par thème et sous-thème. Dans l'intention de couvrir un sujet restreint, il n'est pas difficile de trouver une liste de pages Web qui lui sont dédiées.

Un annuaire de ressources sur Internet ou un annuaire de ressources Internet ou simplement un annuaire Internet est un ensemble structuré de liens vers des sites avec une brève description de ceux-ci.

Index de recherche fonctionnent comme des index alphabétiques. Le client spécifie un mot ou un groupe de mots qui caractérisent sa zone de recherche - et reçoit une liste de liens vers des pages Web contenant les termes spécifiés.

Le premier moteur de recherche pour le World Wide Web était Wandex, un ancien index développé par Matthew Gray du Massachusetts Institute of Technology en 1993.

Comment fonctionne l'index de recherche?

Recherchez automatiquement les index, en utilisant des programmes spéciaux (web spiders), scannez les pages Internet et indexez-les, c'est-à-dire, entrez-les dans leur énorme base de données.

Robot de recherche ("Web spider") est un programme qui fait partie intégrante d'un moteur de recherche et est conçu pour explorer des pages Internet afin de saisir des informations à leur sujet (mots-clés) dans la base des moteurs de recherche. À la base, une araignée ressemble le plus à un navigateur ordinaire. Il scanne le contenu de la page, la télécharge sur le serveur du moteur de recherche dont il est propriétaire et l'envoie via les liens vers les pages suivantes.

En réponse à une demande de localisation des informations souhaitées, le serveur de recherche renvoie une liste d'hyperliens menant à des pages Web où les informations requises sont disponibles ou mentionnées. La liste peut être aussi large que vous le souhaitez, en fonction du contenu de la demande.

http://www.yandex.ru/

Yandex - Système de recherche Web russe. Le site Web de la société, Yandex.ru, a été lancé le 23 septembre 1997. Le siège social de la société est situé à Moscou. La société possède des bureaux à Saint-Pétersbourg, Ekaterinbourg, Odessa et Kiev. Le nombre d'employés dépasse 700 personnes.

Le mot «Yandex» (composé de la lettre «I» et d'une partie de l'index des mots; le fait que le pronom russe «I» correspond au «I» anglais) a été inventé par Ilya Segalovich, l'un des fondateurs de Yandex, qui occupe actuellement le poste de directeur technique de l'entreprise.

La recherche Yandex vous permet de rechercher sur Runet des documents en russe, ukrainien, biélorusse, roumain, anglais, allemand et français, en tenant compte de la morphologie des langues russe et anglaise et de la proximité des mots dans une phrase. Une caractéristique distinctive de Yandex est la possibilité d'affiner la requête de recherche. Ceci est mis en œuvre via un langage de requête flexible.

Par défaut, Yandex affiche 10 liens sur chaque page de résultats de recherche; dans les paramètres des résultats de recherche, vous pouvez augmenter la taille de la page à 20, 30 ou 50 documents trouvés.

De temps en temps, les algorithmes Yandex responsables de la pertinence des résultats de recherche changent, ce qui entraîne des changements dans les résultats de recherche. En particulier, ces modifications sont dirigées contre le spam des moteurs de recherche qui conduit à des résultats non pertinents pour certaines requêtes.

http://www.google.ru/

Le leader des moteurs de recherche Internet, Google occupe plus de 70% du marché mondial. Il enregistre actuellement environ 50 millions de requêtes de recherche par jour et indexe plus de 8 milliards de pages Web. Google peut trouver des informations dans 115 langues.

Selon une version, Google est une orthographe déformée du mot anglais googol. "Googol" est un terme mathématique pour un suivi de 100 zéros. Le terme a été inventé par Milton Sirotta, neveu du mathématicien américain Edward Kasner, et a été décrit pour la première fois dans le livre Mathematics and the Imagination de Kasner et James Newman. L'utilisation de ce terme par Google reflète le défi de l'organisation des grandes quantités d'informations sur Internet.

L'interface de Google contient un langage de requête assez sophistiqué qui vous permet de limiter votre recherche à des domaines, des langues, des types de fichiers spécifiques, etc.

http://www.rambler.ru/

Rambler Media Group est une holding Internet qui comprend un moteur de recherche, un classificateur de notation des ressources Internet russes et un portail d'information en tant que services.

Rambler a été fondée en 1996.

Le moteur de recherche Rambler comprend et distingue les mots des langues russe, anglaise et ukrainienne. Par défaut, toutes les formes d'un mot sont recherchées.

La transition vers la société de l'information du XXIe siècle a donné lieu à une croissance sans précédent du volume et de la concentration de l'information dans les réseaux informatiques mondiaux. Cela a fortement exacerbé le problème de la création de systèmes de recherche d'informations (SSI) et de leur utilisation efficace.

L'histoire des systèmes automatisés de recherche d'informations remonte à un demi-siècle. Un SSI typique des premières années est un système homme-machine, où l'analyse et la description du contenu des documents (indexation) sont effectuées manuellement et les recherches sont effectuées par une machine. Initialement, l'ISL était basé sur des langages de recherche d'informations (IPL), dont les principaux éléments sont des dictionnaires de descripteurs et des thésaurus. Aujourd'hui, cependant, la plupart des SSI en activité appartiennent à la classe des systèmes verbaux de type sans saurus, lorsque les termes d'indexation sont sélectionnés directement à partir des textes des documents. L'augmentation en avalanche du volume de l'information documentaire électronique, de son espèce, de sa diversité thématique et linguistique sont à la fois la cause de la crise de la recherche moderne de l'information et le stimulus de son amélioration.

Le problème de la recherche de ressources sur Internet s'est réalisé assez tôt, et en réponse, divers systèmes et outils logiciels de recherche sont apparus, parmi lesquels il faudrait nommer les systèmes Gopher, Archie, Veronica, WAIS, WHOIS, etc. Récemment, ces outils ont été remplacés par des «clients "Et" serveurs "du World Wide Web.

Si nous essayons de donner une classification de l'ISS d'Internet, les principaux types suivants peuvent être distingués:

1.IPS de type verbal (moteurs de recherche)

2. Classification ISS (répertoires)

3. Annuaires électroniques (pages "jaunes", etc.)

4. Systèmes d'information spécialisés pour certains types de ressources

5. Agents intelligents.

La comptabilité globale de toutes les ressources Internet est assurée par des systèmes verbaux et, en partie, de classification.

Classification IPS ils implémentent la navigation dans l'espace web sur la base de pointeurs spéciaux, qui sont des "arbres" thématiques construits sur la base de classifications.

Pour résoudre le problème de la couverture maximale des ressources Internet, des systèmes sont créés appelés méta-recherche (méta-moteurs de recherche).

Aujourd'hui, le principal moyen de recherche d'informations sur le Web doit être considéré comme un IPS global type verbalindexation (du moins prétendant être) l’ensemble de l’espace Internet. Les principaux moteurs de recherche de ce type (principalement en termes de volume de la base de données) sont Google, Fast (AlltheWeb), AltaVista, HotBot, Inktomi, Teoma, WiseNut, MSN Search. Parmi les systèmes russes, trois sont les principaux: Yandex (Yandex), Rambler (Rambler) et Aport! (Un port). En règle générale, les systèmes dotés d'une base de données plus volumineuse génèrent un plus grand nombre de documents. Un problème majeur, à la fois linguistique et programmatique, est le multilinguisme de l'espace d'information Internet et la variété des formats de présentation des données.



La recherche en texte intégral est une caractéristique des systèmes modernes. De nombreux IRS verbaux sur Internet calculent la pertinence des documents par rapport aux requêtes en comparant les éléments de requête avec le texte intégral des documents publiés sur le Web. En ce qui concerne le langage de recherche d'informations, en règle générale, les mots ordinaires des langues naturelles agissent comme des éléments de recherche. Les demandes sont formulées via une interface spéciale, implémentée sous la forme de formulaires d'écran dans les programmes de navigation.

Il existe trois parties principales de tout moteur de recherche.

Robot - un sous-système qui permet la navigation (scan) sur Internet et la mise à jour du fichier inversé (base de données d'index). Ce progiciel est le principal outil de collecte d'informations sur la disponibilité et l'état des ressources d'information du réseau.

Rechercher dans la base de données - soi-disant index -une base spécialement organisée (base de données d'index en eng.), comprenant tout d'abord un fichier inversé, constitué d'unités lexicales issues de documents web indexés, et contenant diverses informations les concernant (notamment leur position dans les documents), ainsi que sur les documents eux-mêmes et les sites en général.

Système de recherche - un sous-système de recherche qui traite la demande d'un utilisateur (prescription de recherche), effectue des recherches dans la base de données et affiche les résultats de la recherche à l'utilisateur. Le moteur de recherche communique avec l'utilisateur via des interfaces utilisateur - des formes d'écran de programmes de navigateur: une interface pour générer des requêtes et une interface pour afficher les résultats de la recherche.

Les pages Web dites frontales sont un élément important de l'IRS moderne, c.-à-d. des formulaires d'écran par lesquels l'utilisateur communique avec le moteur de recherche. Il existe deux principaux types de pages frontales: les pages de requête et les pages de résultats de recherche.

L'interface d'émission (forme de présentation des résultats) des différents systèmes comprend les paramètres suivants: les statistiques des mots de la requête, le nombre de documents trouvés, le nombre de sites, les contrôles de tri des documents à l'émission, une brève description des documents, etc. La description de chaque document, à son tour, peut contenir dans sa composition: le titre du document, l'URL (adresse web), le volume du document, la date de création, le nom de l'encodage, l'annotation, la police mettant en évidence dans l'annotation des mots de la demande, une indication d'autres pages web pertinentes du même site, un lien vers l'en-tête du catalogue vers lequel fait référence au document ou au site trouvé, au coefficient de pertinence, aux autres capacités de recherche (recherche de documents similaires, recherche dans trouvé).

Questions pour la maîtrise de soi:

  1. Que sont les IPS?
  2. Quelle est la classification de l'IPS?
  3. Qu'est-ce qu'un IRS documentaire?
  4. Qu'est-ce qu'un IRS factuel?
  5. Quelles sont les parties de l'IPS?
  6. Quels sous-systèmes de soutien de l'ISS sont disponibles?
  7. Concepts de base de la recherche d'informations.
  8. Quelles sont les langues de recherche d'informations?
  9. Quelle est la classification d'IPS sur Internet?
  10. Les principales parties de tout IPS.

1. Introduction

Chaque année, le volume d'Internet augmente considérablement, de sorte que la probabilité de trouver les informations nécessaires augmente considérablement. Internet réunit des millions d'ordinateurs, de nombreux réseaux différents, le nombre d'utilisateurs augmente de 15 à 80% par an. Et, néanmoins, de plus en plus souvent lors de l'accès à Internet, le principal problème n'est pas le manque d'informations requises, mais la capacité de les trouver. En règle générale, une personne ordinaire, en raison de diverses circonstances, ne peut pas ou ne veut pas passer plus de 15 à 20 minutes à chercher la réponse dont elle a besoin. Par conséquent, il est particulièrement important d'apprendre correctement et avec compétence une chose apparemment simple - où et comment chercher pour obtenir les réponses SOUHAITÉES.

Pour trouver les informations dont vous avez besoin, vous devez trouver son adresse. Pour cela, il existe des serveurs de recherche spécialisés (robots d'indexation (moteurs de recherche), annuaires Internet thématiques, systèmes de méta-recherche, services de recherche de personnes, etc.). Dans cette classe de maître, les principales technologies de recherche d'informations sur Internet sont révélées, les caractéristiques générales des outils de recherche sont fournies et les structures des requêtes de recherche pour les moteurs de recherche russophones et anglophones les plus populaires sont prises en compte.

2. Technologies de recherche

Technologie Web Le World Wide Web (WWW) est considéré comme une technologie spéciale pour la préparation et la publication de documents sur Internet. Le WWW comprend des pages Web, des bibliothèques électroniques, des catalogues et même des musées virtuels! Avec une telle abondance d'informations, la question se pose: "Comment naviguer dans un espace d'information aussi vaste et à grande échelle?"
Les outils de recherche viennent à la rescousse pour résoudre ce problème.

2.1 Outils de recherche

Les outils de recherche sont des logiciels spéciaux dont l’objectif principal est de fournir aux internautes la recherche d’informations la plus optimale et de la plus haute qualité. Les outils de recherche sont hébergés sur des serveurs Web spéciaux, chacun remplissant une fonction spécifique:

  1. Analyse des pages Web et saisie des résultats de l'analyse à l'un ou l'autre niveau de la base de données des moteurs de recherche.
  2. Rechercher des informations sur la demande de l'utilisateur.
  3. Fournir une interface pratique pour rechercher des informations et visualiser le résultat de la recherche par l'utilisateur.

Les méthodes de travail utilisées lorsque l'on travaille avec l'un ou l'autre outil de recherche sont pratiquement les mêmes. Avant de passer à leur discussion, considérez les concepts suivants:

  1. L'interface de l'outil de recherche se présente sous la forme d'une page avec des hyperliens, une ligne de soumission de requête (barre de recherche) et des outils d'activation de requête.
  2. L'index des moteurs de recherche est une base d'informations contenant le résultat de l'analyse de pages Web, compilées selon certaines règles.
  3. Une requête est un mot-clé ou une expression qu'un utilisateur entre dans la barre de recherche. Pour former diverses requêtes, des symboles spéciaux ("", ~), des symboles mathématiques (*, + ,?) sont utilisés.

Le système de recherche d'informations sur Internet est simple. L'utilisateur tape une phrase clé et active la recherche, recevant ainsi une sélection de documents pour une requête formulée (spécifiée). Cette liste de documents est classée selon certains critères de sorte qu'en tête de liste se trouvent les documents qui correspondent le plus à la demande de l'utilisateur. Chacun des outils de recherche utilise différents critères pour classer les documents, à la fois lors de l'analyse des résultats de recherche et lors de la formation d'un index (remplissage de la base de données d'index des pages Web).

Ainsi, si vous spécifiez la même requête dans la chaîne de recherche pour chaque outil de recherche, vous pouvez obtenir des résultats de recherche différents. Il est très important pour l'utilisateur quels documents apparaîtront dans les deux ou trois premiers documents en fonction des résultats de la recherche et dans quelle mesure ces documents correspondent aux attentes de l'utilisateur.

La plupart des outils de recherche proposent deux méthodes de recherche: recherche simple(recherche simple) et recherche Avancée(recherche avancée) avec et sans formulaire de demande spécial. Considérons les deux types de recherche en utilisant l'exemple d'un moteur de recherche en anglais.

Par exemple, AltaVista est utile pour les requêtes ad hoc, «Quelque chose sur les diplômes en ligne en technologie de l'information», tandis que l'outil de recherche de Yahoo vous permet d'obtenir des nouvelles du monde, des taux de change ou des prévisions météorologiques.

La maîtrise des critères d'affinage d'une requête et des techniques de recherche avancées permet d'augmenter l'efficacité de la recherche et de trouver rapidement les informations nécessaires. Tout d'abord, vous pouvez augmenter l'efficacité de la recherche en utilisant des opérateurs logiques (opérations) Ou, Et, Près, Non, des symboles mathématiques et spéciaux dans les requêtes. À l'aide d'opérateurs et / ou de symboles, l'utilisateur associe des mots-clés dans la séquence requise pour obtenir le résultat de recherche le plus approprié. Les formulaires de demande sont présentés dans le tableau 1.

Tableau 1

Une simple requête donne un certain nombre de liens vers des documents, car la liste comprend des documents contenant l'un des mots saisis lors de la requête, ou une phrase simple (voir tableau 1). L'opérateur et vous permet d'indiquer que tous les mots-clés doivent être inclus dans le contenu du document. Cependant, le nombre de documents peut encore être important et il faudra beaucoup de temps pour les examiner. Par conséquent, dans certains cas, il est beaucoup plus pratique d'utiliser l'opérateur de contexte proche, qui indique que les mots doivent être situés dans le document à une proximité suffisante. L'utilisation de Near réduit considérablement le nombre de documents trouvés. La présence du symbole "*" dans la chaîne de requête signifie qu'un mot sera recherché par son masque. Par exemple, nous obtenons une liste de documents contenant des mots commençant par «gov» si nous écrivons «gov *» dans la chaîne de requête. Il peut s'agir des mots gouvernement, gouverneur, etc.

Le moteur de recherche tout aussi populaire Rambler conserve des statistiques sur le trafic de liens à partir de sa propre base de données, les mêmes opérateurs logiques AND, OR, NOT, metacharacter * (similaire au caractère * élargissant la plage de requête dans AltaVista), les symboles de coefficient + et - sont pris en charge, pour augmenter ou diminuer la signification mots saisis dans la requête.

Jetons un coup d'œil aux technologies les plus populaires pour trouver des informations sur Internet.

2.2 moteurs de recherche

Les moteurs de recherche Web sont des serveurs avec une énorme base de données d'URL qui accèdent automatiquement aux pages WWW à toutes ces adresses, examinent le contenu de ces pages, forment et écrivent des mots-clés à partir des pages dans leur base de données (pages d'index).

De plus, les robots des moteurs de recherche suivent les liens trouvés sur les pages et les réindexent. Étant donné que presque toutes les pages WWW ont de nombreux liens vers d'autres pages, alors avec un tel travail, le moteur de recherche dans le résultat final peut théoriquement contourner tous les sites sur Internet.

C'est ce type d'outils de recherche qui est le plus connu et le plus populaire parmi tous les internautes. Tout le monde a entendu les noms de moteurs de recherche Web bien connus (moteurs de recherche) - Yandex, Rambler, Aport.

Pour utiliser ce type d'outil de recherche, vous devez y accéder et taper dans la barre de recherche le mot-clé qui vous intéresse. Ensuite, vous recevrez les résultats des liens stockés dans la base des moteurs de recherche les plus proches de votre demande. Pour rendre votre recherche plus efficace, faites attention aux points suivants à l'avance:

  • décider du sujet de votre demande. Que voulez-vous trouver exactement?
  • faites attention à la langue, à la grammaire, à l'utilisation de divers symboles non alphabétiques, à la morphologie. Il est également important de formuler et de saisir correctement les mots-clés. Chaque moteur de recherche a sa propre forme d'écriture d'une requête - le principe est le même, mais les symboles ou opérateurs utilisés peuvent différer. Les formes d'enquête requises diffèrent également en fonction de la complexité du logiciel du moteur de recherche et des services qu'il fournit. D'une manière ou d'une autre, chaque moteur de recherche dispose d'une section "Aide", où toutes les règles de syntaxe, ainsi que des recommandations et astuces de recherche, sont facilement expliquées (capture d'écran des pages des moteurs de recherche).
  • utiliser les capacités de différents moteurs de recherche. Si vous ne le trouvez pas sur Yandex, essayez-le sur Google. Utilisez les services de recherche avancée.
  • pour exclure les documents contenant certains termes, utilisez le signe "-" devant chacun de ces mots. Par exemple, si vous avez besoin d'informations sur les œuvres de Shakespeare, à l'exception de "Hamlet", entrez une requête sous la forme: "Shakespeare-Hamlet". Et pour, au contraire, dans les résultats de recherche inclure nécessairement certains liens, utilisez le symbole "+". Ainsi, pour trouver des liens sur la vente de voitures, vous avez besoin de la requête "vente + voiture". Pour augmenter l'efficacité et la précision de votre recherche, utilisez des combinaisons de ces symboles.
  • chaque lien dans la liste des résultats de recherche contient - plusieurs lignes du document trouvé, parmi lesquelles se trouvent vos mots-clés. Avant de cliquer sur le lien, évaluez la correspondance de l'extrait de code avec l'objet de la demande. Après avoir cliqué sur un lien vers un site spécifique, regardez attentivement la page principale. En règle générale, la première page suffit pour comprendre si vous êtes venu à l'adresse ou non. Si oui, effectuez des recherches supplémentaires pour les informations nécessaires sur le site sélectionné (dans les sections du site), sinon, revenez aux résultats de la recherche et essayez le lien suivant.
  • rappelez-vous que les moteurs de recherche ne produisent pas d'informations par eux-mêmes (sauf pour des clarifications sur eux-mêmes). Le moteur de recherche n'est qu'un intermédiaire entre le propriétaire de l'information (site) et vous. Les bases de données sont constamment mises à jour, de nouvelles adresses leur sont ajoutées, mais le retard par rapport aux informations réellement existantes dans le monde demeure. Tout simplement parce que les moteurs de recherche ne fonctionnent pas à la vitesse de la lumière.

Les moteurs de recherche Web les plus connus sont Google, Yahoo, Alta Vista, Excite, Hot Bot, Lycos. Parmi les russophones, vous pouvez distinguer Yandex, Rambler, Aport.

Les moteurs de recherche sont les plus importants et les plus précieux, mais loin d'être les seules sources d'informations sur le Web, car à côté d'eux, il existe d'autres moyens de rechercher sur Internet.

2.3 répertoires

Le catalogue des ressources Internet est un catalogue hiérarchique constamment mis à jour et réapprovisionné contenant de nombreuses catégories et des serveurs Web individuels avec une brève description de leur contenu. La manière de rechercher dans le catalogue implique de "descendre les escaliers", c'est-à-dire de passer de catégories plus générales à des catégories plus spécifiques. L'un des avantages des catalogues thématiques est que les explications sur les liens sont données par les créateurs du catalogue et reflètent pleinement son contenu, c'est-à-dire que cela vous donne la possibilité de déterminer plus précisément comment le contenu du serveur correspond à l'objectif de votre recherche.

Un exemple de catalogue thématique en russe est la ressource http://www.ulitka.ru/.

Sur la page principale de ce site il y a une rubrique thématique,

à l'aide de laquelle l'utilisateur entre dans la rubrique avec des liens vers les produits qui l'intéressent.

De plus, certains répertoires thématiques autorisent les recherches par mots clés. L'utilisateur entre le mot-clé requis dans la barre de recherche

et reçoit une liste de liens avec des descriptions de sites qui correspondent le mieux à sa demande. Il est à noter que cette recherche n'a pas lieu dans le contenu des serveurs WWW, mais dans leurs brèves descriptions stockées dans le catalogue.

Dans notre exemple, le catalogue a également la possibilité de trier les sites par nombre de visites, par ordre alphabétique, par date d'entrée.

Autres exemples d'annuaires en russe:
[email protected]
Webliste
Vsego.ru
Parmi les catalogues en anglais, on trouve:
http://www.DMOS.org
http://www.yahoo.com/
http://www.looksmart.com

2.4 Collections de liens

Les collections de liens sont des liens triés par sujet. Ils sont assez différents les uns des autres en termes de contenu, donc pour trouver une sélection qui correspond le mieux à vos intérêts, vous devez les parcourir vous-même afin de vous forger votre propre opinion.

A titre d'exemple, nous donnerons la Sélection de liens "Internet Treasures" de JSC "Relcom"

Utilisateur en cliquant sur l'une des rubriques qui l'intéressent

  • CONTENU

    Pour les automobilistes

    • Astronomie et astrologie
    • Ta maison
    • Vos animaux
    • Les enfants sont des fleurs de vie
    • Loisir
    • Villes sur Internet
    • Santé et médecine
    • Agences de presse et services
    • Musée d'histoire locale, etc.,
    • Electronique automobile.
    • Musée de l'automobile de l'Antiquité.
    • Collegium de la protection juridique des propriétaires de voitures.
    • Sportdrive.

    L'avantage de ce type d'outils de recherche est leur utilité, généralement la sélection comprend des ressources Internet rares sélectionnées par un webmaster spécifique ou le propriétaire d'une page Internet.

    2.5 base de données d'adresses

    Les bases de données d'adresses sont des serveurs de recherche spéciaux qui utilisent généralement des classifications par type d'activité, par produits et services fournis, par géographie. Parfois, ils sont complétés par une recherche alphabétique. Les enregistrements de la base de données stockent des informations sur les sites qui fournissent des informations sur l'adresse e-mail, l'organisation et l'adresse postale moyennant des frais.

    La plus grande base de données d'adresses en anglais peut être appelée: http://www.lookup.com/ -

    En entrant dans ces sous-répertoires, l'utilisateur découvre des liens vers des sites qui offrent des informations qui l'intéressent.

    Nous ne connaissons pas de bases de données d’adresses officielles et largement disponibles dans la Fédération de Russie.

    2.6 Recherche dans les archives de Gopher

    Gopher est un système de serveur interconnecté (espace Gopher) distribué sur Internet.

    L'espace Gopher contient la bibliothèque littéraire la plus riche, mais les matériaux ne sont pas disponibles pour la visualisation à distance: l'utilisateur ne peut afficher qu'une table des matières organisée hiérarchiquement et sélectionner un fichier par nom. À l'aide d'un programme spécial (Veronica), une telle recherche peut être effectuée automatiquement, en utilisant des requêtes basées sur des mots-clés.

    Jusqu'en 1995, Gopher était la technologie la plus dynamique sur Internet, la croissance du nombre de serveurs associés dépassant celle de tous les autres types de serveurs Internet. Dans le réseau EUnet / Relcom, les serveurs Gopher n'ont pas fait l'objet d'un développement actif et, aujourd'hui, presque personne ne s'en souvient.

    2.7 Système de recherche FTP

    Le moteur de recherche de fichiers FTP est un type spécial de moteur de recherche Internet qui vous permet de trouver des fichiers disponibles sur des serveurs FTP «anonymes». FTP est conçu pour transférer des fichiers sur un réseau, et en ce sens, c'est fonctionnellement une sorte d'analogue de Gopher.

    Le principal critère de recherche est le nom du fichier, spécifié de différentes manières (correspondance exacte, sous-chaîne, expression régulière, etc.). Ce type de recherche, bien sûr, ne peut pas concurrencer les moteurs de recherche en termes de capacités, car le contenu des fichiers n'est en aucun cas pris en compte dans la recherche et les fichiers, comme vous le savez, peuvent recevoir des noms arbitraires. Néanmoins, si vous avez besoin de trouver un programme ou une description bien connu de la norme, alors avec un degré de probabilité élevé, le fichier le contenant aura un nom approprié, et vous pourrez le trouver en utilisant l'un des serveurs de recherche FTP:

    FileSearch recherche les fichiers sur les serveurs FTP par les noms des fichiers et des répertoires eux-mêmes. Si vous recherchez un programme ou quelque chose d'autre, alors sur les serveurs WWW, vous trouverez probablement leurs descriptions, et à partir des serveurs FTP, vous pouvez les télécharger vous-même.

    2.8 Moteur de recherche de conférences Usenet News

    USENET NEWS est un système de téléconférence pour la communauté Internet. En Occident, ce service est généralement appelé actualités. Un analogue proche des téléconférences est ce que l'on appelle les «échos» dans le réseau FIDO.

    Du point de vue d'un abonné à une téléconférence, USENET est un tableau d'affichage qui comporte des sections où vous pouvez trouver des articles sur n'importe quel sujet - de la politique au jardinage. Ce babillard est accessible via un ordinateur comme le courrier électronique. Sans quitter votre ordinateur, vous pouvez lire ou publier des articles dans l'une ou l'autre conférence, trouver des conseils utiles ou participer à des discussions. Naturellement, les articles prennent de la place sur les ordinateurs, ils ne sont donc pas stockés pour toujours, mais sont périodiquement détruits, laissant la place à de nouveaux. Dans le monde entier, le meilleur service pour trouver des informations sur les groupes de discussion Usenet est le serveur Google Groupes (Google Inc.).

    Google Groupes est une communauté en ligne gratuite et un service de groupe de discussion qui propose la plus grande archive de messages Usenet sur Internet (plus d'un milliard de messages). Pour plus d'informations, visitez http://groups.google.com/intl/ru /googlegroups/tour/index.html

    Parmi les russophones, le serveur USENET et les téléconférences Relcom se démarquent. Tout comme dans d'autres services de recherche, l'utilisateur saisit une chaîne de requête et le serveur génère une liste de conférences contenant des mots-clés. Ensuite, vous devez vous abonner aux conférences sélectionnées dans le programme de nouvelles. Il existe également un serveur russe similaire FidoNet Online: les conférences Fido sur WWW.

    2.9 Méta-moteurs de recherche

    Pour une recherche rapide dans les bases de données de plusieurs moteurs de recherche à la fois, mieux vaut se tourner vers les méta-moteurs de recherche.

    Les méta-moteurs de recherche sont des moteurs de recherche qui envoient votre requête à un grand nombre de moteurs de recherche différents, puis traitent les résultats obtenus, suppriment les adresses de ressources en double et représentent un plus large éventail de ce qui est présenté sur Internet.

    Le méta-moteur de recherche le plus populaire au monde est Search.com.

    Moteur de recherche combiné Search.com de CNET, Inc. comprend près de deux douzaines de moteurs de recherche, dont les liens sont remplis de tout Internet.

    Avec l'aide de ce type d'outils de recherche, l'utilisateur peut rechercher des informations dans une variété de moteurs de recherche, cependant, le côté négatif de ces systèmes peut être appelé leur instabilité.

    2.10 Moteurs de recherche de personnes

    Les systèmes de recherche de personnes sont des serveurs spéciaux qui vous permettent de rechercher des personnes sur Internet, l'utilisateur peut spécifier le nom complet. personne et obtenez son adresse e-mail et son URL. Il convient cependant de noter que les moteurs de recherche de personnes prennent principalement des informations sur les adresses e-mail à partir de sources ouvertes telles que les groupes de discussion Usenet. Parmi les systèmes de recherche de personnes les plus connus, on trouve:

    Rechercher des adresses e-mail

    dans les champs spéciaux de la recherche d'informations de contact (Prénom. Ville, Nom, Numéro de téléphone), vous pouvez trouver les informations qui vous intéressent.

    Les systèmes de recherche de personnes sont de très gros serveurs, leurs bases de données contiennent environ 6 000 000 d'adresses.

    3. Conclusion

    Nous avons examiné les principales technologies pour trouver des informations sur Internet et présenté en termes généraux les outils de recherche qui existent actuellement sur Internet, ainsi que la structure des requêtes de recherche pour les moteurs de recherche russophones et anglophones les plus populaires et, pour résumer ce qui précède, nous voulons noter qu'un schéma optimal unique il n'y a pas de recherche d'informations sur Internet. En fonction des spécificités des informations dont vous avez besoin, vous pouvez utiliser les outils et services de recherche appropriés. Et la qualité des résultats de recherche dépend de la qualité de la sélection des services de recherche.

  • LA CLOCHE

    Il y a ceux qui ont lu cette nouvelle avant vous.
    Abonnez-vous pour recevoir les derniers articles.
    Email
    Nom
    Nom de famille
    Comment voulez-vous lire The Bell
    Pas de spam