LA CLOCHE

Il y a ceux qui ont lu cette nouvelle avant vous.
Abonnez-vous pour recevoir les derniers articles.
E-mail
Nom
Nom de famille
Comment voulez-vous lire La cloche
Pas de spam
INTRODUCTION

Internet est comme une immense bibliothèque mondiale, qui n'a qu'une seule différence significative : pour rechercher un livre dans la bibliothèque, il existe un catalogue, en dernier recours, vous pouvez vous tourner vers un bibliothécaire expérimenté. Il n'existe pas de catalogue complet d'Internet. Mais, néanmoins, la recherche dans le réseau informatique mondial est possible, et c'est peut-être l'un des aspects les plus importants de celui-ci. Pour rechercher des données dans le réseau, des serveurs spéciaux sont utilisés, dont les informations sont conservées et mises à jour presque automatiquement.

Aujourd'hui, alors qu'Internet est devenu l'une des principales sources d'information, la recherche sur Internet prend de plus en plus de valeur pratique. Mais avec l'augmentation rapide de la quantité de données disponibles, la procédure de recherche elle-même devient de plus en plus compliquée.

Internet est un réseau informatique mondial qui relie à la fois les utilisateurs du réseau informatique et les utilisateurs de PC. Internet devient lentement mais sûrement le principal moyen de communication d'entreprise, laissant la place jusqu'ici au téléphone.

Il existe une énorme quantité de ressources d'information sur le Web. Selon certaines estimations, le nombre de documents a dépassé les 65 millions et continue de croître rapidement. Un tel volume d'informations nécessite une organisation correcte du processus de recherche et l'utilisation de moyens techniques particuliers, tels que les moteurs de recherche. Une simple recherche d'un mot-clé assez courant donne généralement des dizaines de milliers à plusieurs millions de liens. Il est évident que travailler avec un si grand nombre de documents est pratiquement impossible, d'autant plus que l'écrasante majorité d'entre eux contiennent des informations non pertinentes.

Les sources d'information sur Internet diffèrent dans la manière dont l'information est présentée et, par conséquent, dans la méthode d'accès à celles-ci.

1 OUTILS DE RECHERCHE

1.1 Outils de recherche de fichiers

Trouver le fichier manuellement dans la structure de répertoires complexe du serveur ftp peut prendre beaucoup de temps. Pour simplifier et accélérer la recherche, le service de recherche Internet Archie a été développé, qui est un serveur Archie spécial qui stocke le contenu des répertoires des serveurs ftp anonymes. Lors de l'adressage d'une requête de recherche sur un serveur Archie, le résultat de la recherche est une liste d'adresses de serveurs ftp anonymes contenant le fichier souhaité.

Mais la tâche se pose de trouver celui souhaité parmi l'ensemble des fichiers sur ce serveur, ce qui est assez difficile en raison des noms de fichiers et de répertoires peu clairs et incompréhensibles. Pour résoudre ce problème, le système Gopher est utilisé, ce qui vous permet de naviguer dans un système de menus contextuels, affichant le contenu des fichiers en utilisant des notations compréhensibles. Il existe de nombreux serveurs Gopher qui contiennent des archives de données sous forme de répertoires structurés hiérarchiquement, classés par contenu. Travailler avec eux est très simple et correspond à travailler avec un affichage de système de fichiers normal.

Il existe une extension de ce système - Veronica, qui contient des catalogues de tous les serveurs Gopher dans sa base de données. Après avoir entré une requête de recherche, Veronica scanne automatiquement tous les répertoires Gopher pour les informations que vous recherchez, éliminant ainsi le besoin de rechercher manuellement de nombreux serveurs Gopher.

Avec cette façon de naviguer, Gopher était en quelque sorte le prédécesseur du WWW. Actuellement, l'utilisation de Gopher diminue proportionnellement à l'augmentation de l'utilisation du WWW.

1.2 Outils WWW - WorldWideWeb

En 1993, le système de recherche d'informations WWW a été développé, qui, en raison de sa facilité de navigation et d'accessibilité, a ouvert les sources d'information d'Internet à des utilisateurs non préparés. Le WWW a provoqué un boom Internet qui se poursuit à ce jour, et la quantité d'informations disponibles sur Internet double chaque année.

Le WWW repose sur le principe de l'hypertexte (déjà familier au lecteur), c'est-à-dire sur un système de documents reliés par des hyperliens. L'hypertexte est une manière spéciale de mettre en évidence des mots-clés à partir d'un texte ordinaire. Des liens hypertextes renvoient l'utilisateur vers d'autres documents sur le même serveur ou vers d'autres serveurs pouvant être situés n'importe où sur Internet. Si ce document texte est également hypertexte, alors ses liens permettent d'aller plus loin vers les documents correspondants. Chaque redirection se produit imperceptiblement pour l'utilisateur, afin qu'il puisse visualiser le contenu informationnel d'Internet de manière significative, sans se soucier d'adresser des ordinateurs spécifiques.

Avec le développement des applications multimédias, les documents initialement purement hypertextes deviennent de plus en plus hypermédias. Ainsi, les documents WWW peuvent exister dans n'importe quel format de données : texte, graphique, son/musique, ou clip vidéo. L'orientation et la navigation dans le World Wide Web se produisent à l'aide de programmes spéciaux appelés navigateurs WWW qui fournissent une interface utilisateur, tels que NetscapeNavigator ou MicrosoftInternetExplorer.

Le point de départ de la recherche d'informations est, en règle générale, la page principale (base, accueil) (site) de la ressource d'informations, accessible en saisissant l'adresse correspondante dans le navigateur (par exemple, http://ncpi .gov.by ou www.iparegistr.com). Les sites WWW sont créés et mis à jour par des entreprises ou des organisations spéciales qui publient des informations et surveillent le contenu de leurs pages WWW. L'utilisation du WWW n'est donc pas passive et chaque internaute, à l'aide de programmes d'édition hypertexte spéciaux, peut créer indépendamment ses propres pages WWW interactives. Cela a ouvert la voie à la commercialisation et à l'expansion croissantes d'Internet.

Actuellement, les informations nouvellement créées sont généralement produites en tenant compte de la nécessité de fournir un accès WWW, et les documents antérieurs sont progressivement convertis pour cela, mais dans le monde, il existe encore des millions de fichiers sous des formes autres que les exigences WWW. Pour l'utilisation de ces informations et via le WWW, les services Internet ci-dessus sont inclus dans les navigateurs qui y donnent accès (telnet, ftp, Archie, Gopher). Grâce au WWW, vous pouvez également utiliser d'autres services Internet destinés à la communication (eMail, NetNews). Par conséquent, le navigateur WWW est maintenant devenu un programme de communication universel pour Internet.

Avec l'avènement du service WWW, le boom d'Internet a commencé. Cet environnement facile à utiliser et convivial pour tous les services a suscité l'intérêt de nombreuses personnes et organisations sur Internet. Il s'est soudainement avéré que vous n'aviez pas besoin d'être un expert d'Internet pour utiliser les services du réseau. Cela peut être comparé au succès de Microsoft dans la sortie de Microsoft Windows en tant qu'interface utilisateur graphique. Avant l'apparition de Windows, chaque application DOS avait son propre manuel d'utilisation et nécessitait donc une étude distincte de chaque application.

2 MÉTHODES DE BASE POUR TROUVER DES INFORMATIONS SUR INTERNET

2.1 Exigences de base pour la recherche

Des exigences sont imposées aux résultats de la recherche pour l'exhaustivité de la couverture des ressources, la fiabilité des informations reçues, la dépense de temps minimale et la vitesse de recherche maximale.

L'exigence d'exhaustivité de la couverture des ressources n'a pas besoin d'explications supplémentaires, à l'exception de la nécessité d'utiliser des ressources non seulement du WWW pour les recherches, mais aussi d'autres services Internet.

La fiabilité de l'information, compte tenu de la nature d'Internet, devient une exigence extrêmement importante. L'évaluation de la fiabilité peut être réalisée à la fois par des méthodes traditionnelles (vérification de la légalité des publications sur papier, obtention d'informations sur les organisations et les auteurs, recherche de la validité de leurs ressources électroniques, etc.), et en utilisant les possibilités d'Internet (familiarisation avec d'autres sources d'information, rapprochement des éléments factuels, établissement de la fréquence de son utilisation par d'autres sources ; recherche du statut du document et de l'évaluation de la source au moyen de moteurs de recherche, obtention d'informations sur la compétence et le statut de l'auteur du matériel à l'aide de services de recherche Internet spéciaux ; analyse d'éléments individuels de l'organisation du site afin d'évaluer les qualifications des spécialistes qui le soutiennent, etc.).

Le temps de recherche, sans compter le temps passé sur les spécifications de connexion, dépend largement de la planification de la recherche et des compétences du professionnel de la recherche avec le type de ressource choisi. La planification de la recherche consiste à déterminer les services de recherche nécessaires pour résoudre une demande de recherche et l'ordre dans lequel ils sont appliqués. En outre, beaucoup dépend des compétences et de l'expérience de chaque spécialiste de la recherche.

Comme nous l'avons déjà indiqué, l'information sur Internet est disponible à partir de divers types de sources. Il s'agit tout d'abord de ressources WWW (système hypertexte, catalogues de ressources, moteurs de recherche). De plus, il est déjà connu du lecteur de courrier électronique, des robots de messagerie, de Usenet et d'autres groupes de discussion, ainsi que des systèmes ftp et des archives (utilisant Gopher et Veronica). WWW vous permet de rechercher les ressources requises en fonction de ses hyperpropriétés, c'est-à-dire que les moteurs de recherche existants fonctionnent à l'aide d'hyperliens en mode automatique, sans exclure la possibilité de navigation manuelle. Le WWW propose un certain nombre de services de recherche généraux et spécialisés.

Les répertoires de ressources sont des bases de données avec des adresses de ressources Internet et une variété de sujets. Ils ont généralement une structure hiérarchique familière à l'utilisateur, et certains moyens de la parcourir. Pour la plupart, ces catalogues sont servis par des spécialistes de la classification, c'est-à-dire qu'une certaine approche subjective de la sélection des informations est prédéterminée, ce qui, d'une part, garantit un peu la fiabilité de l'information, mais d'autre part, prédétermine la possibilité de l'absence (omission) de certaines informations, ainsi que de tout placement tardif dans l'annuaire.

Les moteurs de recherche sont un mécanisme permettant de créer automatiquement des liens (index) vers diverses ressources. Les moteurs de recherche peuvent cibler des ressources mondiales, spécialisées ou locales. En fait, ce sont de puissants IRS qui, à l'aide de programmes de robots spéciaux (les "araignées"), effectuent en permanence une recherche automatique des informations requises sur Internet. Les bases de données spécialisées créées sur cette base fournissent une récupération d'informations basée sur les demandes des utilisateurs basées sur des IPL spéciaux. Certes, la couverture des informations consultées dépend des algorithmes utilisés et même pour les moteurs de recherche puissants, elle laisse beaucoup à désirer.

Le courrier électronique est utilisé sur Internet et le WWW. Dans ce cas, les adresses vont aux moteurs de recherche et sont disponibles pour les moteurs de recherche.

Les robots de messagerie sont des programmes spéciaux capables de répondre par certaines actions aux commandes qui leur sont adressées, mais par courrier électronique. Leur objectif principal est d'envoyer des données à la demande dans le cas où elles ne sont pas disponibles d'une autre manière, ainsi qu'une alternative au travail en ligne avec l'une des ressources connues, par exemple des archives ftp. L'adresse du robot mail est au format email. Lors de la recherche, les robots de messagerie ne sont généralement utilisés que comme intermédiaires pour obtenir des informations. Parfois, vous devez composer avec le fait qu'ils sont le seul moyen d'obtenir les informations nécessaires.

Usenet et d'autres groupes de discussion régionaux et spécialisés sont des « babillards électroniques » où l'utilisateur publie ses informations dans l'un des groupes de discussion thématiques, transmis aux abonnés du sujet concerné. Cette ressource est la plus importante pour l'accumulation rapide d'informations, mais un problème limité, et lors de la recherche - le plus souvent pour obtenir des informations privées et non officielles.

Les ressources disponibles via telnet, dans certains cas, représentent des informations totalement uniques, principalement sur les catalogues des bibliothèques des universités européennes et américaines, ainsi que des agences gouvernementales.

Comme déjà noté, le système d'archivage de fichiers ftp dispose d'une ressource assez étendue d'informations précieuses qui n'ont pas encore été traduites sur le WWW. Les archives ftp sont principalement des sources d'obtention de logiciels. Les rechercher peut être intéressant si vous connaissez la structure des archives ; construire des systèmes de fichiers, des noms de fichiers et des répertoires contenant les ressources requises.

2.2 Méthodes de recherche d'informations sur Internet

La recherche des informations dont vous avez besoin sur Internet peut se faire de différentes manières :

Recherche avec les moteurs de recherche par mot-clé

Rechercher avec les classificateurs des moteurs de recherche

Répertoires et collections de liens (concepts plus généraux)

Conférences, discussions

· Pages de liens ("Liens") sur des sites thématiques (articles rares, spécialisés)

Méthodes hors réseau (conseils d'amis, de connaissances ; publicité dans la presse écrite)

Au début de la recherche d'informations, il est nécessaire de déterminer son type. Classiquement, on peut distinguer 4 types d'informations.

1 type - général (par exemple: histoire de l'empire russe),

Type 2 - moins général (par exemple : l'empereur Alexandre II),

Type 3 - spécifique (par exemple : les réformes d'Alexandre II),

Le type 4 est plus spécifique (par exemple : l'abolition du servage).

Les chemins de recherche sont également déterminés en fonction du type d'informations.

Les informations de type 1 sont recherchées à l'aide des classificateurs des moteurs de recherche (du russe - Yandex www.Yandex.ru est recommandé). Si les sites contenant les informations requises ne sont pas immédiatement trouvés, vous devez alors parcourir les catalogues et les pages de liens ("Liens") trouvés par le classificateur, qui se trouvent sur des sites sur un sujet similaire. Ces sites sont répertoriés dans le classificateur par sujet et répertoires trouvés.

Les informations de type 2 sont recherchées de la même manière que la recherche de type 1, mais avec l'avantage de rechercher dans les répertoires et les pages de liens.

Informations de 3 types - par mots-clés entrés dans la barre de recherche des moteurs de recherche, catalogues, pages de liens

Informations de 4 types - selon les données détaillées saisies dans la barre de recherche. Les données sont trouvées selon les méthodes de recherche décrites pour les types 2 et 3.

Recherche par type 1. Informations requises : "Histoire de l'Empire russe".

Nous allons à Yandex - Science et éducation / Sciences sociales / Histoire. Selon la description du sujet, nous trouvons le site http://rus-hist.on.ufanet.ru .. S'il ne contient pas les informations nécessaires, rendez-vous sur la page des liens de ce site. Il contient des liens vers des catalogues de ressources : www.history.ru, http://www.lants.tellur.ru/history/index.htm. En eux, très probablement, des sites sur un sujet donné seront trouvés.

Recherche par type 2. Informations requises : "Empereur Alexandre II".

La recherche est effectuée de manière similaire à la précédente, mais une plus grande attention est accordée au travail avec les catalogues www.history.ru, http://www.lants.tellur.ru/history/index.htm.

Recherche par type 3. Informations requises : "Réformes d'Alexandre II"

Voici une nouvelle façon de rechercher - par mots-clés. Nous écrivons dans la ligne de recherche de Yandex "Réformes d'Alexandre II". Résultat pour la visualisation - 1790 pages, qui sont situées sur 170 sites, qui incluent des annuaires. Pour affiner les informations, vous pouvez ajouter de nouveaux mots-clés - des faits supplémentaires dans la sélection de sites déjà trouvée, par exemple : "1860-1870". etc. Dans d'autres moteurs de recherche, l'intégralité des "Réformes d'Alexandre II en 1860-1870" est tapée. Pour rechercher les informations spécifiées, vous pouvez également utiliser les "Liens", qui sont donnés sur les sites trouvés

2.3 Développement d'une ressource d'information

Comme les autres technologies de l'information, Internet est créé par des développeurs, mais dans ce cas il s'agit principalement de créateurs de ressources (à commencer par les spécialistes qui supportent le matériel et les logiciels, les concepteurs, les artistes, les éditeurs, et surtout, les auteurs de ressources d'information). Naturellement, la création de ressources n'est pas une fin en soi, les ressources sont demandées par les utilisateurs du réseau, c'est-à-dire par les mêmes spécialistes et consommateurs de ressources, parmi lesquels, comme déjà noté, une nouvelle couche apparaît - les spécialistes du datamining, de l'information chercher. Les ressources d'information d'Internet, ainsi que d'autres, y compris les ressources d'information non électroniques (en particulier les médias de masse), sont caractérisées par certains états de leurs activités (Fig. 9.3).

La ressource naît en fonction des besoins de la société et de ses capacités (en particulier, celles liées au niveau de l'état technique et social de la société).

Dans la mesure du possible, il y a une "maturation", la formation d'une ressource (ou sa disparition en l'absence de demande, c'est-à-dire disparition, peut-être pas au sens physique - le site peut exister, c'est-à-dire au sens d'être en demande).

A un certain niveau de demande et (incluant les efforts des auteurs du site), elle est cataloguée, c'est-à-dire que des informations sur la ressource apparaissent dans différents répertoires correspondant au type de ressource.

L'indexation, c'est-à-dire l'apparition d'une ressource dans les index des moteurs de recherche, se produit lorsqu'une certaine quantité de contenu est atteinte et demandée.

S'il y a une croissance constante de la demande, la ressource est en constante évolution, sinon la ressource s'éteint et disparaît progressivement des index et des catalogues.

2.4 Exigences pour les outils de recherche

Comme indiqué précédemment, les caractéristiques inhérentes à une recherche professionnelle sont son exhaustivité, sa fiabilité et sa vitesse élevée. Le facteur le plus sérieux et non négligeable qui détermine la vitesse d'atteinte de l'objectif de recherche est la planification de la procédure de recherche. Cela nécessite, d'une part, la sélection du type de ressources potentiellement capables de transporter des informations pertinentes pour la tâche de recherche, et d'autre part, la sélection d'outils de recherche desservant le champ d'information correspondant, en fonction de leurs performances attendues. . Si nous parlons du plus vaste pour aujourd'hui, du point de vue du contenu de l'information, l'espace WWW, alors l'abondance relative de ses outils de recherche rend la solution de la plupart des problèmes pratiques multivariée. La construction de la séquence optimale pour l'utilisation de certains outils à chaque étape de la recherche et prédétermine son efficacité. Une idée claire des types, de la finalité et des caractéristiques du travail des systèmes de recherche d'informations (ISS) d'Internet peut aider à résoudre le problème du choix.

Les véritables vecteurs d'informations sur les ressources dont dispose Internet sont les moteurs de recherche et les catalogues. Les systèmes de recherche d'informations d'Internet diffèrent, mais le principe de sélection des informations, qui à un degré ou à un autre est présent dans le programme de numérisation du moteur de recherche, et dans les activités des spécialistes effectuant le catalogage. En règle générale, on distingue deux indicateurs principaux : l'échelle spatiale du système et sa spécialisation.

Lors de la formation du tableau d'informations, le moteur de recherche peut suivre la mise à jour d'un ensemble prédéterminé de documents, de catalogues ou d'un nombre fini de nœuds sélectionnés selon un certain principe. De tels systèmes, mis en œuvre sur Internet, peuvent être appelés quelque peu conditionnellement locaux et. Les moteurs de recherche mondiaux, contrairement aux moteurs locaux, résolvent une tâche plus laborieuse - la couverture la plus complète possible des ressources de l'ensemble du domaine informationnel de l'Internet (WWW ou autre) qu'ils desservent. La conséquence de ceci est le rôle croissant du mécanisme utilisé par un tel système pour augmenter constamment le nombre de sites consultés.

La construction de services de recherche régionaux et spécialisés suppose un filtrage actif de l'information. La spécialisation d'un moteur de recherche sur n'importe quel profil OU thématique, qu'il s'agisse d'un axe juridique, la recherche de personnalités ou de fichiers multimédias au format MP3, peut se faire aussi bien globalement que localement. Bien sûr, le système est plus facile à construire et à maintenir dans un espace limité de sites mis à jour, ce qui est généralement mis en œuvre dans la pratique.

Les services de recherche régionaux filtrent les informations principalement par le nom de domaine de premier niveau du serveur, par exemple, par pour la Biélorussie, ru - pour la Russie. Un inconvénient sérieux de tels systèmes est le manque de comptabilisation d'un grand nombre de ressources publiées par les auteurs de ressources régionales directement dans le domaine com.

La prise en compte des particularités régionales est souvent présente dans les services de recherche mondiaux. Le système Lycos, par exemple, classe les réponses par région de demande.

De par sa nature, Internet s'accompagne d'un chaos informationnel. Et seuls les moyens modernes d'indexation automatique des documents sont capables, compte tenu des algorithmes utilisés et des capacités des moyens techniques, de trouver un grain rationnel dans ce chaos. L'utilisation de ressources lors de la recherche de ressources sans recherche par mots-clés rappelle la navigation et n'est pas un travail sérieux avec l'information.

2.6 Moteurs de recherche mondiaux sur le Web

Après s'être familiarisé avec plusieurs moteurs de recherche mondiaux, l'utilisateur s'arrête généralement à un ou deux, avec lesquels il préfère travailler à l'avenir. Dans le même temps, le choix d'un service de recherche se fait souvent de manière totalement arbitraire, non pas sur l'analyse des capacités réelles des systèmes, mais sur leur popularité. L'un des plus grands et des plus populaires est AltaVista. Le système AltaVista dispose d'un langage de requête flexible, qui nécessite cependant une étude spécialisée. AltaVista prend en charge l'index de recherche en plusieurs langues et la possibilité de traduire en ligne (c'est-à-dire directement au cours d'une session) le texte d'une page Web des langues européennes courantes vers l'anglais.

Un autre système bien connu est NorthernLight, qui possède un ensemble de fonctions assez standard. Le système permet en outre de travailler avec une collection unique de liens (plus de 6 000), principalement vers des articles de périodiques. La prise en charge de l'indexation de l'alphabet cyrillique (y compris la langue russe) en fait, avec AltaVista, un bon complément aux moteurs de recherche régionaux russes Rambler, Yndex et Aport pour la recherche en russe.

La recherche et la collecte d'informations sur Internet nécessitent une planification. Logique erronée de création d'une requête, séquence non optimisée d'utilisation d'outils de recherche, tentatives d'accélérer la recherche - tout cela non seulement retarde l'obtention du résultat, mais peut compromettre le sens du travail de recherche.

Arrêtons-nous sur plusieurs points importants liés à la planification et aux premières étapes d'un tel travail.

Il est nécessaire de commencer par une analyse lexicale complète des informations requises. Toute description suffisamment fiable et détaillée du problème à l'étude doit être utilisée pour obtenir des informations primaires. Une telle source peut fort bien être à la fois un ouvrage de référence hautement spécialisé et une encyclopédie électronique de profil général. Sur la base du matériel étudié, il est nécessaire de former l'ensemble le plus large possible de mots-clés sous forme de termes séparés, de phrases, de vocabulaire professionnel, d'argot, de mots clichés et de clichés verbaux stables, si nécessaire en plusieurs langues. Les affinements possibles de la requête de recherche doivent être déterminés à l'avance - mots rares, synonymes et antonymes. noms et prénoms étroitement liés à la question en question. Il est également souhaitable d'anticiper d'éventuelles réponses non pertinentes aux requêtes, c'est-à-dire des caractéristiques possibles du bruit de recherche, à l'avance. Après l'accumulation de ces données préliminaires, vous pouvez procéder à l'obtention d'informations primaires sur Internet.

La tâche principale de cette étape est de prendre en compte les particularités d'Internet, qui n'est pas seulement porteur de technologies, mais aussi de traditions et de sa propre éthique. Le vocabulaire du réseau, l'argot et l'orthographe des mots courants ici peuvent différer de ceux acceptés.

Il est préférable de rechercher des informations sur la disponibilité des données nécessaires sur Internet dans un répertoire déjà connu qui prend en charge les recherches par mot clé. Lors de la résolution, par exemple, de tâches simples telles que « Obtenir le texte de la Constitution de la République du Bélarus » ou « Dans quels actes juridiques le nom de la ville natale est-il utilisé ? »

Après l'analyse lexicale de l'information, commence l'étape technologique. Le choix du champ d'information d'Internet et des outils de recherche est basé sur les approches ci-dessus.

Des requêtes de test à partir d'un ou deux mots-clés ou expressions sont utilisées, puis la réponse quantitative est analysée. L'analyse du contenu des données permet d'ajuster les requêtes, mais aussi la pertinence de la réponse. À la suite de tests, les sources d'information les plus représentatives sont identifiées, après quoi la séquence d'utilisation des outils de recherche doit être clarifiée. Ceci conclut la phase de planification.

En conclusion, notons que pour résoudre le problème de la collecte d'informations sur Internet, les services de recherche régionaux et spécialisés jouent un rôle important. L'utilisation d'index globaux non pas pour la recherche directe des informations nécessaires, mais pour la localisation de ces outils de recherche, permet souvent de raccourcir le temps nécessaire à la résolution d'un problème de recherche donné.

CONCLUSION

Compte tenu de tout ce qui précède, nous pouvons essayer de définir l'essence d'Internet en un mot : c'est la communication, la communication entre des individus et des nations entières sans l'intervention des autorités gouvernementales. Cette nouvelle technologie change le visage de la civilisation à une vitesse fulgurante, changeant radicalement l'idée de l'humanité sur le monde et sur elle-même. Internet a déjà absorbé des dizaines de millions de personnes, plus d'une centaine de pays, il a complètement changé les processus de diffusion et de perception de l'information. A l'ère des technologies de l'information, Internet en réalité virtuelle, contribuant à l'effacement des frontières étatiques, à la réduction des distances géographiques, à l'élimination des barrières entre les cultures , ne devient pas moins évident que le monde matériel qui nous entoure.

Avec le développement d'INTERNET, il est devenu possible de rechercher rapidement et facilement les informations documentaires nécessaires. Désormais, vous n'avez plus à vous engager dans la sélection et l'étude d'une énorme quantité de littérature dans les librairies et les bibliothèques. Les informations peuvent être obtenues sans quitter votre domicile ou votre bureau. Pour ce faire, vous n'avez besoin que d'un ordinateur directement connecté à INTERNET avec un programme spécial installé - un navigateur conçu pour afficher le contenu des pages Web.

Grâce à la variété des moteurs de recherche spécialement conçus pour l'utilisateur moyen, tout le monde peut facilement couper le flux d'informations manifestement inutile, uniquement en formulant correctement le but de la recherche.

LISTE DE LA LITTÉRATURE UTILISÉE

1. Grinberg A.S., Kashinsky Yu.I., Slavin B.S. Introduction à l'informatique juridique. Minsk : NO OOO BIP-S, 2002.S. 303.

2. Gusev V.S. Google : recherchez efficacement. Guide de démarrage rapide. M., 2006.

3. Informatique pour les avocats et les économistes. / Edité par S. V. Simonovich. SPb. : Pierre, 2001.

4. Informatique. Cours de base. Manuel pour les universités, Saint-Pétersbourg, 2001

5. L'informatique dans l'activité juridique / Edité par le Professeur N. Polevoy. M. : Maison d'édition BEK, 1994.

6. Cornichons MM Droit de l'information. - M.M. : Juriste, 1999.-321s.

7. Encyclopédie d'Internet, Saint-Pétersbourg, 2001

8. Comparaison des navigateurs // http://www.microsoft.com

Peu de temps s'est écoulé depuis, et le Consortium international du journalisme d'investigation - ICIJ, sur la base de ces documents, a préparé un nouveau "cadeau" grandiose pour les politiciens corrompus. La fuite de documents secrets a montré comment les présidents des grandes et petites puissances, leurs proches et associés sont impliqués dans la dissimulation de revenus dans les zones offshore.

La plus grande fuite d'une entreprise panaméenne révèle la corruption des dirigeants mondiaux
Les documents contiennent les noms de 72 dirigeants d'États actuels et anciens, y compris des dirigeants accusés de piller leur pays. Cette liste contient les noms du président ukrainien Petro Porochenko, du roi d'Arabie saoudite, du président de la Fédération de Russie Poutine et de ses amis proches, Bachar al-Assad et du chef de la nation azerbaïdjanaise, Ilham Aliyev.


Le directeur de l'ICIJ, Gerard Ryle, a déclaré que "la fuite serait la plus durement touchée en mer jamais entreprise". Apparemment, quelqu'un de vraiment puissant et bien informé, ayant porté un coup dur aux activités offshore, a déclaré la guerre à la corruption, à la dissimulation de revenus et au blanchiment d'argent à l'échelle mondiale.

Pourquoi tant de bruit autour des Panama Papers
Permettez-moi de rappeler au cher lecteur que ce blog n'est pas sur la politique, mais sur l'information et sa recherche sur Internet. Dans ce cas, ces choses sont, bien sûr, liées. Mais, cet article est uniquement destiné à mettre en évidence un événement extraordinaire du côté informatif. Alors qu'il y a du bruit et de la mousse qui bouillonnent autour de PanamaLeaks, nous allons essayer d'analyser cet événement et ses conséquences.

Il faut dire que le retrait de fonds vers l'offshore, comme moyen d'éviter l'imposition dans votre pays, n'est strictement pas un crime. Oui - laid, oui - pas patriotique, mais pas un crime. Dans les pays où cela est autorisé. C'est vrai, mais quand il s'agit d'hommes d'affaires ou d'acteurs, comme c'est le cas du footballeur Lionel Messi ou du cascadeur Jackie Chan.
(mis à jour)

Si des informations sont trouvées sur une entité commerciale d'intérêt, vous pouvez activer le suivi automatique des changements dans les registres qui concernent cette entreprise ou cet entrepreneur. Les informations mises à jour seront envoyées à votre e-mail. Les développeurs de services ne cachent pas leurs plans pour le développement du projet. Il est prévu d'ajouter des informations analytiques : articles dans les médias, réputation des entités commerciales sur la base des retours des partenaires commerciaux, analyse financière, probabilité de faillite, etc.

Bien sûr, trop peu de temps s'est encore écoulé pour tirer des conclusions sur le travail du moteur de recherche. Il peut y avoir plus de problèmes. J'entrevois, par exemple, les contradictions liées à la notion de secrets commerciaux. De manière générale, nous verrons comment le projet évoluera et vous souhaitons bonne chance dans votre entreprise !

Liens connexes:
youcontrol.com.ua sur VKontakte vk.com/public91977868
sur Facebook www.facebook.com/youcontrol.com.ua
E-mail [email protégé]
Tél. +38 066 189 02 06

Eh bien, et, comme d'habitude, une vidéo sur laquelle les commentaires sont absolument inutiles.

Comme le note la source, les informations publiées par lui ne sont qu'une sorte de partie d'essai. La véritable quantité de données dont disposent les journalistes est bien plus importante. Ainsi, les propos des représentants du consortium journalistique selon lesquels le monde tranquille des sociétés offshore attend un véritable « tremblement de terre » semblent tout à fait plausibles.

Tout récemment, des développeurs français ont présenté le nouveau moteur de recherche Qwant (qwant.com) au public Internet. Les Français eux-mêmes qualifient leur moteur de recherche de révolutionnaire. Selon le co-fondateur, Qwant est à la fois un système holistique et impartial. Il offre des informations sans faire de préférence de recherche.

Le développement de Qwant dure depuis deux ans. Comme les développeurs l'admettent, l'objectif principal du nouveau moteur de recherche est de dépasser et de dépasser le plus grand moteur de recherche Google. Ainsi, qwant.com a été lancé le 13 février 2013. Ce système est actuellement en test et est disponible dans 35 pays en 15 langues.

Parmi les fonctionnalités de la nouvelle recherche figure la répartition des résultats trouvés par catégories. Ainsi, vous pouvez trouver des informations sur les réseaux sociaux - c'est la colonne Social ou, par exemple, faire défiler les données du fil d'actualité (Live). La colonne Web affiche les articles les plus populaires pour votre demande, tandis que la colonne Shopping affiche des informations commerciales sur le produit que vous avez demandé.

Au milieu de la page se trouve la colonne Knowledge Graph - vous pouvez y obtenir une brève description de votre requête - ce que c'est, où elle est appliquée, etc. - comme une description dans un dictionnaire explicatif. De plus, Qwant propose une sortie image et vidéo à votre demande. Il existe également une grande différence avec Google, Yandex et d'autres moteurs de recherche, où vous devez accéder à un onglet spécial pour afficher les images d'une requête de recherche.

Qwant peut être considéré comme l'un des moteurs de recherche les plus conviviaux. Il offre un grand nombre de paramètres pour un affichage plus pratique des données pour vous. Les colonnes des catégories de problèmes peuvent être modifiées par leur emplacement entre elles. Par exemple, si vous êtes principalement intéressé par la ligne d'information, vous pouvez la déplacer vers la gauche pour qu'elle soit la première à attirer l'attention, et la liste des informations commerciales peut être déplacée le plus à droite possible.

Faisons un petit test du moteur de recherche. Disons que nous nous intéressons au travail de Monica Bellucci. Nous ouvrons la page de démarrage de qwant.com, qui, soit dit en passant, est très similaire dans sa conception à Google. Nous entrons "Monica Bellucci" dans la ligne et voyons ce qui suit : tout en haut on nous propose une vidéo et une photo de cette célèbre actrice, tandis que vous pouvez faire défiler les résultats des médias tout en haut à l'aide de la flèche, sans aller à l'onglet avec des photos.


Dans la colonne Web, nous voyons des liens vers plusieurs des sites les plus pertinents contenant des informations sur Bellucci - Wikipedia, KinoPoisk, etc. colonne, vous pouvez voir les critiques des gens sur Monica Bellucci sur les réseaux sociaux, mais dans Shopping, nous voyons une liste de sites où vous pouvez acheter des films avec Monica.

Comme vous pouvez le voir, le système vise à fournir des réponses à toute demande de l'utilisateur, sans imposer de résultats à l'utilisateur, mais en les proposant dans plusieurs catégories au choix. Les créateurs de Qwant eux-mêmes confirment que l'accent a été mis sur l'amélioration de la recherche d'informations sur les réseaux sociaux populaires.


Bien entendu, les technologies cloud sont payantes, car vous utilisez des serveurs tiers. Mais un tel service présente de nombreux avantages, notamment :

Le client ne doit payer que pour la quantité de stockage dans le stockage qu'il utilise réellement, et non pour la location d'un serveur ;
- le client n'a pas besoin d'acheter, d'entretenir et de maintenir son propre équipement de stockage de données, ce qui réduit considérablement les coûts de production ;
- toutes les questions techniques concernant la préservation de l'intégrité des informations publiées et la sauvegarde des données sont effectuées par le prestataire, ce qui ne nécessite pas la participation du client à ce sujet.

Pourquoi le stockage en nuage est si attrayant
Vous avez bien sûr utilisé le partage de fichiers, dont il existe encore un grand nombre. Là, vous pouvez télécharger votre propre fichier, qui devient disponible pour tout utilisateur qui peut trouver votre fichier par étiquette ou par nom. En revanche, la technologie cloud offre une confidentialité totale. C'est-à-dire que seul le propriétaire des informations peut utiliser les données publiées et il entre dans le système avec son nom d'utilisateur et son mot de passe.

Les utilisateurs ordinaires sont tombés amoureux de ces technologies car il n'est désormais plus nécessaire d'encombrer l'ordinateur avec des tonnes d'informations anciennes - sur n'importe quel ordinateur, vous pouvez toujours trouver plusieurs gigaoctets de vieille musique, qui peuvent encore être utiles un jour, une collection de films qui ont été révisés plusieurs fois, des documents déjà imprimés et utilisés.

Mais, néanmoins, toutes ces informations doivent être stockées quelque part. Les services cloud proposent de libérer directement l'espace sur l'ordinateur en envoyant toutes les données inutiles vers le "cloud". Tout ce que vous avez à faire est d'être prêt à payer des frais et d'avoir une connexion Internet haut débit.

Une autre caractéristique du stockage en nuage est que vous pouvez obtenir les données stockées à tout moment et à partir de n'importe quel appareil. Autrement dit, si vous avez envoyé un film "dans le cloud" depuis un ordinateur, vous pouvez le récupérer sur votre ordinateur depuis un ordinateur portable, une tablette, un smartphone ... L'essentiel est que vous ayez un mot de passe et que vous vous connectiez avec vous.

Quel stockage cloud choisir ?
Il existe un grand nombre de services cloud, et ils évoluent constamment, offrant non seulement un espace de stockage, mais également des services associés. Vous trouverez ci-dessous les plus populaires.

1. Windows Live SkyDrive - Offre le plus d'espace serveur. Les utilisateurs enregistrés peuvent stocker gratuitement jusqu'à 25 Go de leurs propres informations dans le cloud. Les documents Office téléchargés sur le stockage cloud peuvent être modifiés et ouverts directement dans le navigateur. La synchronisation peut être effectuée à partir de plusieurs appareils informatiques à la fois.

2. DropBox est un service très connu des utilisateurs ordinaires, mais n'offre que 2 Go d'espace pour chacun de ses clients. Si vous utilisez un compte payant, vous pouvez étendre vos capacités jusqu'à 20 Go.

Graph Search (ci-après GS) est le nom de la mise à jour Facebook (FB) récemment annoncée par Zuckerberg, qui « socialise » davantage le premier réseau social de la planète. La version bêta du nouveau service n'a été lancée jusqu'à présent que dans le segment anglophone de Facebook. La recherche « savoir-faire » sera disponible ultérieurement pour les utilisateurs russophones du réseau social, mais vous pouvez dès maintenant ajouter votre compte à la « liste d'attente ».

Techniquement, GS est un système de filtres qui utilise l'algorithme de recherche Bing au sein du réseau social et vous permet de rechercher des personnes, des lieux d'intérêt, de la musique (dans une future mise à jour), des photos qui correspondent à vos intérêts Facebook. Pour un utilisateur social, Graph Search ressemblera à une barre de recherche en haut de n'importe quelle page FB.

Lorsqu'une requête est saisie dans la ligne de recherche GS, le résultat de la recherche est collecté sur une page distincte portant le nom de la requête (par exemple : "Mes amis à Rio"). Il est prévu de rechercher par "j'aime", commentaires, contenu multimédia, marques de photos. La date de la prochaine mise à jour du service intelligent est encore inconnue.

Recherche de graphiques Facebook - Comment ça marche ?
Le développement a commencé par la déclaration : pour un utilisateur, la recommandation d'un ami est plus importante que les estimations de milliers d'inconnus. Ainsi, en utilisant Graph Search, vous pouvez trouver, par exemple :

Photos de camarades avant 1995;
- les amateurs de squash de votre ville ;
- des photos d'amis prises en Indonésie ;
- les bars à sushis métropolitains préférés de vos amis ;
-des sites touristiques de Prague ou de Paris, visités par vos amis.

Sujet d'inquiétude ou fausse alerte ?
Les premières nouvelles concernant Graph Search ont suscité quelques inquiétudes parmi les utilisateurs de FB. Oui, un service intelligent est très attrayant en termes de capacités de recherche, mais beaucoup ont peur d'utiliser la recherche sociale par des sociétés de marketing, des services spéciaux, des groupes criminels, des agences gouvernementales et des propriétaires de services Internet sans scrupules pour collecter des informations. Les craintes sont-elles justifiées ?

D'une part, Graph Search ne modifie pas les paramètres de confidentialité, par conséquent, seuls les utilisateurs de FB pour lesquels ils sont ouverts peuvent "donner" des données privées. D'un autre côté, les entreprises transcontinentales, les intranets gouvernementaux et même les banques souffrent de « fuites d'informations ». Facebook est-il sécurisé en termes de sécurité ? Le temps nous montrera.

La recherche marketing fait référence à la collecte, à l'affichage et à l'analyse systématiques de données sur divers aspects des activités de marketing.

La recherche marketing est une fonction qui, grâce à l'information, relie les spécialistes du marketing aux marchés, aux consommateurs, aux concurrents et à tous les éléments de l'environnement marketing externe.

Les informations primaires sont des informations que le chercheur reçoit de manière indépendante spécifiquement pour résoudre le problème de la recherche marketing.

Pour collecter des informations sur les préférences des consommateurs et les préférences de spécialistes qualifiés dans le domaine des méthodes de collecte, sources d'information sur Internet, une méthode d'enquête a été utilisée.

L'enquête consiste à collecter des informations primaires en posant directement aux personnes interrogées des questions sur leur niveau de connaissance, leur attitude vis-à-vis du produit, leurs préférences et leur comportement d'achat.

Selon les types de répondants, une enquête a été sélectionnée avec la participation d'une catégorie de population dont l'activité professionnelle n'est pas liée à l'objet d'analyse.

Une étude marketing a été menée pour identifier les caractéristiques de la recherche et de l'utilisation de l'information sur Internet. Le public cible de cette étude est la population de la République de Biélorussie âgée de moins de 18 ans. La collecte des données est effectuée dans la ville de Gomel.

Pour déterminer la taille d'échantillon requise, la formule suivante a été utilisée :

où n est la taille de l'échantillon ;

z - écart normalisé, déterminé en fonction du niveau de confiance sélectionné ;

p est la variation trouvée pour l'échantillon ;

e est une erreur valide.

Par conséquent, la quantité de variation est égale à une personne.

Toute recherche marketing commence par définir le problème. Ainsi, dans notre étude, le problème nécessitant une recherche sera formulé comme suit : « Que pensent les consommateurs de l'utilisation et de la recherche d'informations sur Internet ?

Les questions de recherche clarifient les composants individuels du problème, dont chacun peut à son tour être décomposé en composants - les questions de recherche. Les questions de recherche déterminent la gamme d'informations spécifiques qui seront nécessaires pour résoudre le problème de recherche. Ainsi, les questions de recherche dans notre recherche peuvent être les suivantes : 1. Qui est un utilisateur des moteurs de recherche » : quel est le sexe, l'âge, le niveau de revenu, le statut social. 2. Quel moteur de recherche les utilisateurs choisissent-ils ? 3. Quels sites les utilisateurs visitent-ils le plus souvent ? 4. Dans quel but les utilisateurs utilisent-ils Internet ? 5. Quelles informations sont les plus intéressantes sur Internet ? Sur la base des questions de recherche, des hypothèses peuvent être formulées : 1. Les utilisateurs choisissent le moteur de recherche Google 2. Les utilisateurs des moteurs de recherche sont le plus souvent la population âgée de 19 à 25 ans 3. Les utilisateurs visitent le plus souvent les sites de divertissement 4. La plupart des utilisateurs utilisent le Internet pour la communication 5. Pour les utilisateurs, les informations sur les divertissements et les loisirs sont les plus intéressantes 6. La plupart des utilisateurs trouvent les informations dont ils ont besoin 7. Les utilisateurs utilisent Internet plus souvent à la maison

En septembre - novembre 2011, une étude de marché a été menée, au cours de laquelle 150 citoyens vivant dans la ville de Gomel ont été interrogés. Les répondants ont été invités à remplir un questionnaire composé de 17 questions. La période d'étude est de 12 semaines, compte tenu de la préparation du questionnaire et du traitement des données obtenues.

Pour identifier les préférences des consommateurs, un questionnaire a été élaboré (ANNEXE A).

Au cours du processus de recherche marketing, lors des entretiens avec les répondants, les groupes d'âge de consommateurs suivants ont été identifiés (Figure 3.1)

Figure 3.1- Diagramme de la répartition des répondants par âge

Comme le montre la figure 3.1, selon le critère d'âge, l'utilisation des moteurs de recherche est une part importante des répondants dont l'âge se situe entre 19 et 25 ans, soit 35 %. Les citoyens âgés de 56 ans et plus représentaient 3 % en pourcentage. Le public cible en fonction de son domaine d'activité est illustré à la figure 3.2.

Figure 3.2 - Schéma de répartition des répondants selon le statut social

En analysant les réponses des répondants, nous pouvons conclure qu'une partie importante des utilisateurs de moteurs de recherche sont des employés (36%) et des travailleurs (30%). Viennent ensuite les étudiants (17 %) et les entrepreneurs (15 %), avec une légère différence.

Les données obtenues sur le niveau de revenu de la population sont présentées dans la figure 3.3.

Riz. 3.3

La figure 3.3 montre qu'un plus grand nombre de personnes interrogées ont un niveau de revenu moyen compris entre 1 000 000 et 2 000 000 de roubles, soit 65,3 %. Les répondants avec un faible niveau de revenu représentaient 26,3%, et avec un niveau élevé - 8%.

Riz. 3.4

La figure 3.4 montre que le nombre de types et de noms du moteur de recherche est très important. Les systèmes les plus populaires sont Google -45%, suivi de Mail.ru, puis Yandex -20% et Rambler-10% en dernière position. en général, il y a une grande différence dans les préférences des consommateurs de Google, Mail.ru, Yandex et Rambler observée.

Riz. 3.5

La figure 3.5 montre que les sites visités plus souvent que les autres sont des sites de divertissement -35 %, puis d'information -33 %, puis d'entreprise-25 % et un autre -7%

Riz. 3.6

La figure montre que la majorité des personnes interrogées utilisent des moteurs de recherche - 90,2%

Riz. 3.7

Selon les résultats de l'étude, il a été révélé que pour 61% des répondants, le moteur de recherche est un moyen de communication pratique, pour 34% un moyen simple et efficace de trouver des informations et pour 5% autre chose. La structure des réponses est clairement illustrée à la figure 3.7.

Riz. 3.8

Cette étude a fourni des informations sur la fréquence d'utilisation d'Internet, où les consommateurs qui visitent Internet sur une base quotidienne s'élèvent à 74%, 3-4 fois par semaine - 16% et 3-4 fois par mois-10 La structure des réponses est clairement illustré à la figure 3.8

Riz. 3.9

Comme le montre la figure 3.9, la majorité des répondants utilisent Internet à la maison (75 %), 16 % au travail, 5 % lors d'une visite et 4 % dans un cybercafé.

Riz. 3.10

La figure 3.10 montre que les personnes interrogées utilisent le plus souvent Internet pour communiquer (48 %), ainsi que pour rechercher des informations (26 %), regarder des actualités (19 %) et du courrier (7 %)

Riz. 3.11

Selon les résultats de l'étude, il a été révélé que 44% des répondants sont les plus intéressés par les informations sur les loisirs et les divertissements-44%, Internet-42%, les affaires 31%, les ordinateurs 29%, la société 27%, les sciences et l'éducation 25 %, culture et art 20%, médecine et santé 19%, foyer et famille 18%. La structure des réponses est clairement illustrée à la figure 3.11.

Riz. 3.12 - Diagramme de la répartition des répondants en répondant à la question : « Arrivez-vous à trouver les informations dont vous avez besoin sur Internet ? »,%

La figure 3.12 montre qu'un plus grand nombre de répondants trouvent toujours l'information qu'ils recherchent -52 %, puis trouvent souvent -33 %, rarement -12 %, jamais 3 %.

Ainsi, lors de l'enquête, les préférences des consommateurs suivantes ont été révélées : la majorité des répondants préfèrent un moteur de recherche tel que Google, tandis que l'utilisation de Mail.ru n'a pas un grand écart entre eux (5,%).

35 % de l'échantillon visitent le plus souvent des sites de divertissement. 58 % des consommateurs visitent Internet tous les jours, mais comme l'a montré l'analyse, les visites augmentent chaque jour. Et faire une prévision pour la croissance future est prévu. Par conséquent, les développeurs de moteurs de recherche doivent :

Améliorer les algorithmes de recherche (ou développer de nouvelles stratégies de recherche) et les « cloches et sifflets » connexes tels que la conception et les services supplémentaires ;

Fournir une analyse des requêtes (questions) posées en langage naturel ;

Indexer les fichiers CSS externes des moteurs de recherche ;

Augmenter la taille du document ou la taille de la partie qui sera indexée

Analyseur Est un programme pour automatiser le processus d'analyse, c'est-à-dire traiter les informations selon un certain algorithme. Dans cet article, je vais donner quelques exemples de programmes d'analyse et décrire leur objectif et leurs fonctions principales en un mot.

Analyseur de contenu X-Parser

Les fonctions principales du programme se composent également de plusieurs blocs de programme.

  • Analysez tous les moteurs de recherche pour les requêtes clés
  • Analyser le contenu de n'importe quel site
  • Analyseur de contenu pour les requêtes clés à partir des résultats de n'importe quel moteur de recherche
  • Analyseur de contenu pour une liste d'URL
  • Analyseur de liens internes
  • Analyseur de liens externes

Programme WebParser

L'analyseur WebParser est un programme polyvalent. dont la fonction principale est l'analyse des moteurs de recherche. Fonctionne avec PS Google, Yandex, Rambler, Yahoo et quelques autres. analyse les moteurs de site (CMS). Compatible avec toutes les versions de Windows à partir de W2000. Bollé informations complètes.

Plugin WP Uniparser

N'oublions pas et plugin pour WordPress WP Uniparser... Vous pouvez en savoir plus en suivant ce lien.

Analyseur "Magadan"

L'analyseur de mots-clés avec le nom romantique "Magadan" a été créé spécifiquement pour le traitement ciblé des mots-clés Yandex.Direct. Il est utile pour constituer un noyau sémantique, préparer des campagnes publicitaires et collecter et analyser des informations.

Enfin, il convient de mentionner langage de programmation pour la création de sites Parser, créé au studio d'Artemy Lebedev et servant au développement de sites. Ce langage sera un peu plus complexe que le HTML ordinaire, mais ne nécessite pas autant de préparation que, par exemple, PHP.

INTRODUCTION

Internet est comme une immense bibliothèque mondiale, qui n'a qu'une seule différence significative : pour rechercher un livre dans la bibliothèque, il existe un catalogue, en dernier recours, vous pouvez vous tourner vers un bibliothécaire expérimenté. Il n'existe pas de catalogue complet d'Internet. Mais, néanmoins, la recherche dans le réseau informatique mondial est possible, et c'est peut-être l'un des aspects les plus importants de celui-ci. Pour rechercher des données dans le réseau, des serveurs spéciaux sont utilisés, dont les informations sont conservées et mises à jour presque automatiquement.

Aujourd'hui, alors qu'Internet est devenu l'une des principales sources d'information, la recherche sur Internet prend de plus en plus de valeur pratique. Mais avec l'augmentation rapide de la quantité de données disponibles, la procédure de recherche elle-même devient de plus en plus compliquée.

Internet est un réseau informatique mondial qui relie à la fois les utilisateurs du réseau informatique et les utilisateurs de PC. Internet devient lentement mais sûrement le principal moyen de communication d'entreprise, laissant la place jusqu'ici au téléphone.

Il existe une énorme quantité de ressources d'information sur le Web. Selon certaines estimations, le nombre de documents a dépassé les 65 millions et continue de croître rapidement. Un tel volume d'informations nécessite une organisation correcte du processus de recherche et l'utilisation de moyens techniques particuliers, tels que les moteurs de recherche. Une simple recherche d'un mot-clé assez courant donne généralement des dizaines de milliers à plusieurs millions de liens. Il est évident que travailler avec un si grand nombre de documents est pratiquement impossible, d'autant plus que l'écrasante majorité d'entre eux contiennent des informations non pertinentes.

Les sources d'information sur Internet diffèrent dans la manière dont l'information est présentée et, par conséquent, dans la méthode d'accès à celles-ci.

1 OUTILS DE RECHERCHE

1.1 Outils de recherche de fichiers

Trouver le fichier manuellement dans la structure de répertoires complexe du serveur ftp peut prendre beaucoup de temps. Pour simplifier et accélérer la recherche, le service de recherche Internet Archie a été développé, qui est un serveur Archie spécial qui stocke le contenu des répertoires des serveurs ftp anonymes. Lors de l'adressage d'une requête de recherche sur un serveur Archie, le résultat de la recherche est une liste d'adresses de serveurs ftp anonymes contenant le fichier souhaité.

Mais la tâche se pose de trouver celui souhaité parmi l'ensemble des fichiers sur ce serveur, ce qui est assez difficile en raison des noms de fichiers et de répertoires peu clairs et incompréhensibles. Pour résoudre ce problème, le système Gopher est utilisé, ce qui vous permet de naviguer dans un système de menus contextuels, affichant le contenu des fichiers en utilisant des notations compréhensibles. Il existe de nombreux serveurs Gopher qui contiennent des archives de données sous forme de répertoires structurés hiérarchiquement, classés par contenu. Travailler avec eux est très simple et correspond à travailler avec un affichage de système de fichiers normal.

Il existe une extension de ce système - Veronica, qui contient des catalogues de tous les serveurs Gopher dans sa base de données. Après avoir entré une requête de recherche, Veronica scanne automatiquement tous les répertoires Gopher pour les informations que vous recherchez, éliminant ainsi le besoin de rechercher manuellement de nombreux serveurs Gopher.

Avec cette façon de naviguer, Gopher était en quelque sorte le prédécesseur du WWW. Actuellement, l'utilisation de Gopher diminue proportionnellement à l'augmentation de l'utilisation du WWW.

1.2 Outils WWW - WorldWideWeb

En 1993, le système de recherche d'informations WWW a été développé, qui, en raison de sa facilité de navigation et d'accessibilité, a ouvert les sources d'information d'Internet à des utilisateurs non préparés. Le WWW a provoqué un boom Internet qui se poursuit à ce jour, et la quantité d'informations disponibles sur Internet double chaque année.

Le WWW repose sur le principe de l'hypertexte (déjà familier au lecteur), c'est-à-dire sur un système de documents reliés par des hyperliens. L'hypertexte est une manière spéciale de mettre en évidence des mots-clés à partir d'un texte ordinaire. Des liens hypertextes renvoient l'utilisateur vers d'autres documents sur le même serveur ou vers d'autres serveurs pouvant être situés n'importe où sur Internet. Si ce document texte est également hypertexte, alors ses liens permettent d'aller plus loin vers les documents correspondants. Chaque redirection se produit imperceptiblement pour l'utilisateur, afin qu'il puisse visualiser le contenu informationnel d'Internet de manière significative, sans se soucier d'adresser des ordinateurs spécifiques.

Avec le développement des applications multimédias, les documents initialement purement hypertextes deviennent de plus en plus hypermédias. Ainsi, les documents WWW peuvent exister dans n'importe quel format de données : texte, graphique, son/musique, ou clip vidéo. L'orientation et la navigation dans le World Wide Web se produisent à l'aide de programmes spéciaux appelés navigateurs WWW qui fournissent une interface utilisateur, tels que NetscapeNavigator ou MicrosoftInternetExplorer.

Le point de départ de la recherche d'informations est, en règle générale, la page principale (base, accueil) (site) de la ressource d'informations, accessible en saisissant l'adresse correspondante dans le navigateur (par exemple, http://ncpi .gov.by ou www.iparegistr.com). Les sites WWW sont créés et mis à jour par des entreprises ou des organisations spéciales qui publient des informations et surveillent le contenu de leurs pages WWW. L'utilisation du WWW n'est donc pas passive et chaque internaute, à l'aide de programmes d'édition hypertexte spéciaux, peut créer indépendamment ses propres pages WWW interactives. Cela a ouvert la voie à la commercialisation et à l'expansion croissantes d'Internet.

Actuellement, les informations nouvellement créées sont généralement produites en tenant compte de la nécessité de fournir un accès WWW, et les documents antérieurs sont progressivement convertis pour cela, mais dans le monde, il existe encore des millions de fichiers sous des formes autres que les exigences WWW. Pour l'utilisation de ces informations et via le WWW, les services Internet ci-dessus sont inclus dans les navigateurs qui y donnent accès (telnet, ftp, Archie, Gopher). Grâce au WWW, vous pouvez également utiliser d'autres services Internet destinés à la communication (eMail, NetNews). Par conséquent, le navigateur WWW est maintenant devenu un programme de communication universel pour Internet.

Avec l'avènement du service WWW, le boom d'Internet a commencé. Cet environnement facile à utiliser et convivial pour tous les services a suscité l'intérêt de nombreuses personnes et organisations sur Internet. Il s'est soudainement avéré que vous n'aviez pas besoin d'être un expert d'Internet pour utiliser les services du réseau. Cela peut être comparé au succès de Microsoft dans la sortie de Microsoft Windows en tant qu'interface utilisateur graphique. Avant l'apparition de Windows, chaque application DOS avait son propre manuel d'utilisation et nécessitait donc une étude distincte de chaque application.

2 MÉTHODES DE BASE POUR TROUVER DES INFORMATIONS SUR INTERNET

2.1 Exigences de base pour la recherche

Des exigences sont imposées aux résultats de la recherche pour l'exhaustivité de la couverture des ressources, la fiabilité des informations reçues, la dépense de temps minimale et la vitesse de recherche maximale.

L'exigence d'exhaustivité de la couverture des ressources n'a pas besoin d'explications supplémentaires, à l'exception de la nécessité d'utiliser des ressources non seulement du WWW pour les recherches, mais aussi d'autres services Internet.

La fiabilité de l'information, compte tenu de la nature d'Internet, devient une exigence extrêmement importante. L'évaluation de la fiabilité peut être réalisée à la fois par des méthodes traditionnelles (vérification de la légalité des publications sur papier, obtention d'informations sur les organisations et les auteurs, recherche de la validité de leurs ressources électroniques, etc.), et en utilisant les possibilités d'Internet (familiarisation avec d'autres sources d'information, rapprochement des éléments factuels, établissement de la fréquence de son utilisation par d'autres sources ; recherche du statut du document et de l'évaluation de la source au moyen de moteurs de recherche, obtention d'informations sur la compétence et le statut de l'auteur du matériel à l'aide de services de recherche Internet spéciaux ; analyse d'éléments individuels de l'organisation du site afin d'évaluer les qualifications des spécialistes qui le soutiennent, etc.).

Le temps de recherche, sans compter le temps passé sur les spécifications de connexion, dépend largement de la planification de la recherche et des compétences du professionnel de la recherche avec le type de ressource choisi. La planification de la recherche consiste à déterminer les services de recherche nécessaires pour résoudre une demande de recherche et l'ordre dans lequel ils sont appliqués. En outre, beaucoup dépend des compétences et de l'expérience de chaque spécialiste de la recherche.

Comme nous l'avons déjà indiqué, l'information sur Internet est disponible à partir de divers types de sources. Il s'agit tout d'abord de ressources WWW (système hypertexte, catalogues de ressources, moteurs de recherche). De plus, il est déjà connu du lecteur de courrier électronique, des robots de messagerie, de Usenet et d'autres groupes de discussion, ainsi que des systèmes ftp et des archives (utilisant Gopher et Veronica). WWW vous permet de rechercher les ressources requises en fonction de ses hyperpropriétés, c'est-à-dire que les moteurs de recherche existants fonctionnent à l'aide d'hyperliens en mode automatique, sans exclure la possibilité de navigation manuelle. Le WWW propose un certain nombre de services de recherche généraux et spécialisés.

LA CLOCHE

Il y a ceux qui ont lu cette nouvelle avant vous.
Abonnez-vous pour recevoir les derniers articles.
E-mail
Nom
Nom de famille
Comment voulez-vous lire La cloche
Pas de spam