La cloche.

Il y a ceux qui ont lu cette nouvelle devant vous.
Abonnez-vous pour recevoir des articles frais.
E-mail
Nom
Nom de famille
Comment voulez-vous lire la cloche
Sans spam

Des questions intelligence artificielle Et les réseaux de neurones deviennent actuellement populaires que jamais auparavant. Beaucoup d'utilisateurs sont de plus en plus et plus souvent interrogés sur la manière dont les réseaux de neurones fonctionnent, que représentent-ils et quel est le principe de leurs activités?

Ces problèmes associés à la popularité ont une difficulté considérable, car les processus sont des algorithmes d'apprentissage de machines complexes destinés à diverses fins, de l'analyse des modifications apportées aux risques de modélisation associés à certaines actions.

Qu'est-ce que les réseaux de neurones et leurs types?

La première question qui se pose de ceux intéressés, quel est le réseau neuronal? Dans la définition classique, il s'agit d'une certaine séquence de neurones, combinés à des synapses. Les réseaux de neurones sont un modèle simplifié d'analogues biologiques.

Un programme ayant une structure de réseau neuronal permet d'analyser les données d'entrée et de mémoriser le résultat obtenu à partir de certaines sources. Par la suite, une telle approche vous permet d'extraire le résultat de la mémoire correspondant au jeu de données actuel s'il a déjà été dans l'expérience des cycles réseau.

Beaucoup perçoivent le réseau neuronal comme analogue du cerveau humain. D'une part, ce jugement peut être considéré près de la vérité, mais, d'autre part, le cerveau humain est un mécanisme trop complexe afin qu'il soit possible de le recréer avec l'aide d'une voiture au moins un pourcentage. Le réseau neuronal est principalement un programme basé sur le principe de l'action cérébrale, mais pas son analogue.

Le réseau neuronal est un groupe de neurones, qui reçoit chacun des informations, le traite et transmet à un autre neurone. Chaque neurone traite complètement le signal.

Comment alors un résultat différent? Il s'agit de synapses qui connectent des neurones les uns avec les autres. Un neurone peut avoir une énorme quantité de synapses, renforcer ou affaiblir le signal, alors qu'ils ont une fonctionnalité pour modifier leurs caractéristiques au fil du temps.

Ce sont les paramètres de synapse correctement sélectionnés permettant d'obtenir le résultat correct de la conversion d'entrée.

Décider en termes généraux, qui est un réseau neuronal, il est possible de mettre en évidence les principaux types de leur classification. Avant de passer à la classification, vous devez entrer un raffinement. Chaque réseau a la première couche de neurones, appelée entrée.

Il ne remplit aucun calcul et transformations, sa tâche ne consiste qu'en un: prenez et distribuez des signaux d'entrée sur le reste des neurones. Il s'agit de la seule couche commune à tous les types de réseaux de neurones, leur autre structure est le critère de la division principale.

  • Réseau de neurones à couche unique. Il s'agit de la structure de l'interaction des neurones à laquelle, après avoir entré les données d'entrée, la première couche d'entrée est immédiatement transmise à la couche de résultat final. Dans le même temps, la première couche d'entrée n'est pas prise en compte, car elle n'effectue aucune action, à l'exception de la réception et de la distribution, cela a déjà été dit ci-dessus. Et la deuxième couche produit tous les calculs et traitement nécessaires et donne immédiatement le résultat final. Les neurones d'entrée sont combinés à la couche principale des synapses ayant un coefficient de poids différent, offrant des relations de qualité.
  • Réseau de neurones multicouches. Comme il ressort clairement de la définition, ce type de réseaux de neurones en plus des couches d'entrée et de sortie a également des couches intermédiaires. Leur quantité dépend du degré de complexité du réseau lui-même. Il ressemble plus de la structure du réseau neuronal biologique. Ces types de réseaux ont été développés tout à fait récemment, avant cela, tous les processus ont été mis en œuvre à l'aide de réseaux à une couche. Respectivement une telle solution Il a beaucoup plus d'opportunités que son ancêtre. Dans le processus de traitement des informations, chaque couche intermédiaire est une étape intermédiaire de traitement et de distribution d'informations.

Selon la direction de la distribution des informations sur les synapses d'un neurone à un autre, vous pouvez également classer les réseaux en deux catégories.

  • Le réseau de distribution directe ou unidirectionnel, c'est-à-dire la structure dans laquelle le signal se déplace strictement de la couche d'entrée à la sortie. Le mouvement du signal dans la direction opposée est impossible. De tels développements sont assez répandus et résolvèrent actuellement de telles tâches de reconnaissance, de prévisions ou de regroupement.
  • Réseaux avec commentaires ou récurrents. De tels réseaux permettent au signal de se déplacer non seulement en direct, mais dans la direction opposée. Que donne-t-il? Dans de tels réseaux, le résultat de la sortie peut revenir à l'entrée à ce sujet, la sortie de neurone est déterminée par le poids et les signaux de l'entrée et est complétée par des sorties précédentes renvoyées à l'entrée. Ces réseaux sont caractérisés par la fonction de mémoire à court terme, sur la base desquelles les signaux sont restaurés et complétés pendant le processus de traitement.

Ce ne sont pas les seules options pour la classification des réseaux.

Ils peuvent être divisés en homogènes et hybrides qui s'appuient sur les types de neurones constituant le réseau. Ainsi que sur hétérocastique ou autosociative, en fonction de la méthode de réseautage, avec un enseignant ou sans. Vous pouvez également classer les réseaux par leur destination.

Où les réseaux de neurones utilisent-ils?

Les réseaux de neurones sont utilisés pour résoudre une variété de tâches. Si nous considérons les tâches en fonction du degré de complexité, il convient de résoudre les tâches les plus simples programme d'ordinateurPlus que
termations complètes nécessitant une prédiction simple ou approximative d'équations, des programmes sont utilisés pour attirer des méthodes statistiques.

Mais les tâches de niveau encore plus complexe nécessitent une approche complètement différente. En particulier, cela fait référence à la reconnaissance des images, des discours ou des prévisions complexes. Dans la tête d'un homme, de tels processus se produisent inconsciemment, c'est-à-dire reconnaissant et mémorisant des images, une personne ne réalise pas comment ce processus se produit, et il ne peut donc pas le contrôler.

Ces tâches aident à résoudre les réseaux de neurones, c'est-à-dire qu'ils sont créés pour effectuer les processus dont les algorithmes sont inconnus.

Ainsi, les réseaux de neurones sont largement utilisés dans les domaines suivants:

  • reconnaissance, et cette direction est actuellement la plus large moyen;
  • prévision de la prochaine étape, cette fonctionnalité est applicable aux marchés des enchères et des billets;
  • la classification des données d'entrée par paramètres, une telle fonction est effectuée par des robots de crédit capables de décider de l'homologation du prêt à l'homme, s'appuyant sur l'ensemble d'entrées de différents paramètres.

Les capacités de réseau de neurones les rendent très populaires. Ils peuvent être beaucoup appris, tels que jouer à des jeux, reconnaître une certaine voix et ainsi de suite. Sur la base du fait que les réseaux artificiels reposent sur le principe des réseaux biologiques, ils peuvent être formés à tous les processus qu'une personne effectue inconsciemment.

Qu'est-ce que le neurone et les synapses?

Alors qu'est-ce que le neurone dans le contexte du réseau neuronal artificiel? Sous ce concept implique une unité qui effectue des calculs. Il reçoit des informations à partir de la couche d'entrée du réseau, effectue des calculs simples et le mange avec le neurone suivant.

Le réseau comprend trois types de neurones: entrée, cachée et sortie. Et si le réseau est une seule couche, il ne contient pas de neurones cachés. De plus, il existe un type d'unités qui portent les noms du neuron de déplacement et du neurone contextuel.

Chaque neurone a deux types de données: entrée et sortie. Dans ce cas, la première couche Les données d'entrée sont égales à la sortie. Dans d'autres cas, l'information totale des couches précédentes tombe sur l'entrée de neurones, puis il passe le processus de normalisation, c'est-à-dire que toutes les valeurs qui tombent de la plage souhaitée sont converties par la fonction d'activation.

Comme mentionné ci-dessus, Sinaps est une relation entre les neurones, chacun a son propre degré de poids. Cela est dû à cette fonctionnalité que les informations d'entrée sont modifiées pendant le processus de transmission. Dans le processus de traitement, les informations transmises par des synapses, avec un indicateur de poids important seront prédominants.

Il s'avère qu'aucun neurone n'affecte le résultat, à savoir les synapses qui donnent une certaine combinaison du poids des données d'entrée, car les neurones eux-mêmes effectuent chaque fois complètement les mêmes calculs.

Dans le même temps, les poids sont définis dans un ordre aléatoire.

Schéma du réseau neuronal

Pour présenter le principe de fonctionnement du réseau neuronal, des compétences spéciales sont nécessaires. Sur la couche d'entrée des neurones, il y a des informations. Il est transmis par des synapses à la couche suivante, avec chaque synapsage a son propre coefficient de poids et chaque neurone suivant peut avoir plusieurs synapses entrantes.

En conséquence, les informations obtenues par le neurone suivant constituent la somme de toutes les données multipliée par chacun à son coefficient de poids. La valeur résultante est substituée dans la fonction d'activation et les informations de sortie sont obtenues, qui est transmise jusqu'à atteindre la sortie finale. Le premier lancement du réseau ne donne pas de résultats corrects, car le réseau n'est pas encore formé.

La fonction d'activation est utilisée pour normaliser les données d'entrée. Il existe de nombreuses fonctions de ce type, mais vous pouvez mettre en évidence plusieurs basiques ayant le plus répandu. Leurs principales différences sont la gamme des valeurs dans lesquelles ils travaillent.

  • La fonction linéaire F (x) \u003d x, le plus simple de toutes possibles est utilisé uniquement pour tester le réseau de neurones créé ou le transfert de données dans sa forme d'origine.
  • Sigmoid est considéré comme la fonction d'activation la plus courante et a la forme F (x) \u003d 1/1 + ~ ×; Dans le même temps, sa gamme de valeurs de 0 à 1. Elle s'appelle également une fonction logistique.
  • Pour couvrir et les valeurs négatives, utilisez des tangentes hyperboliques. F (x) \u003d E² × - 1 / e² × + 1 - Ce type a cette fonction et la plage qu'il contient de -1 à 1. Si le réseau neuronal ne prévoit pas l'utilisation de valeurs négatives, alors ce n'est pas la peine d'utiliser.

Afin de définir les données réseau qu'il utilisera les sièges de formation nécessaires.

L'intégration est un compteur qui augmente avec chaque ensemble d'entraînement.

L'ERA est un indicateur de voyage de réseau neuronal, cet indicateur augmente chaque fois que le réseau passe le cycle d'un ensemble complet de réseaux de formation.

En conséquence, pour mener à bien la formation au réseau, il faut correctement pour effectuer des ensembles, augmentant régulièrement l'indicateur d'époque.

Dans le processus de formation, des erreurs seront détectées. Ceci est un indicateur de pourcentage de la différence entre le résultat obtenu et souhaité. Cet indicateur devrait diminuer dans le processus d'augmentation de l'indicateur d'ère, sinon quelque part une erreur de développeur.

Qu'est-ce qu'un neurone de déplacement et de quoi est-il nécessaire?

Dans les réseaux de neurones, il existe un autre type de neurones - Neurone de déplacement. Il diffère du type principal de neurones par le fait que son entrée et sa production dans tous les cas est égale à une. Dans ce cas, les synapses d'entrée n'ont pas de neurones.

L'emplacement de ces neurones se produit un par un sur la couche et plus, ils peuvent également être connectés à des synapses les uns avec les autres. Placer de tels neurones sur la couche de sortie ne sont pas appropriés.

De quoi sont-ils nécessaires? Il existe des situations dans lesquelles la neuropette ne peut tout simplement pas trouver la bonne décision en raison du fait que le point souhaité sera en dehors de la portée de la portée. C'est pour cela qui nécessite de tels neurones pour pouvoir déplacer la zone de définition.

C'est-à-dire que le poids de la synapse change le virage de la fonction de la fonction, tandis que le neurone de déplacement permet le décalage le long de l'axe de coordonnées, de sorte que le réseau neuronal ait pu capturer la zone inaccessible sans décalage. Dans ce cas, le décalage peut être effectué à droite et à gauche. Schématiquement, les neurones du quart ne sont généralement pas indiquées, leur poids est pris en compte par défaut lors du calcul de la valeur d'entrée.

De plus, les neurones de déplacement permettront le résultat dans le cas où tous les autres neurones donnent 0 en tant que paramètre de sortie. Dans ce cas, quel que soit le poids de la synapse pour chaque couche suivante, cette valeur sera transmise.

La présence d'un neurone de déplacement corrigera la situation et obtiendra un résultat différent. La faisabilité de l'utilisation de neurones de déplacement est déterminée en testant le réseau avec eux sans eux et en comparant les résultats.

Mais il est important de se rappeler qu'il ne suffit pas de créer un réseau de neurones pour obtenir des résultats. Il doit être formé, ce qui nécessite également approches spéciales Et a ses propres algorithmes. Ce processus est difficile à appeler simple, car sa mise en œuvre nécessite certaines connaissances et efforts.

De nouveaux types d'architecture de réseau neuronal apparaissent constamment et ils peuvent être confondus. Nous avons collecté pour vous une sorte de berceau, qui contient le plus espèces existantes Ins. Bien que tous soient présentés comme uniques, des images indiquent que beaucoup d'entre eux sont très similaires.

Le problème des graphiques dessinés est qu'ils ne montrent pas comment les réseaux pertinents sont utilisés dans la pratique. Par exemple, les clients de variation (Vae) examine tout comme des autocodeurs simples (AE), mais leurs processus d'apprentissage diffèrent de manière significative. Les cas d'utilisation diffèrent encore plus parce que VAE est un générateur qui a un nouveau bruit pour obtenir un nouvel échantillon. AE compare simplement les données obtenues avec l'échantillon le plus similaire obtenu lors de la formation.

Il convient de noter que bien que la plupart de ces abréviations soient généralement acceptées, il existe des exceptions. Sous RNN impliquant parfois un réseau de neurones récursif, mais ils signifient généralement récurrents. Vous pouvez également rencontrer souvent l'utilisation de l'abréviation de RNN en ce qui concerne personne NS récurrents. Les autocodeurs font également face à ce problème lorsque des conteneurs autonomes variationnels et anti-bruit (VAE, DAE) sont appelés simplement des auto-contenants (AE). De plus, de nombreuses abréviations diffèrent du nombre de lettres "N" à la fin, car dans certains cas, "réseau neuronal" est utilisé et dans un "réseau".

Pour chaque architecture, une très brève description sera donnée et un lien vers l'article, il est dédié à celui-ci. Si vous souhaitez vous familiariser rapidement avec des réseaux de neurones à partir de zéro, suivez la traduite par nous, composée de quatre étapes seulement.


Réseaux Netturaux Distribution directe
Réseaux de neurones en avant, FF ou FFNN) et perceptons (Perceptrons, P) Très simple, ils transmettent des informations de la saisie. Les réseaux de neurones sont souvent décrits comme un gâteau bouffé, où chaque couche consiste en des entrées, des cellules cachées ou de sortie. Les cellules de la même couche ne sont pas liées les unes aux autres et les couches voisines sont généralement complètement connectées. Le réseau neural le plus simple comporte deux cellules d'entrée et une sortie, et peut être utilisé comme modèle de vannes logiques. FFNN est généralement appris par la méthode de distribution d'erreur inverse dans laquelle le réseau reçoit de nombreuses données d'entrée et de sortie. Ce processus s'appelle une formation avec un enseignant et elle diffère de l'apprentissage sans enseignant dans celle du second cas, l'ensemble du réseau de production est indépendamment. L'erreur susmentionnée est la différence entre l'entrée et la sortie. Si le réseau a un nombre suffisant de neurones cachés, il est théoriquement capable de simuler l'interaction entre les données d'entrée et de sortie. Presque de tels réseaux sont rarement utilisés, mais ils sont souvent combinés à d'autres types pour en obtenir de nouveaux.

Réseau fonctions radialement de base (Fonction de base radiale, RBF) - Ceci est FFNN, qui utilise des fonctions de base radiale en tant que fonctions d'activation. Plus elle ne se démarque pas 🙂

NEUR NEALLIELD NETWORK (Réseau hopfield, hn) - Il s'agit d'un réseau neuronal complet avec une matrice symétrique de connexions. Au cours de la réception des données d'entrée, chaque nœud est entré, dans le processus d'apprentissage, il devient masqué, puis devient une sortie. Le réseau est formé comme ceci: les valeurs de neurones sont installées conformément au modèle souhaité, après quoi les poids sont calculés, qui ne sont pas modifiés à l'avenir. Une fois que le réseau s'est rendu dans un ou plusieurs modèles, il sera toujours réduit à l'un d'entre eux (mais pas toujours - à la volonté). Il se stabilise en fonction du réseau global de «énergie» et de «température». Chaque neurone a son propre seuil d'activation, en fonction de la température, pendant le passage de laquelle Neurone prend une des deux valeurs (généralement -1 ou 1, parfois 0 ou 1). Un tel réseau est souvent appelé réseau avec une mémoire associative; En tant que personne, voyant la moitié de la table, peut présenter la seconde moitié de la table et ce réseau recevant la table, la moitié du bruit, la restaure à la complète.

Chaînes Markov (Chaînes Markov, MC ou Time Discret Markov Chaînes, DTMC) - Ce sont des prédécesseurs des réseaux Boltzmann (BM) et Hopfield (HN). Leur signification peut être expliquée comme suit: Quelles sont mes chances d'entrer dans l'un des nœuds suivants, si je suis dans cela? Chaque état suivant ne dépend que de la précédente. Bien que la chaîne de Markov ne soit pas NS, ils sont très similaires. De plus, les chaînes de Markov ne sont pas nécessairement des connexions complètes.

Voiture Boltzmann (Machine Boltzmann, BM)il ressemble beaucoup au réseau de Hopfield, mais certains neurones sont marqués comme une entrée, et certains sont comme cachés. Les neurones d'entrée à l'avenir deviennent une sortie. La voiture Boltzmann est un réseau stochastique. La formation passe dans la méthode de la diffusion inverse d'une erreur ou d'un algorithme de divergence comparatif. En général, le processus d'apprentissage est très similaire au réseau Hopfield.

Voiture Boltzmann limitée (Machine Boltzmann restreinte, RBM)Étonnamment similaire à la voiture de Boltzmann et, par conséquent, sur le réseau Hopfield. La seule différence est ses limitations. De l'intérieur, les neurones du même type ne sont pas interconnectés. La voiture limitée de Boltzmann peut être formée comme FFNN, mais avec une nuance: au lieu d'une distribution directe de transfert de données et de retournement, vous devez d'abord transmettre les données dans le sens avant, puis dans le contraire. Après cela, la formation est formée par la méthode de distribution d'erreur directe et inverse.

Autocodeur (Autoencoder, AE) Quelque chose comme FFNN, comme c'est plutôt un autre moyen d'utiliser FFNN qu'une architecture fondamentalement différente. L'idée principale est la codage automatique (au sens de la compression, pas de cryptage). Le réseau lui-même ressemble au sablier, en informatique Caché Caché moins d'entrée et de sortie, et il est symétrique. Le réseau peut être formé à l'aide de la distribution d'erreurs inverse à l'aide de l'entrée et de la définition d'une erreur égale à la différence entre l'entrée et la sortie.

Carcodeur de craquage Autoencodeur clairsemé, SAE) - En un sens, le contraire de l'habituel. Au lieu d'enseigner au réseau pour afficher des informations dans un "volume" plus petit des nœuds, nous augmentons leur nombre. Au lieu de rétrécir le centre, le réseau est gonflé là-bas. Les réseaux de ce type sont utiles pour travailler avec un grand nombre de petites propriétés de jeu de données. Si vous enseignez au réseau comme un autocodeur ordinaire, rien d'utile ne sera pas libéré. Par conséquent, en plus des données d'entrée, un filtre de fracture spécial est également servi, ce qui ne manque que des erreurs définies.

Variations des autocodeurs(Variation Autoencoder, VAE) Ils ont semblable à l'architecture AE, mais ils les forment dans d'autres: l'approximation de la distribution probabiliste des échantillons d'entrée. En cela, ils sont originaires des voitures de Boltzmann. Néanmoins, ils s'appuient sur des mathématiques bayésiennes en ce qui concerne les conclusions et l'indépendance probabilistes, qui sont intuitives, mais sont complexes dans des implémentations. Si nous généralisons, nous pouvons donc dire que ce réseau prend en compte l'effet des neurones. Si quelque chose se passe au même endroit et que quelque chose d'autre est dans un autre, ces événements ne sont pas nécessairement liés, et cela devrait être pris en compte.

Autocodeurs d'annulation de bruit (Denoing Autoencoder, DAE) - Ceci est AE, dans lequel les données d'entrée sont servies dans un état d'itinérance. Nous calculons l'erreur de la même manière, et la sortie est comparée à bruyant. Grâce à cela, le réseau apprend à faire attention aux propriétés plus larges, car les petits peuvent changer avec du bruit.


Tapez "croyance profonde"
(Réseaux de croyances profonds, DBN) - Il s'agit du nom qui a reçu le type d'architecture dans lequel le réseau est composé de plusieurs RBM ou VAE connectés. De tels réseaux sont formés en bloc et chaque unité que vous n'avez besoin que de pouvoir encoder le précédent. Cette technique s'appelle «l'apprentissage gourmand», qui consiste à choisir des solutions optimales locales qui ne garantissent pas le résultat final optimal. En outre, le réseau peut être formé (par la méthode d'erreur inverse) Afficher les données sous la forme d'un modèle probabiliste. Si vous utilisez l'apprentissage sans enseignant, un modèle stable peut être utilisé pour générer de nouvelles données.


Réseaux de neurones complets
(Réseaux de neurones convolutifs, CNN) et des réseaux de neuronaux de culture approfondis (Réseaux de neurones convertiques profonds, DCNN)ils diffèrent très différents des autres types de réseaux. Habituellement, ils sont utilisés pour le traitement de l'image, moins souvent pour l'audio. Un moyen typique d'utiliser CNN est la classification des images: s'il y a un chat sur l'image, le réseau donnera un "chat" s'il y a un chien - "chien". Ces réseaux utilisent généralement le "scanner", et non une allure toutes les données à la fois. Par exemple, si vous avez une image de 200 × 200, vous ne traiterez pas immédiatement les 40 000 pixels. Au lieu de cela, ce réseau considère le carré de taille 20 x 20 (généralement de l'angle supérieur gauche), puis passe 1 pixel et considère un nouveau carré, etc. Ces entrées sont ensuite transmises à travers les couches de pliage dans lesquelles tous les nœuds ne sont pas interconnectés. Ces couches ont une propriété de compression avec une profondeur et des degrés fréquents sont souvent utilisés: 32, 16, 8, 4, 2, 1. Dans la pratique, une FFNN est attachée à la fin du CNN pour un autre traitement de données. Ces réseaux sont appelés profonds (DCNN).

Déploiement de réseaux de neurones (Réseaux déconvolués, DN)Également appelé les réseaux graphiques inverse sont inversés aux réseaux de neurones de la machine. Imaginez que vous transférez le mot "CAT" réseau, et génère des images avec des chats, semblables aux images réelles des chats. DNN peut également être combiné avec FFNN. Il convient de noter que, dans la plupart des cas, le réseau n'est pas transmis par une chaîne, mais quel vecteur binaire: par exemple,<0, 1> - C'est un chat,<1, 0> - chien, et<1, 1> - Et le chat, et le chien.

Ivan Biryukov, Chief News

Comme Yandex utilise vos données et votre apprentissage automatique pour personnaliser les services.

Commençons par le matériel de familiariser et de déterminer le concept même de système neuronal artificiel.

peut être considéré comme analogique complexe informatiquequi utilise des éléments de traitement de données simples, principalement connectés les uns aux autres en parallèle. Les éléments de traitement de données sont effectués par des opérations logiques ou arithmétiques très simples sur leurs données d'entrée. La base du fonctionnement d'un système neuronal artificiel est que les coefficients de poids sont associés à chaque élément d'un tel système. Ces coefficients de poids représentent les informations stockées dans le système.

Schéma de neurone artificiel typique

Neuron peut avoir beaucoup d'intrants, mais une seule issue. Le cerveau humain contient environ des neurones et chaque neurone peut avoir des milliers de connexions avec d'autres. Les signaux d'entrée de Neuron sont multipliés par des coefficients de poids et s'additionnent pour obtenir une entrée totale du neurone - JE.:
Figure. Fonction de neurone artificielle 1.Type qui lie une sortie de neurone avec ses entrées s'appelle la fonction d'activation. Il a une vue d'une fonction sigmoïde θ . La formalisation de la réaction de neurones est que le signal initial est envoyé à l'une des limites lors de l'obtention de très petits et très grands signaux d'entrée. De plus, la valeur seuil est connectée à chaque neurone θ qui dans la formule de calcul du signal de sortie est déduite du signal d'entrée total. En conséquence, le signal de sortie du Neuron-O est souvent décrit comme suit: la structure du réseau avec la distribution opposée "src \u003d" https://libtime.ru/uploads/Images/00/00/01/2014 / 06/27 / set-s- obtentnym-rasprostraneniyem.png "alt \u003d" (! Lang: structure réseau avec distribution inversée" width="450" height="370"> Рис. 2. Сеть с обратным распространением !} Sens inverseEn règle générale, il est divisé en trois segments, bien que des segments supplémentaires puissent également être formés. Segments (segment) qui sont entre les segments d'entrée et de sortie sont appelés segments cachés, car le monde extérieur ne perçoit que les segments d'entrée et de sortie. Le réseau qui calcule la valeur de l'opération logique "à l'exclusion ou", il donne une valeur réelle à la sortie, uniquement dans les cas où il existe de véritables valeurs de toutes ses entrées ou non à toutes les entrées sont des valeurs erronées. Le nombre de nœuds dans le secteur caché peut varier en fonction de l'objectif du projet.

Caractéristiques des réseaux de neurones

Il convient de noter que les réseaux de neurones ne nécessitent pas de programmation dans le sens habituel du terme. Pour la mise en réseau des neurones, des algorithmes spéciaux pour l'enseignement des réseaux de neurones sont utilisés, tels que la répartition contre la compréparation et la distribution inverse. Le programmateur "Programms" Le réseau en définissant les données d'entrée et la sortie correspondante. Le réseau apprend, ajustant automatiquement les coefficients de poids pour les connexions synaptiques entre les neurones. Peser des coefficients, avec seuils Neurones, déterminez la nature de la distribution des données sur le réseau et définissez ainsi la réponse correcte aux données utilisées dans le processus d'apprentissage. La formation réseau afin d'obtenir les bonnes réponses peut nécessiter beaucoup de temps. Combien dépend de combien d'images devraient être apprises lors de la formation du réseau, ainsi que sur les capacités du matériel appliqué et des auxiliaires logiciel. Cependant, sur son achèvement de la formation, le réseau est capable de donner des réponses à grande vitesse. Selon architecture Système neuronal artificiel Diffère d'autres systèmes informatiques. Le système d'information classique implémente la possibilité de connecter des informations discrètes avec des éléments de mémoire. Par exemple, généralement système d'Information Enregistre des données sur un objet spécifique dans un groupe d'éléments de mémoire adjacents. Par conséquent, la possibilité d'accès et de manipulation de données est obtenue en créant une communication mutuellement sans ambiguïté entre les attributs d'objet et l'adresse des cellules de mémoire dans lesquelles elles sont enregistrées. Contrairement à de tels systèmes, des modèles de systèmes neuronaux artificiels sont développés sur la base de théories modernes du fonctionnement du cerveau, selon lesquelles les informations sont présentées dans le cerveau à l'aide de coefficients de poids. Dans ce cas, la corrélation directe entre la valeur spécifique du coefficient de poids et l'élément spécifique des informations sauvegardées n'existe pas. Une telle présentation distribuée d'informations est similaire à la technologie de préservation et de présentation d'images, utilisée dans les hologrammes. Selon cette technologie, la ligne d'hologramme sert de lignes de diffraction. Avec leur aide, lorsque le faisceau laser passe, l'image sauvegardée est jouée, cependant, les données elles-mêmes ne sont pas interprétées directement.
Réseau neuronal comme moyen de résoudre le problème. Réseau neuronal Il agit comme un moyen acceptable de résoudre le problème lorsqu'il existe un grand nombre de données empiriques, mais il n'y a pas d'algorithme qui serait capable d'assurer une solution suffisamment précise avec la vitesse nécessaire. Dans ce contexte, la technologie de présentation des données du système neuronal artificiel présente des avantages importants par rapport à d'autres informatique. Celles-ci avantages Il peut être formulé comme suit:
  1. La mémoire du réseau neuronal est tolérante de panne. Lors de l'élimination des parties individuelles du réseau neuronal, seule une diminution de la qualité de l'information se produit, elle est préservée, mais elle n'est pas complètement disparue. En effet, les informations sont stockées sous une forme distribuée.
  2. La qualité des informations dans le réseau de neurones soumises à la réduction est réduite progressivement, proportionnellement à cette partie du réseau, a été supprimée. La perte catastrophique d'informations ne se produit pas.
  3. Les données du réseau neuronal sont stockées naturellement avec une mémoire associative. La mémoire associative est appelée une telle mémoire dans laquelle il suffit de rechercher des données partiellement représentées pour restaurer pleinement toutes les informations. C'est la différence entre la mémoire associative de mémoire ordinaireoù l'obtention de données est effectuée en spécifiant l'adresse exacte des éléments de mémoire correspondants.
  4. Vous permet d'effectuer une extrapolation et une interpolation en fonction des informations stockées dans elles. C'est-à-dire que l'apprentissage vous permet de donner un réseau de capacité à rechercher des fonctionnalités importantes ou des liens de données. Après cela, le réseau est capable d'extrapoler et de détecter des liens vers de nouvelles données, ce qui l'arrive. Par exemple, dans une expérience, un réseau de neurones a été formé sur un exemple hypothétique. Après avoir obtenu son diplôme, le réseau a gagné la capacité de répondre correctement aux questions pour lesquelles la formation n'a pas été menée.
  5. Les réseaux de neurones sont en plastique. Même après la suppression d'un certain nombre de neurones, le réseau peut être retourné à son niveau primaire (bien sûr, si un nombre suffisant de neurones restait). Une telle caractéristique est également caractéristique d'un cerveau humain dans lequel des pièces individuelles peuvent être endommagées, mais au fil du temps, avec l'aide de l'apprentissage, le niveau primaire des compétences et des connaissances ont été atteints.
Grâce à de telles particularités, les systèmes neuronaux artificiels deviennent très attractifs pour une utilisation dans robotique vaisseau spatial, équipement de l'industrie pétrolière, dispositifs sous-marins, outils de gestion des processus technologiques et autres dispositifs techniques Cela doit fonctionner pendant une longue période sans réparation dans un environnement défavorable. Les systèmes neuronaux artificiels permettent non seulement de résoudre le problème de la fiabilité, mais offrent également la capacité de réduire les coûts d'exploitation en raison de leur plasticité. Cependant, en général, les systèmes neuronaux artificiels ne sont pas très bien adaptés pour créer des applications dans lesquelles des calculs mathématiques complexes sont nécessaires ou recherchent. solution optimale. En outre, l'utilisation d'un système neuronal artificiel ne sera pas la meilleure option En cas de solution algorithmique qui a déjà obtenu un résultat positif en raison de application pratique Résoudre ces tâches. Article similaire:

LES RÉSEAUX DE NEURONES Artificial, multicouche haut parallèle (c'est-à-dire avec un grand nombre, des éléments de travail indépendamment parallèles) des structures logiques composées de neurones formels. Le début de la théorie des réseaux de neurones et neuroocutes Mettez le travail des neurophysiologistes américains W. Calloca Mac et U. pitts "le calcul logique des idées liées à l'activité nerveuse" (1943) dans laquelle ils ont proposé modèle mathématique Neuron biologique. Parmi les travaux fondamentaux devraient être alloués par le modèle D. Habba, qui a proposé en 1949 la loi de la formation, qui constituait un point de départ pour des algorithmes d'apprentissage des réseaux de neurones artificiels. Sur le développement ultérieur de la théorie du réseau neuronal, la monographie du neurophysiologiste américain F. Rosenblatt «Les principes de neurodynamiques», dans lesquels il décrivait en détail le schéma de Perceptron (dispositif simulant le processus de perception de l'information par le cerveau humain ). Ses idées ont été développées dans les œuvres scientifiques de nombreux auteurs. En 1985-1986 La théorie des réseaux de neurones a reçu une «impulsion technologique», causée par la possibilité de modéliser les réseaux de neurones sur les accessibles disponibles et les performances. ordinateur personnel . La théorie du réseau neuronal continue de se développer activement au début du XXIe siècle. Selon des experts, une croissance technologique importante de la conception des réseaux de neurones et des neurotiques est attendue dans un proche avenir. Ces dernières années, de nombreuses nouvelles caractéristiques des réseaux de neurones ont déjà été ouvertes et que les travaux dans ce domaine apportent une contribution importante à l'industrie, à la science et à la technologie, ont une grande importance économique.

Les principales directions d'utilisation des réseaux de neurones

Les applications potentielles des réseaux de neurones artificiels sont celles où l'intelligence humaine est inefficace et des calculs matériels traditionnels ou sont physiquement insuffisants (c'est-à-dire qu'ils ne reflètent pas ou reflètent mal les processus et objets physiques réels). La pertinence de l'utilisation de réseaux de neurones (c'est-à-dire des neuroocomptes) augmente plusieurs fois lorsque la nécessité de résoudre apparaît mauvaises tâches formaliséesh. Domaines d'utilisation de base des réseaux de neurones: Automatisation du processus de classification, Automatisation de prédiction, Automatisation du processus de reconnaissance, Automatisation du processus décisionnel; gestion, codage et décodage de l'information; Approximation des dépendances, etc.

À l'aide de réseaux de neurones, une tâche importante sur le terrain est résolue avec succès. télécommunications - Conception et optimisation des réseaux de communication (trouver le chemin de voie optimal entre les nœuds). En plus de contrôler le routage des flux, des réseaux de neurones sont utilisés pour obtenir des solutions efficaces dans la conception de nouveaux réseaux de télécommunication.

Reconnaissance de la parole - L'un des domaines les plus populaires des réseaux de neurones.

Une autre zone - prix \u200b\u200bet production (Les pertes de la planification de la production non optimale sont souvent sous-estimées). Étant donné que la demande et les conditions de la vente de produits dépendent de l'heure, de la saison, des taux de change et de nombreux autres facteurs, le volume de production devrait varier de manière flexible à des fins d'utilisation optimale des ressources (le système de réseau neuronal détecte des dépendances complexes entre la publicité. Coûts, volumes de vente, prix, prix des concurrents, jour de la semaine, saison, etc.). À la suite de l'utilisation du système, la stratégie optimale de production est choisie parmi le point de vue de la facture de vente ou des bénéfices.

Pour analyse du marché des consommateurs (Marketing) Lorsque des méthodes ordinaires (classiques) de prévision de la réponse des consommateurs peuvent ne pas être suffisamment précises, le système de réseau de neurones prédictif est utilisé avec l'architecture de neuroaluulateur adaptative.

Demande de recherche Vous permet de préserver les affaires de la société dans le contexte de la concurrence, c'est-à-dire de maintenir un contact constant avec les consommateurs par le biais de "commentaires". Les grandes entreprises mènent des enquêtes à la consommation pour savoir quels facteurs sont décisifs pour eux lors de l'achat de ce produit ou de ce service, pourquoi, dans certains cas, la préférence est donnée aux concurrents et que les biens de biens aimeraient voir à l'avenir. L'analyse des résultats d'une telle enquête est une tâche assez difficile, car il existe un grand nombre de paramètres corrélés. Le système de réseau de neurones vous permet d'identifier des dépendances complexes entre les facteurs de la demande, de prédire le comportement des consommateurs lors de l'évolution des politiques de marketing, de trouver les facteurs les plus importants et des stratégies de publicité optimales, ainsi que de décrire le segment des consommateurs, le plus prometteur pour ce produit. .

DANS diagnostic médical Les réseaux de neurones sont utilisés, par exemple, pour diagnostiquer l'audience chez les nourrissons. Le système de diagnostic objectif traite les "potentiels causés" (réponses cérébrales), manifestés sous la forme de rafales de l'électroencéphalogramme, en réponse au stimulus sonore, synthétisé au cours du processus d'enquête. Habituellement, pour le diagnostic confiant de l'audience d'un enfant, un audiologiste expert expérimenté doit être organisé jusqu'à 2000 tests, ce qui prend environ une heure. Le système basé sur un réseau neuronal est capable de déterminer le niveau d'audition pour 200 observations en quelques minutes et sans la participation de personnel qualifié.

Les réseaux de neurones s'appliquent également aux prévisions tendances à court et à long terme Dans divers domaines (financier, économique, bancaire, etc.).

Structure des réseaux de neurones

Le système nerveux et le cerveau humain sont constitués de neurones reliés par des fibres nerveuses. Les fibres nerveuses sont capables de transmettre des impulsions électriques entre les neurones. Tous les processus consistant à transmettre des irritations de notre peau, de nos oreilles et des yeux au cerveau, des processus de pensée et de contrôle des actions - tout cela est mis en œuvre dans un organisme vivant comme transmission d'impulsions électriques entre les neurones.

Neurone biologique(Cellule) a un noyau (noyau), ainsi que les procédés de fibres nerveuses de deux types (fig. 1) - Dendrites (Dendrites), pour lesquels des impulsions sont acceptées (transporte des signaux) et le seul axon (AXON) , dans lequel le neurone peut transmettre l'impulsion (transporte des signaux). Akson les contacts Dendrites d'autres neurones à travers une éducation spéciale - Synapses (synapses) qui affectent la puissance de l'impulsion transmise. La structure constituée d'une population d'un grand nombre de neurones de ce type était le nom d'un réseau neural biologique (ou naturel).

Apparence neurone formel en grande partie à cause de l'étude des neurones biologiques. Le neurone formel (ci-après - neurone) est la base de tout réseau neuronal artificiel. Les neurones sont des éléments relativement simples et à un seul type qui imitent le fonctionnement des neurones du cerveau. Chaque neurone est caractérisé par son état actuel par analogie avec des cellules nerveuses cérébrales pouvant être excitées et injectées. Neureur artificiel, ainsi que son prototype naturel, dispose d'un groupe de synapses (entrées), qui sont connectés aux sorties d'autres neurones, ainsi qu'Axon - la connexion de sortie de ce neurone, d'où le signal de l'excitation ou de la freinage vient aux synapses d'autres neurones.

Le neurone formel est un élément logique avec des entrées $ N $ (N + 1 $) en poids de coefficients de poids, d'additionneur et de convertisseur non linéaire. Le neurone formel le plus simple effectuant une transformation logique $ Y \u003d \\ texte (signe) \\ sum_ (i \u003d 0) ^ (n) a_ix_i $ Les signaux d'entrée (qui, par exemple, sont les signaux de sortie des autres. Neurones formels N. avec.) Dans le signal de sortie, représenté sur la Fig. une.

Ici $ y $ est la valeur de la sortie du neurone formel; $ a_i $ - coefficients de poids; $ x_i $ - Valeurs d'entrée du neurone formel ($ x_i∈ \\ gaucher \\ (0,1 \\ droite \\), \\; x_0 \u003d 1 $). Le processus de calcul de la valeur de sortie du neurone formel est le flux de flux de données et leur conversion. Premièrement, les données sont transférées sur l'unité d'entrée de neurones formelle, où les données initiales se multiplient sur les coefficients de poids correspondants, etc. N. poids synoptiques (conformément aux synapses de neurones biologiques). Le coefficient de poids est une mesure qui détermine la quantité de valeur d'entrée correspondante affecte l'état du neurone formel. Les coefficients de pondération peuvent varier en fonction des exemples de formation, de l'architecture N. Architecture, des règles d'apprentissage, etc. Les valeurs obtenues sont converties en additionneur en une valeur numérique de $ G $ (en résumé). Ensuite, pour déterminer la sortie d'un neurone formel dans un bloc de conversion non linéaire (mise en oeuvre d'un rapport d'engrenage) $ G $ par rapport à un nombre (seuil). Si la somme est supérieure à la valeur seuil, le neurone formel génère un signal, sinon le signal sera nul ou freinage. Dans ce neurone formel, une conversion non linéaire est appliquée $$ \\ texte (signe) (g) \u003d \\ begin (cas) 0, \\; G.< 0 \\ 1,\; g ⩾ 0 \end{cases},\quad \text{где}\,\,g = \sum_{i=0}^N a_i x_i.$$

Le choix de la structure du réseau neuronal est effectué conformément aux caractéristiques et à la complexité de la tâche. Théoriquement, le nombre de couches et le nombre de neurones dans chaque couche du réseau de neurones peuvent être arbitraires, mais il est en fait limité par les ressources informatiques ou une puce spécialisée, généralement mise en œuvre par un réseau neuronal. Dans ce cas, si la fonction d'un seul saut est utilisée comme fonction d'activation pour tous les neurones du réseau, le réseau de neurones est appelé. persheppono multicouchem.

En figue. 3 spectacles régime général Réseau de neurones multicouches avec des connexions successives. Le parallélisme élevé est obtenu en combinant un grand nombre de neurones formels dans des couches et des composés d'une certaine manière de divers neurones par eux-mêmes.

Dans le cas général, la réticulation et les commentaires avec des coefficients de poids personnalisables peuvent être introduits dans cette structure (Fig. 4).

Les réseaux de neurones sont des systèmes non linéaires complexes avec un grand nombre de degrés de liberté. Le principe par lequel ils traitent des informations diffère du principe utilisé dans les ordinateurs basés sur des processeurs avec une architecture de fond-Neumanov - avec une base logique et, ou non (voir J. fond J. Neuman, Machine à calculer). Au lieu de la programmation classique (comme dans le traditionnel systèmes informatiques) La formation au réseau neuronal est appliquée, ce qui est réduit, en règle générale, de définir les coefficients de poids afin d'optimiser le critère spécifié de la qualité du réseau neuronal.

Algorithmes de réseau de neurones

L'algorithme de réseau de neurones pour la résolution de problèmes est appelée procédure de calcul, entièrement ou pour la plupart mise en œuvre sous la forme d'un réseau neuronal d'une structure particulière (par exemple, un réseau neuronal multicouche avec des liaisons séquentielles ou croisées entre les couches de neurones formels ) Avec l'algorithme correspondant des coefficients de pondération. La base du développement d'un algorithme de réseau neuronal est une approche systématique dans laquelle le processus de résolution du problème est représenté comme fonctionner à temps d'un certain système dynamique. Pour le construire, il est nécessaire de déterminer: un objet agissant comme un signal d'entrée du réseau neuronal; L'objet agissant comme signal de sortie du réseau neuronal (par exemple, directement la solution ou une partie de sa caractéristique); le signal de sortie souhaité (requis) du réseau neuronal; Structure du réseau neuronal (nombre de couches, liens entre couches, objets qui servent de coefficients de poids); Fonction d'erreur système (caractérisant la déviation du signal de sortie souhaité du réseau neuronal à partir du signal de sortie réel); Critère pour la qualité du système et la fonctionnalité de son optimisation, en fonction de l'erreur; La valeur des coefficients de poids (par exemple, déterminée par analytiquement directement à partir du réglage du problème, à l'aide de méthodes numériques ou de procédures de mise en place des coefficients de pondération du réseau neuronal).

Le nombre et le type de neurones formels dans les couches, ainsi que le nombre de neurones couches sont sélectionnés en fonction des spécificités des tâches et de la qualité de la solution souhaitée. Le réseau neuronal en cours de réglage sur la solution d'un problème particulier est considéré comme un système non linéaire multidimensionnel, qui dans le mode itératif cherche délibérément l'optimum de certains fonctionnels, quantifiant la qualité de la résolution de la tâche. Pour les réseaux de neurones, en tant qu'objets de commande non linéaires multidimensionnels, des algorithmes pour la mise en place d'un ensemble de coefficients de poids sont formés. Les principales étapes de l'étude du réseau neuronal et de la construction des algorithmes du réglage (adaptation) de leurs coefficients de poids comprennent: l'étude des caractéristiques du signal d'entrée pour divers modes du réseau neuronal (signal d'entrée du réseau de neurones est, En règle générale, les informations d'entrée et l'indication du soi-disant «enseignant I» du réseau neuronal); Le choix des critères d'optimisation (avec un modèle probabiliste du monde extérieur, de tels critères peuvent être minimisés de la fonction de risque moyen, le maximum de probabilité postérioriori, notamment avec des restrictions sur les composants individuels de la fonction de risque moyen); Développement d'un algorithme de recherche des fonctionnalités d'optimisation des extrémaux (par exemple, de mettre en œuvre les algorithmes de recherche pour les extremums locaux et mondiaux); construire des algorithmes pour adapter les coefficients du réseau neuronal; Analyse de la fiabilité et des méthodes de diagnostic d'un réseau de neurones, etc.

Il convient de noter que l'introduction de la rétroaction et, par conséquent, le développement d'algorithmes pour définir leurs coefficients en 1960-1980 avait une signification purement théorique, car il n'y avait aucune tâche pratique suffisante pour ces structures. Seulement à la fin des années 1980 - Le début des années 90 a commencé à apparaître de tels problèmes et les structures les plus simples avec des commentaires personnalisables pour les résoudre (les réseaux de neurones récurrents). Les développeurs dans le domaine des technologies du réseau de neurones ont été engagés non seulement en créant des algorithmes pour la mise en place de réseaux de neurones multicouches et d'algorithmes de réseau de neurones pour résoudre diverses tâches, mais également la plus efficace (au développement actuel de la technologie électronique) des émulateurs matériels (programmes spéciaux qui sont des programmes spéciaux destiné à lancer un système dans la coque d'un autre) algorithmes de réseau neuronal. Dans les années 1960, avant l'apparition d'un microprocesseur, les émulateurs les plus efficaces des réseaux de neurones avaient une mise en œuvre analogique des réseaux de neurones ouverts avec des algorithmes de configuration développés sur des ordinateurs universels (parfois des systèmes d'éléments adaptatifs avec une mémoire analogique). Un tel niveau de développement électronique était pertinent pour l'introduction de liaisons croisées dans la structure des réseaux de neurones. Cela a entraîné une diminution significative du nombre de neurones du réseau neuronal tout en maintenant la qualité de la résolution de problèmes (par exemple, une capacité discriminante lors de la résolution des tâches de reconnaissance d'image). Des études sur les années 1960-1970 dans le domaine de l'optimisation des structures de réseaux de neurones avec des liaisons croisées trouveront certainement développement dans la mise en œuvre sYSTÈMES NEURAL DE MEMRISTOR [Mémist (mémoire - mémoire - mémoire et résistance - résistance électrique), l'élément passif de la microélectronique capable de modifier sa résistance en fonction de la charge qui l'entoure], en tenant compte de leurs spécificités en termes de traitement analogique-numérique des informations et d'un nombre très important de coefficients personnalisables. Les exigences spécifiques des tâches d'application ont été déterminées par certaines caractéristiques des structures de réseaux de neurones à l'aide des algorithmes de configuration: le continuum (de la lat. Le continuum est un nombre continu, solide) de classes, lorsque les instructions du «enseignant» du système sont des instructions du système. formé comme une valeur de fonction continue dans une certaine plage de modifications; Solutions de continuum d'un réseau de neurones multicouches générées par le choix de la fonction continue de l'activation du neurone de la dernière couche; Le continuum du nombre de fonctionnalités générées par la transition dans l'espace caractéristique de représentant le signal de sortie sous la forme d'un vecteur de chiffres de N $ N $ de nombres réels à une fonction réelle dans une certaine variation de l'argument; Le continuum du nombre de panneaux, en conséquence, nécessite une implémentation logicielle et matérielle spécifique du réseau neuronal; L'option des signes de continuum de l'espace d'entrée a été mise en œuvre dans le problème de la reconnaissance des signaux périodiques sans la convertir en utilisant convertisseur analogique-numérique (ADC) à l'entrée du système et la mise en place d'un réseau neuronal multicouche analogique à numérique; Nombre continu de neurones dans la couche; La mise en œuvre de réseaux de neurones multicouches avec le continuum de classes et de solutions est réalisée en choisissant les types de fonctions correspondants d'activation des neurones de la dernière couche.

Le tableau présente un ensemble systématique de variantes d'algorithmes pour la mise en place de réseaux de neurones multicouches dans l'espace "Signal d'entrée". De nombreuses variantes des caractéristiques des signaux d'entrée et de sortie des réseaux de neurones sont présentées pour lesquelles les algorithmes de définition des coefficients développés par l'école scientifique russe en 1960-1970 sont présentés. Le signal à l'entrée du réseau neuronal est décrit par le nombre de classes (gradations) d'images représentant les instructions de "enseignant". Le signal de sortie du réseau neuronal est une description quantitative des solutions. La table reçoit une classification des variantes du fonctionnement des réseaux de neurones pour différents types de signaux d'entrée (2 classes, $ K $ Classes, consolidation de classes) et diverses options permettant de quantifier l'espace des solutions (2 décisions, $ K_P $ Solutions, Solutions de continuum). Numéros 1, 7, 8 Options spécifiques présentes pour le fonctionnement des réseaux de neurones.

Tableau. Ensemble d'options pour définir des algorithmes

Solutions d'espace (nombre)

Signal d'entrée

Classe 2$ K $ classesCours de continuum
2 1 7 8
$ K_p $$ K_p \u003d 3 $3a.$ K \\ lt k_p $9 10
$ K \u003d k_p $ $2
$ K_p \u003d \\ text (const) $3b$ K \\ gt k_p $4
Continuité5 6 11

Les principaux avantages des réseaux de neurones comme base logique des algorithmes pour la résolution de tâches complexes sont les suivants: Invariance (inchangée, indépendance) des méthodes de synthèse des réseaux de neurones sur la dimension des signes de signes; La possibilité de sélectionner la structure des réseaux neuronaux dans une gamme significative de paramètres, en fonction de la complexité et des spécificités du problème résolu afin d'atteindre la qualité de la solution souhaitée; adéquation des technologies actuelles et prospectives de la microélectronique; La tolérance à la défaillance dans le sens de celui-ci est petite, et non un changement catastrophique de la qualité de la résolution du problème, en fonction du nombre d'éléments échoués.

Réseaux de neurones - Vue privée de l'objet de contrôle dans le système adaptatif

Les réseaux de neurones étaient dans la théorie de la direction L'un des premiers exemples de la transition du contrôle des systèmes stationnaires linéaires les plus simples permettant de contrôler des systèmes complexes non linéaires, non stationnaires, multidimensionnels et multi-communications. Dans la seconde moitié des années 1960, la méthodologie de la synthèse des réseaux de neurones est née, qui s'est développée et a été appliquée avec succès au cours des cinq cinquante dernières années. Structure générale Cette technique est présentée à la Fig. cinq.

Signaux d'entrée de réseau neuronal

Un modèle probabiliste du monde environnant est la base des technologies de réseau de neurones. Un modèle similaire est la base de statistiques mathématiques. Les réseaux de neurones ont eu lieu à la fois lorsque des expérimentateurs utilisant des méthodes de statistiques mathématiques ont été posées: "Et pourquoi devrions-nous décrire les fonctions de la distribution des signaux aléatoires de saisie sous la forme d'expressions analytiques spécifiques (distribution normale, distribution de Poisson, etc.) ? S'il est correct et qu'il existe une sorte de raison physique à ce sujet, la tâche de traiter des signaux aléatoires devient assez simple. "

Les spécialistes des technologies du réseau neuronal ont déclaré: «Nous ne savons rien sur la fonction de distribution des signaux d'entrée, nous refusons de décrire formellement la fonction de distribution des signaux d'entrée, même si nous suzim de la classe des tâches résolues. Nous considérons que les fonctions de la distribution des signaux d'entrée complexes, inconnues et nous résoudrons des tâches privées spécifiques de la même manière. une incertitude priori (c'est-à-dire incomplet de la description; il n'y a aucune information et sur les résultats possibles). " C'est pourquoi les réseaux de neurones au début des années 1960 ont été utilisés efficacement dans la résolution des tâches de reconnaissance des images. De plus, la tâche de reconnaissance des images a été traitée comme une tâche d'approximation d'une fonction aléatoire multidimensionnelle recevant des valeurs $ K $ K $, où $ K $ est le nombre d'images d'images.

Voici quelques modes de fonctionnement de réseaux de neurones multicouches, déterminés par les caractéristiques des signaux d'entrée aléatoires, pour lesquels, à la fin des années 1960, des algorithmes pour la définition des coefficients ont été développés.

Former des réseaux de neurones

Il est évident que le fonctionnement du réseau neuronal, c'est-à-dire que les actions qu'il est capable d'effectuer dépendent de la magnitude des connexions synoptiques. Par conséquent, en fixant la structure du réseau neuronal qui répond à une certaine tâche, le développeur doit trouver des valeurs optimales pour tous les coefficients de poids $ W $. Cette étape s'appelle l'enseignement du réseau de neurones et sur la manière dont il sera qualitativement complété, la capacité du réseau à décider pendant le fonctionnement du problème. Les paramètres d'apprentissage les plus importants sont les suivants: la qualité de la sélection des coefficients de poids et le temps nécessaire à être formé. En règle générale, les deux de ces paramètres sont liés à la dépendance inverse et doivent être choisis sur la base d'un compromis. Actuellement, tous les algorithmes d'enseignement des réseaux de neurones peuvent être divisés en deux grandes classes: "avec l'enseignant" et "sans enseignant".

Une probabilité priori des cours

Avec toute l'insuffisance d'une information a priori sur les fonctions de la distribution des signaux d'entrée, ignorer certaines informations utiles peut entraîner une perte de la qualité de la résolution du problème. Cela concerne principalement les probabilités a priori de l'apparition de classes. Des algorithmes ont été développés pour la mise en place de réseaux de neurones multicouches, en tenant compte des informations disponibles sur une probabilité de classes priori. Cela se déroule dans de telles tâches que de reconnaître des lettres dans le texte lorsque de cette langue La probabilité d'apparition de chaque lettre est connue et cette information doit être utilisée lors de la construction d'un algorithme pour définir les coefficients du réseau neuronal multicouche.

Qualifications "enseignants"

Le réseau neuronal est imposé des valeurs des paramètres d'entrée et de sortie, et ajuste les poids de ses liens synaptiques par un algorithme interne. L'entraînement "avec enseignant" suggère que pour chaque vecteur d'entrée, il existe un vecteur cible représentant la sortie requise. En général, les qualifications de "enseignant" peuvent être différentes pour diverses catégories d'images. Ensemble ils sont appelés représentant ou alors sélection de formatione. Habituellement, le réseau de neurones est formé à un certain nombre d'échantillons. Le vecteur de sortie est présenté, la sortie du réseau neuronal est calculée et comparée à la cible correspondante, la différence (erreur) est calculée à l'aide de rétroaction Il est servi dans le réseau de neurones et pèse le changement conformément à l'algorithme, cherchant à minimiser l'erreur. Les vecteurs d'éducation sont présentés de manière séquentielle, des erreurs et des poids sont calculés pour chaque vecteur jusqu'à ce qu'une erreur dans l'ensemble de la matrice d'entraînement atteigne un niveau inférieur acceptable.

Dans les tâches de reconnaissance des images, en règle générale, par défaut, les qualifications du "enseignant" sont complètes, c'est-à-dire La probabilité de la bonne attribution au «enseignant» d'images à une ou plusieurs catégories est une. En pratique, en présence de mesures indirectes, cela n'est souvent pas vrai, par exemple, dans les tâches de diagnostic médical, lorsque la vérification (vérification) de l'archive des données médicales destinées à la formation, la probabilité d'attribuer ces données à une ou une autre maladie n'est pas égal à un. L'introduction du concept de qualification "enseignant" a permis de développer des algorithmes uniformes pour définir les coefficients de réseaux de neurones multicouches pour les modes de formation, l'apprentissage "avec enseignant", qui possède les qualifications finales et l'auto-étude (regroupement), Lorsque, en présence de $ K $ ou de deux qualifications de classe de l'enseignant (enseignants ', la probabilité d'attribuer des images à une classe ou à une autre classe) est $ \\ frac (1) (k) $ ou 1/2. L'introduction du concept de qualifications de "enseignant" dans les systèmes de reconnaissance des images permettait de considérer vitreusement théoriquement les modes "croix" du système lorsqu'il serait faux (à degrés divers) attribuant des images à une ou à une autre classe . Ce mode de réglage des coefficients du réseau de neurones multicouches n'a pas encore trouvé d'application pratique.

Clustering

La clusterisation (auto-étude, formation "sans enseignant") est un mode de fonctionnement privé de réseaux de neurones multicouches, lorsque le système ne signale pas d'informations sur l'appartenance des échantillons à une classe particulière. Le réseau neuronal n'est présenté que des signaux d'entrée et des sorties réseau sont formées indépendamment, en tenant compte des entrées et des dérivés de ceux-ci. Malgré de nombreuses réalisations appliquées, l'apprentissage «avec l'enseignant» a été critiqué pour l'inadéquation biologique. Il est difficile d'imaginer un mécanisme de formation en naturel intelligence humainequi compareraient les valeurs de sortie souhaitées et réelles, effectuant une correction par rétroaction. Si vous autorisez un mécanisme similaire dans le cerveau humain, alors d'où vient les sorties souhaitées? L'apprentissage "sans enseignant" est un modèle de formation plus crédible dans le système biologique. Il n'a pas besoin d'un vecteur cible pour les sorties et, par conséquent, ne nécessite pas de comparaison avec des réponses parfaites prédéfinies. L'ensemble d'apprentissage est constitué uniquement de vecteurs d'entrée. L'algorithme d'entraînement ajuste le poids du réseau de neurones afin que les vecteurs de sortie convenus obtenus, c'est-à-dire que la présentation de vecteurs d'entrée suffisamment étroites a donné les mêmes sorties. Le processus d'apprentissage attribue donc les propriétés statistiques de l'ensemble de l'apprentissage et des groupes de vecteurs similaires dans les classes. La présentation de l'entrée vectorielle de cette classe donnera un vecteur de sortie spécifique, mais il est impossible de prédire à la formation, que la production sera faite par cette classe de vecteurs d'entrée. Par conséquent, les sorties d'un tel réseau doivent être transformées en une forme compréhensible en raison du processus d'apprentissage. Ce n'est pas un problème grave. Il n'est généralement pas difficile d'identifier la connexion entre l'entrée et la sortie définie par le réseau.

Le regroupement est consacré à de nombreuses œuvres scientifiques. La tâche principale de la regroupement est le traitement de nombreux vecteurs dans un espace multidimensionnel de fonctionnalités avec la libération de sous-ensembles compacts (sous-ensembles proches les unes des autres), leurs quantités et leurs propriétés. La méthode de clustering la plus courante est la méthode "$ K $ -Means", qui n'est pratiquement pas associée aux méthodes de propagation inverse et non généralisée sur l'architecture du type de réseaux de neurones multicouches.

L'introduction du concept de qualifications de «enseignant» et une approche unique de l'apprentissage et de l'auto-étude dans les années 1960 a permis de créer la base de la mise en œuvre du régime de regroupement dans des réseaux de neurones multicouches d'une vaste classe de structures.

Images non statistionnaires

Les développements existants dans le domaine des systèmes de reconnaissance d'images sur la base de réseaux de neurones multicouches sont principalement liés aux images stationnaires, c'est-à-dire Signaux d'entrée aléatoires ayant une fonction complexe inconnue, mais une fonction de distribution stationnaire à temps. Dans certaines œuvres, une tentative a été faite de manière à distribuer le procédé proposé de configuration de réseaux de neurones multicouches aux images non stationnaires, lorsqu'une fonction inconnue prévue de la répartition du signal d'entrée dépend du temps ou de l'entrée Signal aléatoire est une superposition d'un composant régulier et composant aléatoire avec une fonction de distribution complexe inconnue qui ne dépend pas du temps.

Sur les critères d'optimisation primaire dans les réseaux de neurones multicouches

Le modèle probabiliste du monde, pris comme base pour la construction d'algorithmes d'adaptation dans des réseaux de neurones multicouches, a permis de former un critère d'optimisation primaire dans les systèmes considérés sous la forme d'un minimum de la fonction de risque moyen et de ses modifications: la Maximum d'une probabilité postérioriori (les chances conditionnelles d'un événement aléatoire, à condition qu'un posteriori soit connu, c'est-à-dire basé sur l'expérience, les données); minimum de la fonction de risque moyen; minimum de la fonction de risque moyen, sous réserve de l'égalité des fonctions conditionnelles de risque pour diverses classes; minimum de la fonction de risque moyen sous la condition de la valeur spécifiée de la fonction de risque conditionnel pour l'une des classes; Autres critères d'optimisation principaux découlant des exigences d'une tâche pratique particulière. Dans les travaux des scientifiques russes, les modifications des algorithmes pour définir des réseaux de neurones multicouches pour les critères ci-dessus d'optimisation primaire ont été présentés. Il convient de noter que dans la majorité écrasante du travail dans le domaine de la théorie des réseaux de neurones et des algorithmes de distribution inverse, le critère le plus simple est considéré comme le minimum de l'erreur RMS, sans aucune restriction sur les fonctions de risque classiques.

En mode d'auto-apprentissage (clustering), le principe de la formation du critère et le fonctionnel de l'optimisation primaire des réseaux de neurones est la représentation de la fonction de la distribution du signal d'entrée sous la forme d'une fonction multimodale dans le multidimensionnel. espace des signes, où chaque mode avec une probabilité correspond à la classe. En tant que critères d'optimisation primaire en mode d'auto-apprentissage, des modifications de la fonction de risque moyen ont été utilisées.

Les modifications présentées de critères d'optimisation primaires ont été résumées en cas de continuum de classes et de solutions; Signes de continuum d'espace d'entrée; continuum du nombre de neurones dans la couche; Avec des qualifications arbitraires de l'enseignant. Une partie importante de la formation du critère et fonctionnel de l'optimisation primaire dans les réseaux de neurones multicouches dans un modèle probabiliste du monde est le choix d'une matrice de perte, qui dans la théorie des solutions statistiques détermine le coefficient de perte de $ L_ (12) $ avec la classification erronée des images de la 1re classe du 2e et du facteur de perte $ L_ (21) $ lors de la classification des images de la 2e classe au 1er. En règle générale, par défaut, la matrice $ L $ de ces coefficients dans la synthèse d'algorithmes pour la mise en place de réseaux de neurones multicouches, y compris lors de l'application de la méthode de propagation inverse, est acceptée symétrique. En pratique, cela ne correspond pas à la réalité. Un exemple caractéristique est un système d'exploitation minière avec un géolocreur. Dans ce cas, la perte de la mission erronée de la pierre à la mine est équivalente à une faible perte de temps par l'utilisateur de Geolocrator. Les pertes associées à l'attribution erronée des mines à la classe des pierres sont liées à la vie ou à une perte importante de la santé par les utilisateurs de géolocrator.

Analyse des réseaux de neurones ouverts

Cet ensemble de synthèse vise à déterminer dans la forme générale des caractéristiques statistiques des signaux de sortie et intermédiaires des réseaux de neurones comme des objets de contrôle multidimensionnels et non linéaires afin de former davantage un critère et fonctionnel de l'optimisation secondaire, c'est-à-dire que la fonctionnalité est en réalité optimisée. par l'algorithme d'adaptation dans un réseau de neurones particuliers. Dans la majorité écrasante du travail en tant que telle fonctionnalité, une erreur RMS est prise en tant que telle fonctionnalité, qui aggrave la qualité de la solution ou ne correspond pas à la tâche d'optimisation définie par le critère d'optimisation principal.

La technique et les algorithmes de la formation de l'optimisation secondaire fonctionnel correspondant à la fonctionnalité d'optimisation principale spécifiée sont développées.

Algorithmes pour la recherche d'extremum des fonctionnaires d'optimisation secondaire

L'algorithme de recherche Extremma par rapport à une optimisation secondaire spécifique fonctionnel détermine l'algorithme de réglage des coefficients du réseau de neurones multicouches. Au début du XXIe siècle, des algorithmes similaires mis en œuvre dans le système MATLAB (abréviation du français »Laboratoire de matrice sont le plus grand package d'intérêt pratique logiciel appliqué Résoudre les tâches informatiques techniques et le langage de programmation éponyme). Cependant, il est nécessaire de noter les algorithmes d'adaptation particuliers des réseaux de neurones multicouches utilisés dans les systèmes MATLAB (boîte à outils de réseau de neurones - fournit des fonctions et des applications de modélisation de systèmes non linéaires complexes, décrites par des équations; supporte l'apprentissage "avec enseignant" et "sans enseignant ", Distribution directe, avec des fonctions de base radiale, etc.), et l'orientation de ces algorithmes ne figure pas sur les spécificités des tâches résolues, mais sur la" géométrie "imaginaire des fonctionnaires de l'optimisation secondaire. Ces algorithmes ne prennent pas compte de nombreux détails des spécificités de l'utilisation de réseaux de neurones multicouches lors de la résolution de tâches spécifiques et, bien entendu, nécessitent un traitement fondamental, voire fondamental, lors de la transition vers les systèmes neurones à membrane. Une analyse comparative détaillée de la méthode de distribution inverse et de méthodes russes des années 1960 et 1970 a été réalisée. La principale caractéristique de ces algorithmes est de trouver la nécessité de rechercher des extrêmes locaux et globaux de la fonctionnalité multi-extrémal dans l'espace multidimensionnel des coefficients de réseau de neurones personnalisables. La croissance de la taille du réseau neuronal entraîne une augmentation significative du nombre de coefficients personnalisables, c'est-à-dire à la croissance de la taille de l'espace de recherche. De retour dans les années 1960, les travaux ont été proposés des procédures de recherche et d'analyse pour calculer le gradient de la fonction d'optimisation secondaire et, dans la classe de procédures analytiques, il a été proposé et la demande a été étudiée pour organiser une recherche non seulement, mais aussi la seconde. dérivé de l'optimisation secondaire fonctionnel. La spécificité de l'optimalité multiple du fonctionnement de l'optimisation secondaire a conduit au cours des prochaines décennies à l'émergence de diverses modifications de méthodes de recherche (algorithmes génétiques, etc.). Les algorithmes de recherche d'extremums de fonctionnalités d'optimisation secondaire avec des limitations par magnitude, vitesse et autres paramètres de coefficients de pondération des réseaux de neurones sont créés. Ce sont ces méthodes qui doivent constituer la base des travaux sur des méthodes permettant de définir des réseaux de neurones à l'aide de membranes (coefficients de poids) en tenant compte de ces caractéristiques spécifiques telles que les ratios d'engrenage.

Conditions principales lors de la mise en place de coefficients

La sélection des conditions initiales de la procédure itérative de recherche d'extremums de fonctionnalités d'optimisation secondaire est une étape importante de la synthèse d'algorithmes pour la mise en place de réseaux neurones multicouches. La sélection des conditions initiales doit être résolue spécifiquement pour chaque tâche résolue par le réseau neuronal et être une composante intégrale de la procédure générale de la synthèse d'algorithmes pour la mise en place de réseaux de neurones multicouches. Une solution qualitative à cette tâche peut réduire considérablement la durée de fixation. La complexité a priori de l'optimisation secondaire fonctionnel a rendu l'introduction nécessaire de la procédure de sélection des conditions initiales sous la forme de valeurs aléatoires des coefficients avec la répétition de cette procédure et des procédures de configuration du coefficient. Cette procédure dans les années 1960 semblait extrêmement redondante du point de vue du temps consacré à la définition des coefficients. Cependant, malgré cela, il est largement appliqué assez largement. Pour les tâches individuelles, l'idée de sélectionner les conditions initiales spécifiques à cette tâche a été adoptée. Une telle procédure a été élaborée pour trois tâches: la reconnaissance de l'image; regroupement; Neurostélification d'objets dynamiques non linéaires.

Mémoire dans le circuit de configuration du coefficient

L'approche système de la construction des algorithmes de recherche Extremma du fonctionnement de l'optimisation secondaire suggère comme l'un des modes de configuration au réglage des coefficients de chaque manière pour entrer des images à l'entrée de la valeur actuelle du gradient fonctionnel de l'optimisation secondaire. Les algorithmes destinés à définir des réseaux de neurones multicouches avec filtrage de la séquence de valeurs de gradient du fonctionnement de l'optimisation secondaire sont développés: filtre à commande zéro avec mémoire M_N $ (pour les images fixes); Filtre 1 $, ..., k $ -o commande avec $ m_n $ mémoire (pour des images non stationnaires) avec diverses modifications d'hypothèse au moment des fonctions de distribution pour des images de différentes classes.

Etude d'algorithmes d'adaptation dans les réseaux de neurones

La principale question est de savoir comment choisir la structure d'un réseau neuronal multicouche pour résoudre la tâche spécifique sélectionnée - elle est toujours largement résolue. Vous pouvez offrir uniquement un buste directionnel raisonnable des modes de réalisation des structures avec l'évaluation de leur efficacité dans le processus de résolution du problème. Cependant, la qualité des performances de l'algorithme de configuration sur une structure sélectionnée spécifique, une tâche particulière peut ne pas être correctement correcte. Ainsi, des signaux d'entrée typiques (par étapes, quadratiques, etc.) sont utilisés pour évaluer la qualité des systèmes de commande dynamique linéaire, en fonction de la réaction auquel l'erreur établie (anatamation du système) est estimée et des erreurs dans des processus transitoires.

Comme cela, des signaux d'entrée typiques ont été développés pour des réseaux de neurones multicouches pour tester et comparer les performances de divers algorithmes de configuration. Naturellement, des signaux d'entrée typiques pour des objets tels que des réseaux de neurones multicouches sont spécifiques à chaque tâche résolue. Tout d'abord, les signaux d'entrée de type ont été développés pour les tâches suivantes: Reconnaissance de l'image; regroupement; Neuroplage par des objets dynamiques.

Le principal principe axiomatique d'application des technologies de réseau neuronal au lieu des méthodes de statistiques mathématiques classiques, il s'agit d'un refus d'une description formalisée des fonctions de distribution de probabilité pour les signaux d'entrée et de l'adoption du concept de fonctions de distribution complexes inconnues. C'est pour cette raison que les signaux d'entrée de type suivants ont été proposés.

Pour le problème de la clustering, un échantillon d'un signal aléatoire avec une distribution multimodale a été proposé, mis en œuvre dans l'espace $ N ° -dimensional de fonctionnalités avec des modes de la fonction de distribution, dont les centres de la quantité de $ z $ sont placés sur Hyperbission de signes $ N $ -Dimensionnelles. Chaque mod vend un échantillon aléatoire avec une distribution normale et une écart type de $ σ $ égale à chacun des $ Z $ Mod. L'objet de la comparaison de diverses méthodes de clustering sera la dynamique du paramètre et la qualité de la solution du problème en fonction de $ N $, $ Z $ et $ σ $, avec un échantillon aléatoire suffisamment élevé de M $. Cette approche peut être considérée comme l'une des approches objectives suffisantes pour comparer des algorithmes de clustering, y compris des réseaux de neurones multicouches avec un choix de structure correspondant pour atteindre la qualité de regroupement requise. Pour les tâches de classification, les signaux d'entrée pour les tests sont similaires aux signaux de regroupement avec le changement que la sélection avec une distribution multimodale est divisée en deux (dans le cas de deux classes) ou $ K $ (dans le cas de $ k $) pièces avec des fonctions de distribution intermittentes pour les classes individuelles.

Réseaux de neurones avec structure variable

Le refus des technologies de réseau de neurones provenant d'une information a priori, des informations sur la fonction de la distribution des signaux d'entrée conduisant à la nécessité de mettre en œuvre une intégrité raisonnable des paramètres de la structure des réseaux de neurones multicouches afin de garantir la qualité de la résolution du problème.

Dans les années 1960, pour une classe de tâches très pertinente - reconnaissance d'image - la procédure a été proposée pour la mise en place de réseaux de neurones multicouches dans lesquels la structure a priori n'est pas fixée et résulte du paramètre avec les valeurs de coefficients personnalisables . Dans ce cas, le nombre de couches et le nombre de neurones dans les couches sont sélectionnés pendant le réglage. La procédure de réglage des coefficients d'un réseau neuronal multicouche avec une structure variable est facilement transférée de la tâche de reconnaître deux classes d'images à la reconnaissance des classes d'image $ K $. De plus, le paramètre de résultat est des réseaux de neurones $ K $, chacun étant la première classe de classe $ K $ K $ ($ K \u003d 1, \\ ldots, K $) et la seconde sont toutes les autres. Une idée similaire de mise en place de réseaux de neurones multicouches avec une structure variable est également applicable à la résolution du problème de clustering. Dans le même temps, l'échantillon initial est considéré comme la première classe d'images, et en tant que deuxième classe - un échantillon avec une distribution uniforme dans la gamme de modifications d'indication. Le réseau neuronal multicouche avec une structure variable mise en œuvre dans le processus de configuration avec une qualité qualitative et quantitative reflète la complexité de la résolution du problème. À partir de ce point de vue, la tâche de regroupement comme une tâche de naissance de nouvelles connaissances de l'objet étudié est de mettre en évidence et d'analyser ces zones de signes multidimensionnels de signes dans lesquelles la fonction de distribution de probabilité dépasse le niveau de distribution uniforme dans la gamme de changements dans les valeurs des signes.

Perspectives de développement

Au début du XXIe siècle, l'un des principaux concepts de développement (apprentissage) du réseau de neurones multicouches est le désir d'augmenter le nombre de couches, ce qui implique de garantir le choix de la structure du réseau neuronal, une tâche adéquate, Développer de nouvelles méthodes pour la formation des algorithmes de réglage du coefficient. Les avantages des réseaux de neurones sont: la propriété de la soi-disant. Dégradation progressive - Lorsque vous traitez avec des éléments individuels, la qualité du système est tombée progressivement (pour la comparaison, des réseaux logiques à partir d'éléments et, ou de ne pas échouer dans la perturbation d'un élément de réseau); Résistance accrue à la modification des paramètres des schémas, de les mettre en œuvre (par exemple, des changements de poids très significatifs ne conduisent pas à des erreurs dans la mise en œuvre de la fonction logique simple de deux variables), etc.

La distribution généralisée des algorithmes de réseau de neurones dans le domaine des tâches complexes formalisables, faiblement formalisées et informalisées a conduit à la création d'une nouvelle direction en calcul de mathématiques - némomathématique. La neuromathématique comprend des algorithmes de réseau neuronal pour résoudre les tâches suivantes: reconnaissance de l'image; Optimisation et extrapolation des fonctions; la théorie des graphes; Tâches cryptographiques; Résolution de systèmes réels et booléens d'équations linéaires et non linéaires, d'équations différentielles ordinaires et multidimensionnelles, d'équations différentielles dans des dérivés privés, etc., basé sur la théorie des réseaux de neurones, une nouvelle section a été créée par une nouvelle section de la théorie moderne de la gestion de systèmes dynamiques multi-connectés multidimensionnels complexes et multidimensionnels - se rapprocherqui comprend des méthodes d'identification du réseau neuronal d'objets dynamiques complexes; Construction de neurorégateurs dans des contours d'objets dynamiques complexes de contrôle, etc.

Les réseaux de neurones (réseau neural artificiel) est un système de connexion et d'interaction processeurs simples (neurones artificiels). Ces processeurs sont généralement assez simples (en particulier par rapport aux processeurs utilisés dans ordinateur personnel). Chaque processeur de ce réseau n'est traité qu'avec des signaux qu'il reçoit périodiquement et les signaux qu'il envoie périodiquement à d'autres processeurs. Et néanmoins, être connecté suffisamment grand réseau Avec une interaction gérée, ces processeurs sont en mesure de remplir des tâches assez complexes, car les réseaux de neurones sont formés dans le processus.

Il n'est pas secret que maintenant la neurosétique est la plus souvent utilisée sur la photo. Nous avons déjà vu comment ils sont capables de travailler avec l'animation sur l'ordinateur habituel et des peintures, laissez les œuvres de marteau plus chères d'artistes célèbres. Il n'est pas surprenant que ce soit la neurosette que FaceOPP était basée sur la popularité du monde dans le monde entier, des magasins d'assaut Magasin d'applications. et.

Masque ilon après colonisé Mars

Google a introduit un nouveau réseau de neurones de translatotron expérimental qui pourrait traduire directement la parole en une autre langue sans utiliser sa représentation textuelle et maintenir les données vocales et le taux de discours vocal, signalé sur le blog de la société. Le système avec une mémoire longue à court terme est capable de recevoir une entrée vocale et de le traiter comme un spectrogramme, puis générer sur cette base un nouveau spectrode sur la langue cible. Dans certaines conditions, cela augmentera non seulement le taux de transfert, mais également sa précision. Avec plus description complète Un nouveau développement peut être trouvé dans l'article publié dans le référentiel en ligne des articles scientifiques Arxiv.org.

La cloche.

Il y a ceux qui ont lu cette nouvelle devant vous.
Abonnez-vous pour recevoir des articles frais.
E-mail
Nom
Nom de famille
Comment voulez-vous lire la cloche
Sans spam