Che cos'è un indirizzo URL: struttura e parametri tecnici - 3,5 su 5 sulla base di 4 voti

L'abbreviazione URL sta per Uniform Resource Locator. Tradotto, significa "localizzatore di risorse singole". Nato da un'idea di Tim Bernes-Lee, il "padre" del World Wide Web, è stato creato per semplificare la strutturazione dei dati su Internet e riunire tutti gli indirizzi in un'unica forma.

Pronuncia accettata: "u-er-el" o "yu-ar-el". Nel discorso colloquiale, è accettabile pronunciare questa abbreviazione come "URL". In questo articolo, esamineremo cos'è un URL, qual è la sua struttura e le caratteristiche tecniche che ogni webmaster deve conoscere.

Schema e struttura degli URL

Che cos'è un URL? In altre parole, questo è il percorso di alcuni file: HTML, video, audio, testo, ecc. Tutti i documenti su Internet hanno questo indirizzo. Solo con l'aiuto di un URL un server può fornire l'accesso ai suoi file a qualsiasi utente del World Wide Web.

Naturalmente c'è uno standard. È lui che determina esattamente come dovrebbe apparire l'URL di un particolare documento. Questo standard viene utilizzato non solo per accedere a siti e file utilizzando i protocolli http e https, ma viene utilizzato anche durante il trasferimento di file su un server utilizzando il protocollo ftp e altri protocolli. Ma in questo caso non ci interessano.

Come specificare l'indirizzo URL per le risorse web?

In generale, un URL può contenere molti parametri. Ma per un semplice accesso a un file specifico che si trova in qualche cartella del tuo sito, devi usarne solo alcuni. Pertanto, ad esempio, per ottenere il contenuto di uno specifico file ospitato su questo sito, è sufficiente specificare quanto segue:

http://site/directoriya/fail.html

Vediamo tutto nel dettaglio:

http:// - protocollo di trasferimento dati.
sito - nome di dominio, nome del nodo (host) e parametri aggiuntivi.
/ direktoriya / - la directory in cui si trova il file di cui abbiamo bisogno. Da questa parte del collegamento, vediamo che la cartella direktoriya è archiviata sul server, che contiene il file di cui abbiamo bisogno.
fail.html è un file con estensione ".html", ecco cosa ci serve.

In generale, qual è l'URL di un sito, pagina o immagine è chiaro. Ora andiamo un po' più a fondo.

Struttura dell'URL

Lo schema generale (struttura) di un URL è il seguente:

Ognuno di questi parametri è importante e ha il suo significato:

Schema - protocollo di trasferimento dati. Attraverso di essa ci rivolgiamo alla risorsa. (http, https, ftp, ecc.)
Accesso e password: questi dati nel protocollo http, di regola, non sono specificati. Determinano i diritti dell'utente di accedere a una determinata pagina del sito.
Cane (@) è un delimitatore speciale. Senza nome utente e password, non è indicato.
L'host è il nome di dominio, a volte l'indirizzo IP della risorsa a cui l'utente sta accedendo. (sito web)
Anche la porta è specificata abbastanza raramente. Quando si accede al sito o a qualsiasi file ospitato sul sito, viene assegnato automaticamente uno dei valori: 80 o 8080.
Percorso URL: il percorso di un determinato file. (/directory/fail.html)
Parametri: una richiesta con determinati parametri che vengono inviati al server utilizzando il metodo GET. Per separare i parametri, utilizzare il segno &, ad esempio: ?parametro1=valore1¶metro2=valore2
Un'ancora è una stringa univoca composta da lettere e/o numeri. Si riferisce a un'area specifica del documento Web in fase di apertura. Con esso, puoi assicurarti che l'utente non arrivi all'inizio del documento HTML, ma immediatamente in un punto specifico.

Ulteriori informazioni sugli URL

1. Gli URL utilizzano codifiche diverse. Se non c'è transcodifica, è possibile utilizzare solo un certo numero di caratteri. Si consiglia di utilizzare i simboli ,,,[_],[-].

Per evitare errori, lo sviluppatore deve nominare i file del sito solo in minuscolo e indicarne il percorso allo stesso modo, in lettere minuscole. Perché, su sistemi simili a Unix, e i server Web funzionano molto spesso su di essi, i caratteri scritti in registri diversi saranno percepiti dalla macchina come diversi. Non esiste una cosa del genere in Windows, ma non dovresti trascurare la regola, perché se il tuo file è chiamato in minuscolo e hai specificato il suo nome in maiuscolo nell'URL, il server non sarà in grado di aprirlo.

È possibile utilizzare caratteri russi, tuttavia, ogni carattere russo verrà ricodificato (codifica URL). E questo, dopo la ricodifica, sembrerà "spaventoso", perché qualsiasi carattere cirillico verrà codificato utilizzando 2 byte in UTF-8 in forma esadecimale. I caratteri sono separati da "%".

http: // sito / tutto per il webmaster

Sembrerà:

http://sito web/%u0432%u0441%u0435%20%u0434%u043B%u044F%20%u0432%u0435%u0431%u043C%u0430%u0441%u0442%u0435%u0440%u0430

Cercano di affrontare un tale inconveniente, tuttavia, non troppo rapidamente. Pertanto, quando si utilizza CNC sul proprio CMS, è meglio utilizzare la traslitterazione (vse-dlya-webmastera). Sarà più facile navigare e probabilmente è meglio per la SEO.

2. Esistono anche URL chiamati dinamici. Tali URL contengono diversi caratteri (“?”, “&”, “=”, ecc.) con i quali vengono impostati i parametri, il codice che abbiamo considerato per la struttura degli URL ha già menzionato i parametri, vedi sopra. Tali indirizzi appaiono come risultato del lavoro degli script pubblicati sul sito. In questo caso, il collegamento potrebbe essere simile a questo.

network-resource-manager.exe

4,48 MB.

network-resource-manager.exe download gratuito.
Se ricevi un errore network-resource-manager.exe mancante:
- Puoi provare a scaricare questo file e incollarlo nella directory in cui manca
Se ricevi un errore nel file network-resource-manager.exe:
- Prova a sostituirlo con questo.

Se ciò non aiuta, prova a copiare questo file nella directory di sistema del tuo sistema operativo.
Se non riesci a trovare la directory di Windows, prova:
1. Tieni premuto Windows sulla tastiera, quindi premi il pulsante R.
2. Digitare il comando "cmd" e premere Invio
3. Nella finestra dei comandi, digitare il comando "set systemroot" e premere Invio. Verrà visualizzata la directory di sistema.
4. Eseguire il backup network-resource-manager.exe sul tuo computer
5. e copiare il file network-resource-manager.exe nelle directory: System o System32 o System64.

Scansione antivirus:

Tutti gli URL per scaricare questo file:

HTTP è un protocollo di trasferimento ipertestuale tra sistemi distribuiti. Infatti http è un elemento fondamentale del Web moderno. In quanto sviluppatori web che si rispettino, dovremmo conoscerne il più possibile.

Guardiamo questo protocollo attraverso la lente della nostra professione. Nella prima parte, analizzeremo le nozioni di base, esamineremo le richieste/risposte. Nel prossimo articolo analizzeremo chip più dettagliati, come la memorizzazione nella cache, la gestione della connessione e l'autenticazione.

Anche in questo articolo mi riferirò principalmente a RFC 2616: Hypertext Transfer Protocol -- HTTP/1.1.

Nozioni di base su HTTP

HTTP consente la comunicazione tra più host e client e supporta una gamma di impostazioni di rete.

Fondamentalmente, TCP / IP viene utilizzato per la comunicazione, ma questa non è l'unica opzione possibile. Per impostazione predefinita, TCP/IP utilizza la porta 80, ma è possibile utilizzarne altre.

La comunicazione tra l'host e il client avviene in due fasi: una richiesta e una risposta. Il client genera una richiesta HTTP, in risposta alla quale il server fornisce una risposta (messaggio). Un po 'più tardi, considereremo questo schema di lavoro in modo più dettagliato.

L'attuale versione del protocollo HTTP è la 1.1, che ha introdotto alcune nuove funzionalità. A mio parere, i più importanti sono: supporto per una connessione permanentemente aperta, un nuovo meccanismo per la codifica del trasferimento a blocchi di trasferimento dati, nuove intestazioni per la memorizzazione nella cache. Alcuni di questi verranno considerati nella seconda parte di questo articolo.

URL

Il cuore della comunicazione web è la richiesta, che viene inviata attraverso l'Uniform Resource Locator (URL). Sono sicuro che sai già cos'è un URL, ma per completezza ho deciso di dire comunque qualche parola. La struttura dell'URL è molto semplice ed è composta dai seguenti componenti:

Il protocollo può essere http per connessioni regolari o https per uno scambio di dati più sicuro. La porta predefinita è 80. Questa è seguita dal percorso della risorsa sul server e da una catena di parametri.

Metodi

Utilizzando l'URL, specifichiamo il nome esatto dell'host con cui vogliamo comunicare, tuttavia, quale azione dobbiamo eseguire può essere comunicata solo utilizzando il metodo HTTP. Naturalmente, ci sono diversi tipi di azioni che possiamo intraprendere. HTTP implementa il più necessario, adatto alle esigenze della maggior parte delle applicazioni.

Metodi esistenti:

OTTENERE: Accedi a una risorsa esistente. L'URL elenca tutte le informazioni necessarie affinché il server possa trovare e restituire la risorsa richiesta come risposta.

INVIARE: utilizzato per creare una nuova risorsa. Una richiesta POST di solito contiene tutte le informazioni necessarie per creare una nuova risorsa.

METTERE: aggiorna la risorsa corrente. La richiesta PUT contiene i dati aggiornati.

ELIMINA: utilizzato per eliminare una risorsa esistente.

Questi metodi sono i più popolari e più spesso utilizzati da vari strumenti e framework. In alcuni casi, le richieste PUT e DELETE vengono inviate inviando un POST, il cui contenuto indica l'azione da intraprendere con la risorsa: creare, aggiornare o eliminare.

HTTP supporta anche altri metodi:

TESTA: simile a GET. La differenza è che con questo tipo di richiesta non viene trasmesso alcun messaggio. Il server riceve solo le intestazioni. Utilizzato, ad esempio, per determinare se una risorsa è stata modificata.

TRACCIA: durante la trasmissione, la richiesta passa attraverso molti punti di accesso e server proxy, ognuno dei quali apporta le proprie informazioni: IP, DNS. Con questo metodo, puoi vedere tutte le informazioni intermedie.

OPZIONI: utilizzato per determinare le capacità, le opzioni e la configurazione del server per una risorsa specifica.

Codici di stato

In risposta a una richiesta del client, il server invia una risposta che contiene, tra le altre cose, un codice di stato. Questo codice ha un significato speciale in modo che il cliente possa capire chiaramente come interpretare la risposta:

1xx: messaggi informativi

Un insieme di questi codici è stato introdotto in HTTP/1.1. Il server può inviare una richiesta del tipo: Expect: 100-continue, il che significa che il client sta ancora inviando il resto della richiesta. I client HTTP/1.0 ignorano queste intestazioni.

2xx: messaggi di successo

Se il cliente ha ricevuto un codice dalla serie 2xx, la richiesta è andata a buon fine. L'opzione più comune è 200 OK. Con una richiesta GET, il server invia una risposta nel corpo del messaggio. Ci sono anche altre possibili risposte:

202 Accettato: La richiesta è stata accettata, ma potrebbe non contenere la risorsa nella risposta. Ciò è utile per le richieste lato server asincrone. Il server determina se inviare o meno la risorsa.
204 Nessun contenuto: Non è presente alcun messaggio nel corpo della risposta.
205 Reimposta contenuto: indica al server di reimpostare la visualizzazione del documento.
206 Contenuto parziale: La risposta contiene solo una parte del contenuto. Intestazioni aggiuntive definiscono la lunghezza totale del contenuto e altre informazioni.

3xx: Reindirizzamento

Una sorta di messaggio al cliente sulla necessità di eseguire un'altra azione. Il caso d'uso più comune consiste nel reindirizzare il client a un altro indirizzo.

301 Trasferito definitivamente: la risorsa ora può essere trovata a un URL diverso.
303 Vedi Altro: la risorsa può essere trovata temporaneamente a un URL diverso. L'intestazione Location contiene un URL temporaneo.
304 Non modificato: il server determina che la risorsa non è stata modificata e il client deve utilizzare la versione memorizzata nella cache della risposta. Per verificare l'identità delle informazioni, viene utilizzato ETag (Hash Entity Tag);

4xx: Errori del cliente

Questa classe di messaggi viene utilizzata dal server se decide che la richiesta è stata inviata per errore. Il codice più comune è 404 Not Found. Ciò significa che la risorsa non è stata trovata sul server. Altri possibili codici:

400 Richiesta errata: la domanda è stata formulata in modo errato.
401 Non autorizzato: Per effettuare la richiesta è necessaria l'autenticazione. Le informazioni vengono passate attraverso l'intestazione di autorizzazione.
403 Proibito: Il server non ha reso disponibile la risorsa.
405 Metodo non consentito: è stato utilizzato un metodo HTTP non valido per accedere alla risorsa.
409 Conflitto: Il server non può elaborare completamente la richiesta perché tenta di modificare una versione più recente della risorsa. Questo accade spesso con le richieste PUT.

5xx: errori del server

Un insieme di codici utilizzati per rilevare un errore del server durante l'elaborazione di una richiesta. Il più comune: 500 Errore interno del server. Altre opzioni:

501 Non attuato: Il server non supporta la funzionalità richiesta.
503 servizio non disponibile: Questo può accadere se il server ha un errore o è sovraccarico. Di solito in questo caso il server non risponde e il tempo concesso per la risposta scade.

Formati dei messaggi di richiesta/risposta

Nell'immagine seguente, puoi vedere uno schema del processo di invio di una richiesta da parte del client, elaborazione e invio di una risposta da parte del server.

Diamo un'occhiata alla struttura del messaggio trasmesso tramite HTTP:

Messaggio = *()CRLF[ ] = Riga di richiesta | Riga di stato = Nome campo ":" Valore campo

Deve esserci una riga vuota tra l'intestazione e il corpo del messaggio. Possono esserci diverse intestazioni:

Il corpo della risposta può contenere tutte o parte delle informazioni se la funzione corrispondente è abilitata (Codifica di trasferimento: a blocchi). HTTP/1.1 supporta anche l'intestazione Transfer-Encoding.

Titoli generali

Esistono diversi tipi di intestazioni che vengono utilizzate sia nelle richieste che nelle risposte:

Abbiamo già considerato qualcosa in questo articolo, toccheremo qualcosa in modo più dettagliato nella seconda parte.

L'intestazione via viene utilizzata in una richiesta TRACE e viene aggiornata da tutti i proxy.

L'intestazione Pragma viene utilizzata per enumerare le intestazioni personalizzate. Ad esempio, Pragma: no-cache è uguale a Cache-Control: no-cache. Ne parleremo meglio nella seconda parte.

L'intestazione Date viene utilizzata per memorizzare la data e l'ora della richiesta/risposta.

L'intestazione Upgrade viene utilizzata per modificare il protocollo.

Transfer-Encoding ha lo scopo di dividere la risposta in più blocchi utilizzando Transfer-Encoding: chunked. Questa è una novità in HTTP/1.1.

Intestazioni di entità

Le intestazioni di entità trasmettono meta-informazioni di contenuto:

Tutte le intestazioni precedute da Contenuto forniscono informazioni sulla struttura, la codifica e le dimensioni del corpo del messaggio.

L'intestazione Expires contiene l'ora e la data di scadenza dell'entità. Il valore "non scade mai" significa tempo + 1 codice dal momento corrente. Ultima modifica contiene l'ora e la data dell'ultima modifica dell'entità.

Utilizzando queste intestazioni, puoi specificare le informazioni necessarie per le tue attività.

Formato richiesta

La richiesta è simile a questa:

SP è il separatore tra i token. La versione HTTP è specificata in HTTP-Version. La vera richiesta si presenta così:

GET /articles/http-basics HTTP/1.1 Host: www.articles.com Connessione: keep-alive Controllo cache: no-cache Pragma: no-cache Accept: text/html,application/xhtml+xml,application/xml; q=0,9,*/*;q=0,8

Elenco di possibili intestazioni di richiesta:

L'intestazione Accept definisce i tipi MIME supportati, la lingua, la codifica dei caratteri. Le intestazioni From, Host, Referer e User-Agent contengono informazioni sul client. I prefissi If servono per creare condizioni. Se la condizione non riesce, si verificherà un errore 304 Non modificato.

Formato di risposta

Il formato della risposta differisce solo per lo stato e per un numero di intestazioni. Lo stato si presenta così:

Riga di stato = Versione HTTP SP Codice di stato SP Frase motivo CRLF

Versione HTTP
Codice di stato
Messaggio di stato leggibile dall'uomo

Uno stato tipico è simile a questo:

HTTP/1.1 200 OK

Le intestazioni delle risposte possono essere:

Tempo di validità in secondi in cui il messaggio è stato creato sul server.
Entità ETag MD5 per verificare la presenza di modifiche e modifiche alla risposta.
La posizione viene utilizzata per il reindirizzamento e contiene il nuovo URL.
Server specifica il server in cui è stata generata la risposta.

Penso che sia abbastanza teoria per oggi. Ora diamo un'occhiata agli strumenti che possiamo utilizzare per monitorare i messaggi HTTP.

Strumenti per il rilevamento del traffico HTTP

Esistono molti strumenti per monitorare il traffico HTTP. Eccone alcuni:

Il più comunemente usato è il Chrome Developers Tools:

Parlando di un debugger, puoi usare Fiddler :

Per monitorare il traffico HTTP, hai bisogno di curl, tcpdump e tshark.

Librerie HTTP - jQuery AJAX

Poiché jQuery è così popolare, ha anche un toolkit per la gestione delle risposte HTTP dalle richieste AJAX. Informazioni su jQuery.ajax(settings) possono essere trovate sul sito ufficiale.

Passando l'oggetto settings e usando la funzione di callback beforeSend, possiamo impostare le intestazioni della richiesta usando il metodo setRequestHeader().

$.ajax(( url: "http://www.articles.com/latest", digita: "GET", beforeSend: function (jqXHR) ( jqXHR.setRequestHeader("Accepts-Language", "en-US,en "); ) ));

Se vuoi elaborare lo stato di una richiesta, puoi farlo in questo modo:

$.ajax(( statusCode: ( 404: function() ( alert("pagina non trovata"); ) ) ));

Risultato

Eccolo, un tour delle basi del protocollo HTTP. Nella seconda parte ci saranno fatti ed esempi ancora più interessanti.

In inglese, sta per Uniform Resource Locator, che, tradotto in russo, significa "single resource index". In russo, questa abbreviazione è solitamente pronunciata come "u-er-el", "yu-ar-el" o semplicemente "url". Proviamo a capire più in dettaglio cos'è un URL. Ogni documento (pagina Web) su Internet ha una posizione specifica a cui puoi puntare esattamente. Utilizzando l'indirizzo URL, viene indicato il percorso esatto di una pagina Web specifica. Proprio come specificare il percorso di qualsiasi file sul computer, l'URL è costruito secondo un determinato schema, che di solito assomiglia a questo:

http://name.ru/papka/document.html

Dove http - indica il tipo di protocollo mediante il quale vengono trasferiti i dati, name.ru - indica il nome di dominio del sito, papka è una cartella e document.html - una pagina specifica a cui conduce questo URL.

Poiché il nostro URL http://name.ru/papka/document.html è fittizio, dato solo a titolo di esempio, e, di conseguenza, non porta ad alcuna pagina web, quindi, provando a seguirlo, arriveremo a un pagina contenente informazioni su un errore. Potrebbe sembrare diverso, ma incontreremo sicuramente l'iscrizione "404 non trovato". "Non trovato" nella traduzione significa "non trovato" e la comparsa di una pagina 404 significa che l'indirizzo URL della pagina web è stato inserito in modo incompleto, errato (con un errore o un refuso) o la pagina richiesta non si trova più in questo indirizzo, in quanto è stato cancellato o rinominato.

Un errore 404 si verifica spesso quando si segue un collegamento trovato in un'altra pagina, nel caso in cui il collegamento non sia aggiornato. L'autore del sito potrebbe spostare il documento di cui avevamo bisogno, rinominarlo o eliminarlo. Cosa fare se durante la transizione si verifica una pagina 404? Innanzitutto, controlla se l'URL è corretto, se lo sappiamo. Correggi gli errori o gli errori di battitura e riprova. Se si verifica l'errore 404 quando si fa clic su un collegamento a una risorsa sconosciuta, è necessario provare ad accedere alla pagina principale e utilizzare la ricerca nel sito: è possibile che vengano comunque trovate le informazioni necessarie.

A proposito, molti sviluppatori di siti Web si assicurano che la pagina 404 del loro sito non sembri spaventosamente senza speranza. Qui viene inserito un testo umoristico con un'immagine divertente per rallegrare un utente smarrito, nonché collegamenti al sito principale, alla barra di ricerca o alla mappa del sito. Se la pagina 404 sembra ostile e non ci sono collegamenti per accedervi, puoi provare ad abbreviare manualmente l'URL, lasciando solo il nome del sito - nel nostro esempio sarà http://nome.ru/ e quindi prova a ottenere alla pagina principale del sito, da dove potrai andare alla pagina che stai cercando.

Che cos'è un URL. Indirizzo URL che cos'è URL del messaggio http dwb