Introducció breu a la codificació de l'URL

L' URL d' un lloc web , també conegut com l'adreça del lloc web, és el que algú introduiria en un navegador web per accedir a un lloc web específic. Quan passeu la informació a través d'una URL, heu d'assegurar-vos que només utilitzeu caràcters específics permesos. Aquests caràcters permesos inclouen caràcters alfabètics, números i alguns caràcters especials que tenen significat a la cadena d'URL. Qualsevol altre caràcter que s'hagi d'afegir a una URL ha d'estar codificat perquè no provoquin problemes durant el viatge del navegador per localitzar les pàgines i els recursos que cerqueu.

Codificació d'un URL

El caràcter més codificat a la cadena d'URL és el caràcter . Vostè veu aquest caràcter cada vegada que veu un signe més (+) en un URL. Això representa el caràcter espacial. El signe més actua com un personatge especial que representa aquest espai en una URL. La manera més habitual de veure això és en un enllaç mailto que inclou un tema. Si voleu que el subjecte tingui espais en ell, podeu codificar-los com a avantatges:

mailto: email? subject = this + is + my + subject

Aquest bit de codificació de text transmetria un tema de "aquest és el meu tema". El caràcter "+" de la codificació es reemplaçarà amb un real quan es representa en el navegador.

Per codificar una URL, simplement reemplaça els caràcters especials amb la seva cadena de codificació. Això gairebé sempre començarà amb un caràcter%.

Codificació d'un URL

En sentit estricte, sempre haureu de codificar qualsevol caràcter especial que es trobi en una URL. Una nota important, en cas que se senti una mica intimidat per aquesta conversa o codificació, és que generalment no trobarà cap caràcter especial en una URL fora del seu context normal, excepte amb dades de formularis.

La majoria dels URL utilitzen els caràcters simples que sempre estan permesos, de manera que no es necessita cap codificació.

Si envieu dades a les seqüències d'ordres CGI mitjançant el mètode GET, haureu de codificar les dades a mesura que s'enviïn l'URL. Per exemple, si esteu escrivint un enllaç per promocionar un canal RSS , caldrà codificar l'URL per afegir-lo a l'URL de la seqüència que l'estigueu promocionant.

Què hauria d'estar codificat?

Qualsevol caràcter que no sigui un caràcter alfabètic, un número o un caràcter especial que s'estigui utilitzant fora del seu context normal, haurà de ser codificat a la vostra pàgina. A continuació es mostra una taula de caràcters comuns que es podrien trobar en una URL i la seva codificació.

Codificació d'URL de caràcters reservats

Personatge Finalitat a l'URL Codificació
: Protocol separat (http) de l'adreça % 3B
/ Domini i directoris separats % 2F
# Ancoratges separats 23%
? Separa la cadena de consulta % 3F
& Separar elements de consulta 24%
@ Separeu el nom d'usuari i la contrasenya del domini 40%
% Indica un caràcter codificat 25%
+ Indica un espai % 2B
No es recomana als URL % 20 o +

Tingueu en compte que aquests exemples codificats són diferents del que trobareu amb caràcters especials HTML . Per exemple, si necessiteu codificar una URL amb un caràcter i caràcters (&), usarà% 24, que és el que es mostra a la taula anterior. Si escriviu HTML i voleu afegir un nombre i text, no podreu utilitzar% 24. En el seu lloc, utilitzaria "& amp;"; o "& # 38;", ambdós escriuran el & a la pàgina HTML quan es representa. Això pot semblar confús al principi, però bàsicament és la diferència entre el text que apareix a la pàgina, que forma part del codi HTML i la cadena d'URL, que és una entitat independent i, per tant, està subjecte a regles diferents.

El fet que el "&" caràcter, així com molts altres caràcters, puguin aparèixer en cadascun, no hauria de confondre amb les diferències entre els dos.

Article original de Jennifer Krynin. Editat per Jeremy Girard.