Meta Charset Tag en HTML5

S'està configurant la codificació de caràcters en HTML5

Abans de la introducció de HTML5, configurar la codificació de caràcters en un document amb un element necessari per escriure la línia un tant detallada que es veu a continuació. Aquests són els elements de Meta Charset si utilitzeu HTML4 a la vostra pàgina web:

El que és important observar en aquest codeare les cometes que veieu al voltant de l'atribut del contingut : content = " text / html; charset = iso-8859-1 " . Com tots els atributs HTML, aquestes cometes defineixen el valor de l'atribut, que indica que tota la cadena text / html; charset = iso-8959-1 és el contingut d'aquest element . Això és un codi HTML adequat i és com es va escriure aquesta cadena. També és massa llarg i lleig. També no és una cosa que probablement recordareu de la part superior del cap. En la majoria dels casos, els desenvolupadors web haurien de copiar i enganxar aquest codi d'un lloc a qualsevol altre nou que estiguessin desenvolupant perquè escriure això des de zero estava demanant molt.

HTML5 retalla els elements addicionals & # 34; & # 34;

HTML5 no només va afegir una sèrie d'elements nous a l'idioma, sinó que també va simplificar molt la sintaxi de HTML, incloent l'element Meta Charset. Amb HTML5, podeu afegir la codificació del vostre caràcter amb la sintaxi molt més fàcil de recordar per a l'element META veieu a continuació:

Compara aquesta sintaxi simplificada amb el que hem escrit al principi d'aquest article, la vella sintaxi utilitzada per a HTML4, i veureu quant és més fàcil escriure i recordar la versió HTML5 realment. En lloc de necessitar copiar-lo i enganxar-lo d'un lloc existent a qualsevol altre nou en el qual esteu treballant, això és absolutament alguna cosa que, com a desenvolupador web d'aplicacions per a usuaris, podríeu recordar. Aquests estalvis de temps no són molt, però quan tingueu en compte que les altres àrees de sintaxi que simplifiquen HTML5, els estalvis augmenten!

Incloeu sempre la codificació de caràcters

Sempre haureu d'incloure la codificació de caràcters per a les vostres pàgines web, fins i tot si no voleu utilitzar cap caràcter especial . Si no inclou una codificació de caràcters, el vostre lloc es converteix en vulnerable a un atac de seqüències d'ordres creuades amb UTF-7.

En aquest cas, l'anattacker considera que el vostre lloc no té una codificació de caràcters definida, de manera que fa que el navegador creu que la codificació de caràcters de la pàgina en realitat és UTF-7. A continuació, l'atacant injecta scripts codificats UTF-7 a la pàgina web i el vostre lloc està piratejat. Això és evidentment problemàtic per a tots els implicats, des de la vostra empresa fins als visitants. La bona notícia és que és un problema senzill d'evitar: simplement assegureu-vos d'afegir la codificació de caràcters a totes les vostres pàgines web.

On afegir codificació de caràcters

La codificació de caràcters per a una pàgina web ha de ser la primera línia de l'element d'HTML. Això garanteix que el navegador sap què és la codificació de caràcters abans que faci una altra cosa a la pàgina que no sigui per determinar el doctype i identificar que és una Pàgina HTML. El vostre HTML hauria de llegir:

...

Ús d'encapçalats HTTP per a la seguretat addicional

També podeu especificar la codificació de caràcters als encapçalaments HTTP. Això és encara més segur que afegir-lo a la pàgina HTML, però no tindria accés a les configuracions del servidor ni als fitxers .htaccess, el que significa que és possible que hagueu de treballar amb el proveïdor d'allotjament del vostre lloc web per obtenir aquest tipus d'accés o fer que facin els canvis per a tu. L'accés és realment el repte aquí. El canvi en si mateix és senzill, de manera que qualsevol proveïdor d'allotjament hauria de poder fer aquest canvi per a vosaltres amb relativa facilitat.

Si esteu utilitzant l'àlbum, podeu establir el conjunt de caràcters per defecte per a tot el vostre lloc afegint: AddDefaultCharset UTF-8 al vostre fitxer root .htaccess . El joc de caràcters predeterminat d'Apache és ISO-8859-1 .