Regras do XML

Informática

06/04/2008

A principal regra do XML é a sua padronização dos formatos. Seu principal objetivo é evitar a incompatibilidade dos navegadores presentes no mercado, o que acontece geralmente com a linguagem HTML.

Outra regra, já mencionada anteriormente, é quanto a erros em sua execução. O processador XML ao encontrar um erro de marcação, interromperá o processamento e mostrará uma mensagem de erro. Rigor conhecido como tratamento de erros draconianos.

Quanto à classificação, os documentos podem ser tanto com validação, onde o processador verificará a estrutura do documento de acordo com regras especificas em uma DTD, e sem validação, quanto o processador só verificará se o documento está de acordo com as regras do XML.

Em um documento XML, o texto é dividido em duas categorias principais: dados de caracteres e marcação.

As marcas delimitadas por “<” e “>” ou “&” e “;” determinam a marcação do texto. Os dados de caracteres são quaisquer outros dados que não sejam de marcação.

Algumas regras, segundo Miguel Fornari, que achei interessante salientar neste trabalho:

Regra 01: Um documento XML deve conter um ou mais elementos.

Regra 02: O nome de um elemento deve ser igual na marcação (tag) inicial e na marcação final. A tag final é indicada por uma barra “/”, antes do nome da tag. Há diferenciação entre letras maiúsculas e letras minúsculas.

Regra 03: Existe um único elemento, o elemento raiz, que não pode fazer parte do conteúdo de nenhum outro elemento.

Regra 04: Se a marcação inicial está dentro de um elemento, a marcação final também deve estar dentro do mesmo elemento. Simplificando: os elementos, delimitados pelas marcações inicial e final, devem estar aninhados.

Regra 05: O texto entre a marcação inicial e a final é chamado conteúdo do elemento. Um elemento sem conteúdo pode tomar uma forma especial <nome/>. A barra antes do “>” substitui a marcação final.

Regra 06: O nome dos elementos podem conter letras, dígitos, hífens ou underscores. Os nomes dos elementos que começam com xml, XML ou outra combinação dessa string são reservados por padrão.

Regra 07: Um elemento pode conter vários, um ou nenhum atributo. Os caracteres permitidos são os mesmos dos nomes de elementos. O nome do atributo é separado de seu valor por sinal de igualdade (“=”). O valor do atributo deve estar entre apóstrofes '...' ou aspas duplas "..." . Se apóstrofe ou aspas duplas for usadas no valor do atributo, então o delimitador contrário deve ser usado.

Regra 08: Caracteres “<” e “&” não podem ser usados no texto como são usados nas marcações. Se esses caracteres são necessários utiliza-se “&lt;” ao invés de “<” e “&amp;” ao invés de “&”.

Regra 09: Caracteres >, " , e ' podem ser substituídos por “&gt;” , “&quot;” e “&apos;” , respectivamente.

Regra 10: Comentários podem aparecer em qualquer lugar do documento fora de uma marcação. Um processador de XML pode, mas não necessariamente, tornar possível a leitura desses comentários por uma aplicação. A string "--" (dois hífens) não pode ocorrer nos comentários.

Regra 11: Seções CDATA são usadas para preservar blocos de texto com caracteres que seriam interpretados como marcação. As seções CDATA começam com a string "<![CDATA[" e terminam com a string "]]>". A seqüência ']]>' não pode ocorrer dentro da seção CDATA.

Regra 12: Documentos XML podem, e deveriam, começar com uma declaração XML que especifica a versão do XML que está sendo usada e do conjunto de caracteres utilizado.

Fonte: Mauricio Reckziegel (iMasters)

Esta apresentação reflete a opinião pessoal do autor sobre o tema, podendo não refletir a posição oficial do Portal Educação.


Colunista Portal - Educação

por Colunista Portal - Educação

O Portal Educação possui uma equipe focada no trabalho de curadoria de conteúdo. Artigos em diversas áreas do conhecimento são produzidos e disponibilizados para profissionais, acadêmicos e interessados em adquirir conhecimento qualificado. O departamento de Conteúdo e Comunicação leva ao leitor informações de alto nível, recebidas e publicadas de colunistas externos e internos.

Portal Educação

UOL CURSOS TECNOLOGIA EDUCACIONAL LTDA, com sede na cidade de São Paulo, SP, na Alameda Barão de Limeira, 425, 7º andar - Santa Cecília CEP 01202-001 CNPJ: 17.543.049/0001-93