SlideShare una empresa de Scribd logo
1 de 32
<<Lenguaje de Marcado de Hipertexto>>
HTML, siglas de HyperText Markup Language («lenguaje de
marcado de hipertexto»), hace referencia al lenguaje de
marcado predominante para la elaboración de páginas web que se
utiliza para describir la estructura y el contenido en forma de texto,
así como para complementar el texto con objetos tales como
imágenes.
El HTML se escribe en forma de «etiquetas», rodeadas
por corchetes angulares (<,>).

HTML también puede describir, hasta un cierto punto, la apariencia
de un documento, y puede incluir un script (por
ejemplo JavaScript), el cual puede afectar el comportamiento de
navegadores web y otros procesadores de HTML.
HTML también sirve para referirse al contenido del tipo de
MIME text/html o todavía más ampliamente como un término
genérico para el HTML, ya sea en forma descendida
delXML (como XHTML 1.0 y posteriores) o en forma descendida
directamente de SGML(como HTML 4.01 y anteriores).
HISTORIA DE HTML

Primeras Especificaciones:

La primera descripción de HTML disponible públicamente fue un documento
llamado HTML Tags (Etiquetas HTML), publicado por primera vez en Internet
por Tim Berners-Lee en 1991.
Describe 22 elementos que incluyen el diseño inicial y relativamente simple de
HTML. Trece de estos elementos todavía existen en HTML 4.
Berners-Lee consideraba a HTML una ampliación de SGML, pero no fue
formalmente reconocida como tal hasta la publicación de mediados de 1993, por
la IETF, de una primera proposición para una especificación de HTML: el
boceto Hypertext Markup Language de Berners-Lee y Dan Connolly, el cual
incluía una Definición de Tipo de Documento SGML para definir la gramática.
El boceto expiró luego de seis meses, pero fue notable por su reconocimiento de
la etiqueta propia del navegador Mosaic usada para insertar imágenes sin
cambio de línea, que reflejaba la filosofía del IETF de basar estándares en
prototipos con éxito.
 De la misma manera, el boceto competidor de Dave Raggett HTML+ (Hypertext
Markup Format) (Formato de Marcaje de Hipertexto), de finales de 1993, sugería
estandarizar características ya implementadas, como las tablas.7
MARCADO HTML

HTML consta de varios componentes vitales, entre ellos los elementos y
sus atributos, tipos de data y la declaración de tipo de documento.

Elementos:
Los elementos son la estructura básica de HTML. Los elementos tienen dos
propiedades básicas: atributos y contenido. Cada atributo y contenido tiene
ciertas restricciones para que se considere válido al documento HTML. Un
elemento generalmente tiene una etiqueta de inicio (por ejemplo, <nombre-de-
elemento>) y una etiqueta de cierre (por ejemplo, </nombre-de-elemento>). Los
atributos del elemento están contenidos en la etiqueta de inicio y el contenido
está ubicado entre las dos etiquetas (por ejemplo, <nombre-de-
elemento        atributo="valor">Contenido</nombre-de-elemento>).        Algunos
elementos, tales como <br>, no tienen contenido ni llevan una etiqueta de cierre.
Debajo se listan varios tipos de elementos de marcado usados en HTML.
El    marcado       estructural  describe   el  propósito    del    texto.   Por
ejemplo,<h2>Golf</h2> establece «Golf» como un encabezamiento de segundo
nivel, el cual se mostraría en un navegador de una manera similar al título
«Marcado HTML» al principio de esta sección.
El marcado estructural no define cómo se verá el elemento, pero la
mayoría de los navegadores web han estandarizado el formato de los
elementos. Puede aplicarse un formato específico al texto por medio
de hojas de estilo en cascada.
El marcado presentacional describe la apariencia del texto, sin importar
su función. Por ejemplo, <b>negrita</b> indica que los navegadores web
visuales deben mostrar el texto en negrita, pero no indica qué deben
hacer los navegadores web que muestran el contenido de otra manera
(por ejemplo, los que leen el texto en voz alta). En el caso
de <b>negrita</b> e <i>itálica</i>, existen elementos que se ven de la
misma       manera      pero     tienen     una      naturaleza    más
semántica: <strong>enfásis fuerte</strong> y <em>énfasis</em>.
Es fácil ver cómo un lector de pantalla debería interpretar estos dos
elementos. Sin embargo, son equivalentes a sus correspondientes
elementos presentacionales: un lector de pantalla no debería decir más
fuerte el nombre de un libro, aunque éste esté en itálicas en una
pantalla. La mayoría del marcado presentacional ha sido desechada con
HTML 4.0, en favor de hojas de estilo en cascada.
El marcado hipertextual se utiliza para enlazar partes del documento con otros
documentos o con otras partes del mismo documento. Para crear un enlace es
necesario utilizar la etiqueta de ancla <a> junto con el atributo href, que
establecerá la dirección URL a la que apunta el enlace. Por ejemplo, un enlace
a la Wikipedia sería de la forma <a href=”es.wikipedia.org”>Wikipedia</a>.
También se pueden crear enlaces sobre otros objetos, tales como imágenes <a
href=”enlace”><img src=”imagen” /></a>.


ATRIBUTOS:
La mayoría de los atributos de un elemento son pares nombre-valor,
separados por un signo de igual «=» y escritos en la etiqueta de comienzo de
un elemento, después del nombre de éste. El valor puede estar rodeado por
comillas dobles o simples, aunque ciertos tipos de valores pueden estar sin
comillas en HTML (pero no en XHTML).De todas maneras, dejar los valores sin
comillas es considerado poco seguro. En contraste con los pares nombre-
elemento, hay algunos atributos que afectan al elemento simplemente por su
presencia(tal como el atributo ismap para el elemento img).
CÓDIGOS HTML BÁSICOS:

 <html>: Define el inicio del documento HTML, le indica
  al navegador que lo que viene a continuación debe ser interpretado
  como código HTML. Esto es así de facto, ya que en teoría lo que define
  el tipo de documento es el DOCTYPE, que significa la palabra justo tras
  DOCTYPE el tag de raíz, por ejemplo:
 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN"
  "http://www.w3.org/TR/html4/strict.dtd">

 <script>: Incrusta un script en una web, o llama a uno
  mediante src="url del script". Se recomienda incluir el tipo MIME en el
  atributo type, en el caso de JavaScript text/javascript.

 <head>: Define la cabecera del documento HTML; esta cabecera suele
  contener información sobre el documento que no se muestra
  directamente al usuario como, por ejemplo, el título de la ventana del
  navegador. Dentro de la cabecera <head> es posible encontrar:

 <title>: Define el título de la página. Por lo general, el título aparece en
  la barra de título encima de la ventana.
 <link>: Para vincular el sitio a hojas de estilo o iconos. Por
  ejemplo:<link rel="stylesheet" href="/style.css" type="text/css">.

 <style>: Para colocar el estilo interno de la página; ya sea
  usandoCSS u otros lenguajes similares. No es necesario colocarlo si
  se va a vincular a un archivo externo usando la etiqueta <link>.

 <meta>: Para metadatos como la autoría o la licencia, incluso para
  indicar parámetros http (mediante http-equiv="") cuando no se pueden
  modificar por no estar disponible la configuración o por dificultades con
  server-side scripting.

 <body>: Define el contenido principal o cuerpo del documento. Esta
  es la parte del documento html que se muestra en el navegador; dentro
  de esta etiqueta pueden definirse propiedades comunes a toda la
  página, como color de fondo y márgenes. Dentro del cuerpo<body> es
  posible encontrar numerosas etiquetas. A continuación se indican
  algunas a modo de ejemplo:
 <h1> a <h6>: encabezados o títulos del documento con diferente relevancia.

   <table>: Define una tabla.
   <tr>: Fila de una tabla.
   <td>: Celda de una tabla (debe estar dentro de una fila).
   <a>: Hipervinculo o enlace, dentro o fuera del sitio web. Debe definirse el
    parámetro de pasada por medio del atributo href. Por ejemplo: <a
    href="http://www.wikipedia.org"       title="Wikipedia"         target="_blank"
    tabindex="1">Wikipedia</a> se representa como Wikipedia).
   <div>: División de la página. Se recomienda, junto con css, en vez
    de <table> cuando se desea alinear contenido.
   <img>: Imagen. Requiere del atributo src, que indica la ruta en la que se
    encuentra la imagen. Por ejemplo: <img src="./imágenes/mifoto.jpg" />. Es
    conveniente, por accesibilidad, poner un atributo alt="texto alternativo".
   <li><ol><ul>: Etiquetas para listas.
   <b>: Texto en negrita (etiqueta desaprobada. Se recomienda usar la
    etiqueta <strong>).
   <i>: Texto en cursiva (etiqueta desaprobada. Se recomienda usar la
    etiqueta <em>).
   <s>: Texto tachado (etiqueta desaprobada. Se recomienda usar la
    etiqueta <del>).
   <u>: Texto subrayado.
 <body>: Define el contenido principal o cuerpo del documento. Esta es la
  parte del documento html que se muestra en el navegador; dentro de esta
  etiqueta pueden definirse propiedades comunes a toda la página,
  como color de fondo y márgenes. Dentro del cuerpo<body> es posible
  encontrar numerosas etiquetas.
 <h1> a <h6>: Encabezados o títulos del documento con diferente
  relevancia.
 <table>: Define una tabla.
 <tr>: Fila de una tabla.
 <td>: Celda de una tabla (debe estar dentro de una fila).
 <div>: División de la página. Se recomienda, junto con css, en vez
  de <table> cuando se desea alinear contenido.
 <img>: Imagen. Requiere del atributo src, que indica la ruta en la que se
  encuentra la imagen. Por ejemplo: <img src="./imágenes/mifoto.jpg" />. Es
  conveniente, por accesibilidad, poner un atributo alt="texto alternativo".
 <li><ol><ul>: Etiquetas para listas.
 <b>: Texto en negrita (etiqueta desaprobada. Se recomienda usar la
  etiqueta <strong>).
 <i>: Texto en cursiva (etiqueta desaprobada. Se recomienda usar la
  etiqueta <em>).
 <s>: Texto tachado (etiqueta desaprobada. Se recomienda usar la
  etiqueta <del>).
 <u>: Texto subrayado.
NOCIONES BÁSICAS DE HTML:


El lenguaje HTML puede ser creado y editado con cualquier editor de textos básico,
como puede ser Gedit en Linux, el Bloc de notasde Windows, o cualquier otro editor
que     admita      texto    sin   formato     como      GNU      Emacs,      Microsoft
Wordpad, TextPad, Vim, Notepad++, entre otros.
Existen, además, otros editores para la realización de sitios web con
características WYSIWYG (What You See Is What You Get, o en español: «lo que
ves es lo que obtienes»). Estos editores permiten ver el resultado de lo que se está
editando en tiempo real, a medida que se va desarrollando el documento. Ahora
bien, esto no significa una manera distinta de realizar sitios web, sino que una forma
un tanto más simple, ya que estos programas, además de tener la opción de trabajar
con la vista preliminar, tiene su propia sección HTML, la cual va generando todo el
código a medida que se va trabajando. Algunos ejemplos de editores WYSIWYG
sonKompoZer, Microsoft FrontPage o Adobe Dreamweaver.
Combinar estos dos métodos resulta muy interesante, ya que de alguna manera se
ayudan entre sí. Por ejemplo, si se edita todo en HTML y de pronto se olvida algún
código o etiqueta, simplemente me dirijo al editor visual o WYSIWYG y se continúa
ahí la edición o viceversa, ya que hay casos en que resulta más rápido y fácil escribir
directamente el código de alguna característica que el usuario desea adherir al sitio
que buscar la opción en el programa mismo.
Existe otro tipo de editores HTML llamados WYSIWYM que dan más
importancia al contenido y al significado que a la apariencia visual. Entre
los objetivos que tienen estos editores es la separación del contenido y la
presentación, fundamental en el diseño web.

HTML utiliza etiquetas o marcas, que consisten en breves instrucciones
de comienzo y final, mediante las cuales se determina la forma en la que
debe aparecer en su navegador el texto, así como también las imágenes
y los demás elementos, en la pantalla del ordenador.
Toda etiqueta se identifica porque está encerrada entre los signos menor
que y mayor que (<>), y algunas tienen atributos que pueden tomar algún
valor. En general las etiquetas se aplicarán de dos formas especiales:

Se abren y se cierran, como por ejemplo: <b>negrita</b>, que se vería
en su navegador web como negrita.
No pueden abrirse y cerrarse, como <hr />, que se vería en su navegador
web como una línea horizontal.
Otras que pueden abrirse y cerrarse, como por ejemplo <p>.
Las etiquetas básicas o mínimas son:

    <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
    "http://www.w3.org/TR/html4/strict.dtd">

   <html lang="es">

    <head>

    <title>Ejemplo</title>

    </head>

    <body>

    <p>ejemplo</p>

    </body>

    </html>
“Lenguajes de Marcas Extensibles””
XML,     siglas en inglés de eXtensible Markup Language (“Lenguaje de Marca
Extensible”), es un lenguaje de marcas desarrollado por el World Wide Web
Consortium(W3C).
Deriva del lenguaje SGML y permite definir la gramática de lenguajes
específicos (de la misma manera que HTML es a su vez un lenguaje definido
por SGML)para estructurar documentos grandes.
 A diferencia de otros lenguajes XML da soporte a bases de datos, siendo útil
cuándo varias aplicaciones se deben comunicar entre sí o integrar información.
(Bases de datos Silberschatz).
XML no ha nacido sólo para su aplicación en Internet, sino que se propone
como un estándar para el intercambio de información estructurada entre
diferentes plataformas. Se puede usar en bases de datos, editores de texto,
hojas de cálculo y casi cualquier cosa imaginable.
XML es una tecnología sencilla que tiene a su alrededor otras que la
complementan y la hacen mucho más grande y con unas posibilidades mucho
mayores.
 Tiene un papel muy importante en la actualidad ya que permite la
compatibilidad entre sistemas para compartir la información de una manera
segura, fiable y fácil.
HISTORIA

XML proviene de un lenguaje inventado por IBM en los años setenta,
llamado GML (Generalized Markup Language), que surgió por la necesidad que
tenía la empresa de almacenar grandes cantidades de información. Este lenguaje
gustó a la ISO, por lo que en 1986 trabajaron para normalizarlo,
creando SGML (Standard Generalized Markup Language), capaz de adaptarse a un
gran abanico de problemas. A partir de él se han creado otros sistemas para
almacenar información.
En el año 1989 Tim Berners Lee creó la web, y junto con ella el lenguaje HTML.
Este lenguaje se definió en el marco de SGML y fue de lejos la aplicación más
conocida de este estándar. Los navegadores web sin embargo siempre han puesto
pocas exigencias al código HTML que interpretan y así las páginas web son
caóticas y no cumplen con la sintaxis. Estas páginas web dependen fuertemente de
una forma específica de lidiar con los errores y las ambigüedades, lo que hace a las
páginas más frágiles y a los navegadores más complejos.
Otra limitación del HTML es que cada documento pertenece a un vocabulario fijo,
establecido por el DTD. No se pueden combinar elementos de diferentes
vocabularios. Asimismo es imposible para un intérprete (por ejemplo un navegador)
analizar el documento sin tener conocimiento de su gramática (del DTD). Por
ejemplo, el navegador sabe que antes de una etiqueta <div> debe haberse cerrado
cualquier <p> previamente abierto. Los navegadores resolvieron esto
incluyendo lógica ad hoc para el HTML, en vez de incluir unanalizador genérico.
Ambas opciones, de todos modos, son muy complejas para los navegadores.
Se buscó entonces definir un subconjunto del SGML que permita:
Mezclar elementos de diferentes lenguajes. Es decir que los lenguajes sean
extensibles.
La creación de analizadores simples, sin ninguna lógica especial para cada lenguaje.
Empezar de cero y hacer hincapié en que no se acepte nunca un documento con
errores de sintaxis.
Para hacer esto XML deja de lado muchas características de SGML que estaban
pensadas para facilitar la escritura manual de documentos. XML en cambio está
orientado a hacer las cosas más sencillas para los programas automáticos que
necesiten interpretar el documento.

CRÍTICAS
XML y sus extensiones han sido regularmente criticadas por su nivel de detalle y
complejidad.2 El mapeo del modelo de árbol básico de XML hacia los sistema de
tipos de lenguajes de programación o bases de datos puede ser difícil,
especialmente cuando se utiliza XML para el intercambio de datos altamente
estructurados entre aplicaciones, lo que no era su objetivo primario de diseño. Otras
críticas   intentan    refutar   la    afirmación   de      que    XML      es   una
lenguaje autodescriptivo (aunque la especificación XML no hace ninguna afirmación
de este tipo). Se propone a JSON y YAML frecuentemente como alternativas,
centrándose ambas en la representación de datos estructurados, en lugar de en
documentos narrativos .
EXTENSIBLE MARKUP LANGUAGE
VENTAJAS DEL XML

 Es extensible: Después de diseñado y puesto en producción, es posible
  extender XML con la adición de nuevas etiquetas, de modo que se
  pueda continuar utilizando sin complicación alguna.

 El analizador es un componente estándar, no es necesario crear un
  analizador específico para cada versión de lenguaje XML.
 Esto posibilita el empleo de cualquiera de los analizadores disponibles.
  De esta manera se evitan bugs y se acelera el desarrollo de
  aplicaciones.
 Si un tercero decide usar un documento creado en XML, es sencillo
  entender su estructura y procesarla.
 Mejora la compatibilidad entre aplicaciones.
 Podemos comunicar aplicaciones de distintas plataformas, sin que
  importe el origen de los datos, es decir, podríamos tener una aplicación
  en Linux con una base de datos Postgres y comunicarla con otra
  aplicación en Windows y Base de Datos MS-SQL Server.

 Transformamos datos en información, pues se le añade un significado
  concreto y los asociamos a un contexto, con lo cual tenemos flexibilidad
  para estructurar documentos.
ESTRUCTURA DE UN DOCUMENTO XML


La tecnología XML busca dar solución al problema de expresar información
estructurada de la manera más abstracta y reutilizable posible.
Que la información sea estructurada quiere decir que se compone de partes
bien definidas, y que esas partes se componen a su vez de otras partes.
Entonces se tiene un árbol de trozos de información.

Ejemplos son un tema musical, que se compone de compases, que están
formados a su vez por notas.
Estas partes se llaman elementos, y se las señala mediante etiquetas.
Una etiqueta consiste en una marca hecha en el documento, que señala una
porción de éste como un elemento.

 Un pedazo de información con un sentido claro y definido. Las etiquetas
tienen la forma <nombre>, donde nombre es el nombre del elemento que se
está señalando.
A continuación se muestra un ejemplo para entender la estructura de un
documento XML:
<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE Edit_Mensaje SYSTEM "Edit_Mensaje.dtd">

•   <Edit_Mensaje>
•    <Mensaje>
•    <Remitente>
•     <Nombre>Nombre del remitente</Nombre>
•      <Mail> Correo del remitente </Mail>
•      </Remitente>
•       <Destinatario>
•        <Nombre>Nombre del destinatario</Nombre>
•         <Mail>Correo del destinatario</Mail>
•         </Destinatario>
•    <Texto>
•     <Asunto>
•              Este es mi documento con una estructura muy sencilla
•              no contiene atributos ni entidades...
•      </Asunto>
•         <Parrafo>
•              Este es mi documento con una estructura muy sencilla
•              no contiene atributos ni entidades...
•         </Parrafo>
•    </Texto>
•    </Mensaje>
•   </Edit_Mensaje>
DOCUMENTOS XML BIEN FORMADOS Y CONTROL DE
                      ERRORES


Los documentos denominados como «bien formados» (del inglés well formed) son
aquellos que cumplen con todas las definiciones básicas de formato y pueden, por lo
tanto, analizarse correctamente por cualquier analizador sintáctico (parser) que cumpla
con la norma. Se separa esto del concepto de validez que se explica más adelante.
Los documentos han de seguir una estructura estrictamente jerárquica con lo que
respecta a las etiquetas que delimitan sus elementos. Una etiqueta debe estar
correctamente incluida en otra, es decir, las etiquetas deben estar correctamente
anidadas. Los elementos con contenido deben estar correctamente cerrados.
Los documentos XML sólo permiten un elemento raíz del que todos los demás sean
parte, es decir, solo pueden tener un elemento inicial.
Los valores atributos en XML siempre deben estar encerrados entre comillas simples o
dobles.
El XML es sensible a mayúsculas y minúsculas. Existe un conjunto de caracteres
llamados espacios en blanco (espacios, tabuladores, retornos de carro, saltos de línea)
que los procesadores XML tratan de forma diferente en el marcado XML.
Es necesario asignar nombres a las estructuras, tipos de elementos, entidades,
elementos particulares, etc. En XML los nombres tienen alguna característica en
común.
PARTES DE UN DOCUMENTO XML

Un documento XML está formado por el prólogo y por el cuerpo del
documento así como texto de etiquetas que contiene una gran
variedad de efectos positivos o negativos en la referencia opcional a la
que se refiere el documento, hay que tener mucho cuidado de esa
parte de la gramática léxica para que se componga de manera
uniforme.

PRÓLOGO
Aunque no es obligatorio, los documentos XML pueden empezar con
unas líneas que describen la versión XML, el tipo de documento y otras
cosas.
El prólogo de un documento XML contiene:
Una declaración XML. Es la sentencia que declara al documento como
un documento XML.
Una declaración de tipo de documento. Enlaza el documento con
su DTD (definición de tipo de documento), o el DTD puede estar
incluido en la propia declaración o ambas cosas al mismo tiempo.
Uno o más comentarios e instrucciones de procesamiento.
VALIDEZ

Que un documento esté «bien formado» solamente se refiere a su estructura
sintáctica básica, es decir, que se componga de elementos, atributos y
comentarios como XML especifica que se escriban. Ahora bien, cada
aplicación de XML, es decir, cada lenguaje definido con esta tecnología,
necesitará especificar cuál es exactamente la relación que debe verificarse
entre los distintos elementos presentes en el documento.
Esta relación entre elementos se especifica en un documento externo o
definición (expresada como DTD —Document Type Definition, 'Definición de
Tipo de Documento'— o como XSchema). Crear una definición equivale a
crear un nuevo lenguaje de marcado, para una aplicación específica.

 DECLARACIONES TIPO ELEMENTO
Los elementos deben ajustarse a un tipo de documento declarado en una DTD
para que el documento sea considerado como válido.
 MODELOS DE CONTENIDO
Un modelo de contenido es un patrón que establece los subelementos
aceptados, y el orden en que se aceptan.
 DECLARACIONES DE LISTA DE ATRIBUTOS
Los atributos se usan para añadir información adicional a los elementos de un
documento.
   TIPOS DE ATRIBUTOS
•   Atributos CDATA y NMTOKEN
•   Atributos enumerados y notaciones
•   Atributos ID e IDREF

 DECLARACIÓN DE ENTIDADES
XML hace referencia a objetos que no deben ser analizados sintácticamente según las
reglas XML, mediante el uso de entidades. Las entidades pueden ser:
Internas o externas
Analizadas o no analizadas
Generales o parametrizadas

 ESPACIOS DE NOMBRES
Los espacios de nombres XML permiten separar semánticamente los elementos que
forman un documento XML.

 XML SCHEMAS (XSD)
Un Schema es algo similar a un DTD. Define qué elementos puede contener un
documento XML, cómo están organizados y qué atributos y de qué tipo pueden tener
sus elementos.

 VENTAJAS DE LOS SCHEMAS FRENTE A LOS DTD
Usan sintaxis de XML, al contrario que los DTD.
Permiten especificar los tipos de datos.
Son extensibles.

Más contenido relacionado

La actualidad más candente (19)

Emily
EmilyEmily
Emily
 
Html presentacion
Html presentacionHtml presentacion
Html presentacion
 
Lenguajes de programacion
Lenguajes de programacionLenguajes de programacion
Lenguajes de programacion
 
Qué es el html
Qué es el htmlQué es el html
Qué es el html
 
Html Exposicion
Html ExposicionHtml Exposicion
Html Exposicion
 
C2 lenguaje html
C2 lenguaje htmlC2 lenguaje html
C2 lenguaje html
 
Html
HtmlHtml
Html
 
Html
HtmlHtml
Html
 
HTML HyperText Markup Language
HTML HyperText Markup LanguageHTML HyperText Markup Language
HTML HyperText Markup Language
 
C3 lenguaje de presentación.
C3 lenguaje de presentación.C3 lenguaje de presentación.
C3 lenguaje de presentación.
 
Html, Css y JavaScript
Html, Css y JavaScriptHtml, Css y JavaScript
Html, Css y JavaScript
 
Israel
IsraelIsrael
Israel
 
05 Introduccion a HTML
05 Introduccion a HTML05 Introduccion a HTML
05 Introduccion a HTML
 
Html
HtmlHtml
Html
 
HTML
HTMLHTML
HTML
 
El lenguaje html
El lenguaje htmlEl lenguaje html
El lenguaje html
 
Introducción a XHTML
Introducción a XHTMLIntroducción a XHTML
Introducción a XHTML
 
El lenguaje html
El lenguaje htmlEl lenguaje html
El lenguaje html
 
Presentación Introducción al lenguaje HTML
Presentación Introducción al lenguaje HTMLPresentación Introducción al lenguaje HTML
Presentación Introducción al lenguaje HTML
 

Destacado (10)

La web 2.0
La web 2.0La web 2.0
La web 2.0
 
Internet 1
Internet 1Internet 1
Internet 1
 
Html y xml
Html y xmlHtml y xml
Html y xml
 
Html y xml
Html y xmlHtml y xml
Html y xml
 
Diferencias entre XML y HTML
Diferencias entre XML y HTMLDiferencias entre XML y HTML
Diferencias entre XML y HTML
 
XML: HTML y XHTML
XML: HTML y XHTMLXML: HTML y XHTML
XML: HTML y XHTML
 
El uso de internet en la vida cotidiana
El uso de internet en la vida cotidianaEl uso de internet en la vida cotidiana
El uso de internet en la vida cotidiana
 
Internet y sus servicios
Internet y sus serviciosInternet y sus servicios
Internet y sus servicios
 
Internet ppt
Internet pptInternet ppt
Internet ppt
 
Ppt on internet
Ppt on internetPpt on internet
Ppt on internet
 

Similar a Investigacion de html y xml

Similar a Investigacion de html y xml (20)

danny
dannydanny
danny
 
Israel
IsraelIsrael
Israel
 
etiquetas basicas de html
etiquetas basicas de htmletiquetas basicas de html
etiquetas basicas de html
 
Html y xml
Html y xmlHtml y xml
Html y xml
 
Html geraly fernanda cabrera aldana
Html geraly fernanda cabrera aldanaHtml geraly fernanda cabrera aldana
Html geraly fernanda cabrera aldana
 
Html y HTML5
Html y HTML5Html y HTML5
Html y HTML5
 
Produccion de material educ. diapositivas html
Produccion de material educ. diapositivas htmlProduccion de material educ. diapositivas html
Produccion de material educ. diapositivas html
 
Trabajo practico 2
Trabajo practico 2Trabajo practico 2
Trabajo practico 2
 
Trabajo practico 2
Trabajo practico 2Trabajo practico 2
Trabajo practico 2
 
Trabajo practico 2
Trabajo practico 2Trabajo practico 2
Trabajo practico 2
 
Html
HtmlHtml
Html
 
Diferencia entre html y xml
Diferencia  entre html y xmlDiferencia  entre html y xml
Diferencia entre html y xml
 
Clase HTML.pptx
Clase HTML.pptxClase HTML.pptx
Clase HTML.pptx
 
Html
HtmlHtml
Html
 
El código html
El código htmlEl código html
El código html
 
Julexi
JulexiJulexi
Julexi
 
Etiquetas Html
Etiquetas HtmlEtiquetas Html
Etiquetas Html
 
Html 121
Html 121Html 121
Html 121
 
1.3.2 elementos del lenguaje html
1.3.2 elementos del lenguaje html1.3.2 elementos del lenguaje html
1.3.2 elementos del lenguaje html
 
H T M L E X P O S I C I O N
H T M L  E X P O S I C I O NH T M L  E X P O S I C I O N
H T M L E X P O S I C I O N
 

Investigacion de html y xml

  • 1. <<Lenguaje de Marcado de Hipertexto>>
  • 2. HTML, siglas de HyperText Markup Language («lenguaje de marcado de hipertexto»), hace referencia al lenguaje de marcado predominante para la elaboración de páginas web que se utiliza para describir la estructura y el contenido en forma de texto, así como para complementar el texto con objetos tales como imágenes. El HTML se escribe en forma de «etiquetas», rodeadas por corchetes angulares (<,>). HTML también puede describir, hasta un cierto punto, la apariencia de un documento, y puede incluir un script (por ejemplo JavaScript), el cual puede afectar el comportamiento de navegadores web y otros procesadores de HTML. HTML también sirve para referirse al contenido del tipo de MIME text/html o todavía más ampliamente como un término genérico para el HTML, ya sea en forma descendida delXML (como XHTML 1.0 y posteriores) o en forma descendida directamente de SGML(como HTML 4.01 y anteriores).
  • 3.
  • 4. HISTORIA DE HTML Primeras Especificaciones: La primera descripción de HTML disponible públicamente fue un documento llamado HTML Tags (Etiquetas HTML), publicado por primera vez en Internet por Tim Berners-Lee en 1991. Describe 22 elementos que incluyen el diseño inicial y relativamente simple de HTML. Trece de estos elementos todavía existen en HTML 4. Berners-Lee consideraba a HTML una ampliación de SGML, pero no fue formalmente reconocida como tal hasta la publicación de mediados de 1993, por la IETF, de una primera proposición para una especificación de HTML: el boceto Hypertext Markup Language de Berners-Lee y Dan Connolly, el cual incluía una Definición de Tipo de Documento SGML para definir la gramática. El boceto expiró luego de seis meses, pero fue notable por su reconocimiento de la etiqueta propia del navegador Mosaic usada para insertar imágenes sin cambio de línea, que reflejaba la filosofía del IETF de basar estándares en prototipos con éxito. De la misma manera, el boceto competidor de Dave Raggett HTML+ (Hypertext Markup Format) (Formato de Marcaje de Hipertexto), de finales de 1993, sugería estandarizar características ya implementadas, como las tablas.7
  • 5.
  • 6. MARCADO HTML HTML consta de varios componentes vitales, entre ellos los elementos y sus atributos, tipos de data y la declaración de tipo de documento. Elementos: Los elementos son la estructura básica de HTML. Los elementos tienen dos propiedades básicas: atributos y contenido. Cada atributo y contenido tiene ciertas restricciones para que se considere válido al documento HTML. Un elemento generalmente tiene una etiqueta de inicio (por ejemplo, <nombre-de- elemento>) y una etiqueta de cierre (por ejemplo, </nombre-de-elemento>). Los atributos del elemento están contenidos en la etiqueta de inicio y el contenido está ubicado entre las dos etiquetas (por ejemplo, <nombre-de- elemento atributo="valor">Contenido</nombre-de-elemento>). Algunos elementos, tales como <br>, no tienen contenido ni llevan una etiqueta de cierre. Debajo se listan varios tipos de elementos de marcado usados en HTML. El marcado estructural describe el propósito del texto. Por ejemplo,<h2>Golf</h2> establece «Golf» como un encabezamiento de segundo nivel, el cual se mostraría en un navegador de una manera similar al título «Marcado HTML» al principio de esta sección.
  • 7. El marcado estructural no define cómo se verá el elemento, pero la mayoría de los navegadores web han estandarizado el formato de los elementos. Puede aplicarse un formato específico al texto por medio de hojas de estilo en cascada. El marcado presentacional describe la apariencia del texto, sin importar su función. Por ejemplo, <b>negrita</b> indica que los navegadores web visuales deben mostrar el texto en negrita, pero no indica qué deben hacer los navegadores web que muestran el contenido de otra manera (por ejemplo, los que leen el texto en voz alta). En el caso de <b>negrita</b> e <i>itálica</i>, existen elementos que se ven de la misma manera pero tienen una naturaleza más semántica: <strong>enfásis fuerte</strong> y <em>énfasis</em>. Es fácil ver cómo un lector de pantalla debería interpretar estos dos elementos. Sin embargo, son equivalentes a sus correspondientes elementos presentacionales: un lector de pantalla no debería decir más fuerte el nombre de un libro, aunque éste esté en itálicas en una pantalla. La mayoría del marcado presentacional ha sido desechada con HTML 4.0, en favor de hojas de estilo en cascada.
  • 8. El marcado hipertextual se utiliza para enlazar partes del documento con otros documentos o con otras partes del mismo documento. Para crear un enlace es necesario utilizar la etiqueta de ancla <a> junto con el atributo href, que establecerá la dirección URL a la que apunta el enlace. Por ejemplo, un enlace a la Wikipedia sería de la forma <a href=”es.wikipedia.org”>Wikipedia</a>. También se pueden crear enlaces sobre otros objetos, tales como imágenes <a href=”enlace”><img src=”imagen” /></a>. ATRIBUTOS: La mayoría de los atributos de un elemento son pares nombre-valor, separados por un signo de igual «=» y escritos en la etiqueta de comienzo de un elemento, después del nombre de éste. El valor puede estar rodeado por comillas dobles o simples, aunque ciertos tipos de valores pueden estar sin comillas en HTML (pero no en XHTML).De todas maneras, dejar los valores sin comillas es considerado poco seguro. En contraste con los pares nombre- elemento, hay algunos atributos que afectan al elemento simplemente por su presencia(tal como el atributo ismap para el elemento img).
  • 9. CÓDIGOS HTML BÁSICOS:  <html>: Define el inicio del documento HTML, le indica al navegador que lo que viene a continuación debe ser interpretado como código HTML. Esto es así de facto, ya que en teoría lo que define el tipo de documento es el DOCTYPE, que significa la palabra justo tras DOCTYPE el tag de raíz, por ejemplo:  <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Strict//EN" "http://www.w3.org/TR/html4/strict.dtd">  <script>: Incrusta un script en una web, o llama a uno mediante src="url del script". Se recomienda incluir el tipo MIME en el atributo type, en el caso de JavaScript text/javascript.  <head>: Define la cabecera del documento HTML; esta cabecera suele contener información sobre el documento que no se muestra directamente al usuario como, por ejemplo, el título de la ventana del navegador. Dentro de la cabecera <head> es posible encontrar:  <title>: Define el título de la página. Por lo general, el título aparece en la barra de título encima de la ventana.
  • 10.  <link>: Para vincular el sitio a hojas de estilo o iconos. Por ejemplo:<link rel="stylesheet" href="/style.css" type="text/css">.  <style>: Para colocar el estilo interno de la página; ya sea usandoCSS u otros lenguajes similares. No es necesario colocarlo si se va a vincular a un archivo externo usando la etiqueta <link>.  <meta>: Para metadatos como la autoría o la licencia, incluso para indicar parámetros http (mediante http-equiv="") cuando no se pueden modificar por no estar disponible la configuración o por dificultades con server-side scripting.  <body>: Define el contenido principal o cuerpo del documento. Esta es la parte del documento html que se muestra en el navegador; dentro de esta etiqueta pueden definirse propiedades comunes a toda la página, como color de fondo y márgenes. Dentro del cuerpo<body> es posible encontrar numerosas etiquetas. A continuación se indican algunas a modo de ejemplo:
  • 11.  <h1> a <h6>: encabezados o títulos del documento con diferente relevancia.  <table>: Define una tabla.  <tr>: Fila de una tabla.  <td>: Celda de una tabla (debe estar dentro de una fila).  <a>: Hipervinculo o enlace, dentro o fuera del sitio web. Debe definirse el parámetro de pasada por medio del atributo href. Por ejemplo: <a href="http://www.wikipedia.org" title="Wikipedia" target="_blank" tabindex="1">Wikipedia</a> se representa como Wikipedia).  <div>: División de la página. Se recomienda, junto con css, en vez de <table> cuando se desea alinear contenido.  <img>: Imagen. Requiere del atributo src, que indica la ruta en la que se encuentra la imagen. Por ejemplo: <img src="./imágenes/mifoto.jpg" />. Es conveniente, por accesibilidad, poner un atributo alt="texto alternativo".  <li><ol><ul>: Etiquetas para listas.  <b>: Texto en negrita (etiqueta desaprobada. Se recomienda usar la etiqueta <strong>).  <i>: Texto en cursiva (etiqueta desaprobada. Se recomienda usar la etiqueta <em>).  <s>: Texto tachado (etiqueta desaprobada. Se recomienda usar la etiqueta <del>).  <u>: Texto subrayado.
  • 12.
  • 13.  <body>: Define el contenido principal o cuerpo del documento. Esta es la parte del documento html que se muestra en el navegador; dentro de esta etiqueta pueden definirse propiedades comunes a toda la página, como color de fondo y márgenes. Dentro del cuerpo<body> es posible encontrar numerosas etiquetas.  <h1> a <h6>: Encabezados o títulos del documento con diferente relevancia.  <table>: Define una tabla.  <tr>: Fila de una tabla.  <td>: Celda de una tabla (debe estar dentro de una fila).  <div>: División de la página. Se recomienda, junto con css, en vez de <table> cuando se desea alinear contenido.  <img>: Imagen. Requiere del atributo src, que indica la ruta en la que se encuentra la imagen. Por ejemplo: <img src="./imágenes/mifoto.jpg" />. Es conveniente, por accesibilidad, poner un atributo alt="texto alternativo".  <li><ol><ul>: Etiquetas para listas.  <b>: Texto en negrita (etiqueta desaprobada. Se recomienda usar la etiqueta <strong>).  <i>: Texto en cursiva (etiqueta desaprobada. Se recomienda usar la etiqueta <em>).  <s>: Texto tachado (etiqueta desaprobada. Se recomienda usar la etiqueta <del>).  <u>: Texto subrayado.
  • 14. NOCIONES BÁSICAS DE HTML: El lenguaje HTML puede ser creado y editado con cualquier editor de textos básico, como puede ser Gedit en Linux, el Bloc de notasde Windows, o cualquier otro editor que admita texto sin formato como GNU Emacs, Microsoft Wordpad, TextPad, Vim, Notepad++, entre otros. Existen, además, otros editores para la realización de sitios web con características WYSIWYG (What You See Is What You Get, o en español: «lo que ves es lo que obtienes»). Estos editores permiten ver el resultado de lo que se está editando en tiempo real, a medida que se va desarrollando el documento. Ahora bien, esto no significa una manera distinta de realizar sitios web, sino que una forma un tanto más simple, ya que estos programas, además de tener la opción de trabajar con la vista preliminar, tiene su propia sección HTML, la cual va generando todo el código a medida que se va trabajando. Algunos ejemplos de editores WYSIWYG sonKompoZer, Microsoft FrontPage o Adobe Dreamweaver. Combinar estos dos métodos resulta muy interesante, ya que de alguna manera se ayudan entre sí. Por ejemplo, si se edita todo en HTML y de pronto se olvida algún código o etiqueta, simplemente me dirijo al editor visual o WYSIWYG y se continúa ahí la edición o viceversa, ya que hay casos en que resulta más rápido y fácil escribir directamente el código de alguna característica que el usuario desea adherir al sitio que buscar la opción en el programa mismo.
  • 15. Existe otro tipo de editores HTML llamados WYSIWYM que dan más importancia al contenido y al significado que a la apariencia visual. Entre los objetivos que tienen estos editores es la separación del contenido y la presentación, fundamental en el diseño web. HTML utiliza etiquetas o marcas, que consisten en breves instrucciones de comienzo y final, mediante las cuales se determina la forma en la que debe aparecer en su navegador el texto, así como también las imágenes y los demás elementos, en la pantalla del ordenador. Toda etiqueta se identifica porque está encerrada entre los signos menor que y mayor que (<>), y algunas tienen atributos que pueden tomar algún valor. En general las etiquetas se aplicarán de dos formas especiales: Se abren y se cierran, como por ejemplo: <b>negrita</b>, que se vería en su navegador web como negrita. No pueden abrirse y cerrarse, como <hr />, que se vería en su navegador web como una línea horizontal. Otras que pueden abrirse y cerrarse, como por ejemplo <p>.
  • 16. Las etiquetas básicas o mínimas son:  <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">  <html lang="es">  <head>  <title>Ejemplo</title>  </head>  <body>  <p>ejemplo</p>  </body>  </html>
  • 17.
  • 18. “Lenguajes de Marcas Extensibles””
  • 19. XML, siglas en inglés de eXtensible Markup Language (“Lenguaje de Marca Extensible”), es un lenguaje de marcas desarrollado por el World Wide Web Consortium(W3C). Deriva del lenguaje SGML y permite definir la gramática de lenguajes específicos (de la misma manera que HTML es a su vez un lenguaje definido por SGML)para estructurar documentos grandes. A diferencia de otros lenguajes XML da soporte a bases de datos, siendo útil cuándo varias aplicaciones se deben comunicar entre sí o integrar información. (Bases de datos Silberschatz). XML no ha nacido sólo para su aplicación en Internet, sino que se propone como un estándar para el intercambio de información estructurada entre diferentes plataformas. Se puede usar en bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable. XML es una tecnología sencilla que tiene a su alrededor otras que la complementan y la hacen mucho más grande y con unas posibilidades mucho mayores. Tiene un papel muy importante en la actualidad ya que permite la compatibilidad entre sistemas para compartir la información de una manera segura, fiable y fácil.
  • 20.
  • 21. HISTORIA XML proviene de un lenguaje inventado por IBM en los años setenta, llamado GML (Generalized Markup Language), que surgió por la necesidad que tenía la empresa de almacenar grandes cantidades de información. Este lenguaje gustó a la ISO, por lo que en 1986 trabajaron para normalizarlo, creando SGML (Standard Generalized Markup Language), capaz de adaptarse a un gran abanico de problemas. A partir de él se han creado otros sistemas para almacenar información. En el año 1989 Tim Berners Lee creó la web, y junto con ella el lenguaje HTML. Este lenguaje se definió en el marco de SGML y fue de lejos la aplicación más conocida de este estándar. Los navegadores web sin embargo siempre han puesto pocas exigencias al código HTML que interpretan y así las páginas web son caóticas y no cumplen con la sintaxis. Estas páginas web dependen fuertemente de una forma específica de lidiar con los errores y las ambigüedades, lo que hace a las páginas más frágiles y a los navegadores más complejos. Otra limitación del HTML es que cada documento pertenece a un vocabulario fijo, establecido por el DTD. No se pueden combinar elementos de diferentes vocabularios. Asimismo es imposible para un intérprete (por ejemplo un navegador) analizar el documento sin tener conocimiento de su gramática (del DTD). Por ejemplo, el navegador sabe que antes de una etiqueta <div> debe haberse cerrado cualquier <p> previamente abierto. Los navegadores resolvieron esto incluyendo lógica ad hoc para el HTML, en vez de incluir unanalizador genérico. Ambas opciones, de todos modos, son muy complejas para los navegadores.
  • 22. Se buscó entonces definir un subconjunto del SGML que permita: Mezclar elementos de diferentes lenguajes. Es decir que los lenguajes sean extensibles. La creación de analizadores simples, sin ninguna lógica especial para cada lenguaje. Empezar de cero y hacer hincapié en que no se acepte nunca un documento con errores de sintaxis. Para hacer esto XML deja de lado muchas características de SGML que estaban pensadas para facilitar la escritura manual de documentos. XML en cambio está orientado a hacer las cosas más sencillas para los programas automáticos que necesiten interpretar el documento. CRÍTICAS XML y sus extensiones han sido regularmente criticadas por su nivel de detalle y complejidad.2 El mapeo del modelo de árbol básico de XML hacia los sistema de tipos de lenguajes de programación o bases de datos puede ser difícil, especialmente cuando se utiliza XML para el intercambio de datos altamente estructurados entre aplicaciones, lo que no era su objetivo primario de diseño. Otras críticas intentan refutar la afirmación de que XML es una lenguaje autodescriptivo (aunque la especificación XML no hace ninguna afirmación de este tipo). Se propone a JSON y YAML frecuentemente como alternativas, centrándose ambas en la representación de datos estructurados, en lugar de en documentos narrativos .
  • 24. VENTAJAS DEL XML  Es extensible: Después de diseñado y puesto en producción, es posible extender XML con la adición de nuevas etiquetas, de modo que se pueda continuar utilizando sin complicación alguna.  El analizador es un componente estándar, no es necesario crear un analizador específico para cada versión de lenguaje XML.  Esto posibilita el empleo de cualquiera de los analizadores disponibles. De esta manera se evitan bugs y se acelera el desarrollo de aplicaciones.  Si un tercero decide usar un documento creado en XML, es sencillo entender su estructura y procesarla.  Mejora la compatibilidad entre aplicaciones.  Podemos comunicar aplicaciones de distintas plataformas, sin que importe el origen de los datos, es decir, podríamos tener una aplicación en Linux con una base de datos Postgres y comunicarla con otra aplicación en Windows y Base de Datos MS-SQL Server.  Transformamos datos en información, pues se le añade un significado concreto y los asociamos a un contexto, con lo cual tenemos flexibilidad para estructurar documentos.
  • 25.
  • 26. ESTRUCTURA DE UN DOCUMENTO XML La tecnología XML busca dar solución al problema de expresar información estructurada de la manera más abstracta y reutilizable posible. Que la información sea estructurada quiere decir que se compone de partes bien definidas, y que esas partes se componen a su vez de otras partes. Entonces se tiene un árbol de trozos de información. Ejemplos son un tema musical, que se compone de compases, que están formados a su vez por notas. Estas partes se llaman elementos, y se las señala mediante etiquetas. Una etiqueta consiste en una marca hecha en el documento, que señala una porción de éste como un elemento. Un pedazo de información con un sentido claro y definido. Las etiquetas tienen la forma <nombre>, donde nombre es el nombre del elemento que se está señalando. A continuación se muestra un ejemplo para entender la estructura de un documento XML:
  • 27. <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE Edit_Mensaje SYSTEM "Edit_Mensaje.dtd"> • <Edit_Mensaje> • <Mensaje> • <Remitente> • <Nombre>Nombre del remitente</Nombre> • <Mail> Correo del remitente </Mail> • </Remitente> • <Destinatario> • <Nombre>Nombre del destinatario</Nombre> • <Mail>Correo del destinatario</Mail> • </Destinatario> • <Texto> • <Asunto> • Este es mi documento con una estructura muy sencilla • no contiene atributos ni entidades... • </Asunto> • <Parrafo> • Este es mi documento con una estructura muy sencilla • no contiene atributos ni entidades... • </Parrafo> • </Texto> • </Mensaje> • </Edit_Mensaje>
  • 28.
  • 29. DOCUMENTOS XML BIEN FORMADOS Y CONTROL DE ERRORES Los documentos denominados como «bien formados» (del inglés well formed) son aquellos que cumplen con todas las definiciones básicas de formato y pueden, por lo tanto, analizarse correctamente por cualquier analizador sintáctico (parser) que cumpla con la norma. Se separa esto del concepto de validez que se explica más adelante. Los documentos han de seguir una estructura estrictamente jerárquica con lo que respecta a las etiquetas que delimitan sus elementos. Una etiqueta debe estar correctamente incluida en otra, es decir, las etiquetas deben estar correctamente anidadas. Los elementos con contenido deben estar correctamente cerrados. Los documentos XML sólo permiten un elemento raíz del que todos los demás sean parte, es decir, solo pueden tener un elemento inicial. Los valores atributos en XML siempre deben estar encerrados entre comillas simples o dobles. El XML es sensible a mayúsculas y minúsculas. Existe un conjunto de caracteres llamados espacios en blanco (espacios, tabuladores, retornos de carro, saltos de línea) que los procesadores XML tratan de forma diferente en el marcado XML. Es necesario asignar nombres a las estructuras, tipos de elementos, entidades, elementos particulares, etc. En XML los nombres tienen alguna característica en común.
  • 30. PARTES DE UN DOCUMENTO XML Un documento XML está formado por el prólogo y por el cuerpo del documento así como texto de etiquetas que contiene una gran variedad de efectos positivos o negativos en la referencia opcional a la que se refiere el documento, hay que tener mucho cuidado de esa parte de la gramática léxica para que se componga de manera uniforme. PRÓLOGO Aunque no es obligatorio, los documentos XML pueden empezar con unas líneas que describen la versión XML, el tipo de documento y otras cosas. El prólogo de un documento XML contiene: Una declaración XML. Es la sentencia que declara al documento como un documento XML. Una declaración de tipo de documento. Enlaza el documento con su DTD (definición de tipo de documento), o el DTD puede estar incluido en la propia declaración o ambas cosas al mismo tiempo. Uno o más comentarios e instrucciones de procesamiento.
  • 31. VALIDEZ Que un documento esté «bien formado» solamente se refiere a su estructura sintáctica básica, es decir, que se componga de elementos, atributos y comentarios como XML especifica que se escriban. Ahora bien, cada aplicación de XML, es decir, cada lenguaje definido con esta tecnología, necesitará especificar cuál es exactamente la relación que debe verificarse entre los distintos elementos presentes en el documento. Esta relación entre elementos se especifica en un documento externo o definición (expresada como DTD —Document Type Definition, 'Definición de Tipo de Documento'— o como XSchema). Crear una definición equivale a crear un nuevo lenguaje de marcado, para una aplicación específica.  DECLARACIONES TIPO ELEMENTO Los elementos deben ajustarse a un tipo de documento declarado en una DTD para que el documento sea considerado como válido.  MODELOS DE CONTENIDO Un modelo de contenido es un patrón que establece los subelementos aceptados, y el orden en que se aceptan.  DECLARACIONES DE LISTA DE ATRIBUTOS Los atributos se usan para añadir información adicional a los elementos de un documento.
  • 32. TIPOS DE ATRIBUTOS • Atributos CDATA y NMTOKEN • Atributos enumerados y notaciones • Atributos ID e IDREF  DECLARACIÓN DE ENTIDADES XML hace referencia a objetos que no deben ser analizados sintácticamente según las reglas XML, mediante el uso de entidades. Las entidades pueden ser: Internas o externas Analizadas o no analizadas Generales o parametrizadas  ESPACIOS DE NOMBRES Los espacios de nombres XML permiten separar semánticamente los elementos que forman un documento XML.  XML SCHEMAS (XSD) Un Schema es algo similar a un DTD. Define qué elementos puede contener un documento XML, cómo están organizados y qué atributos y de qué tipo pueden tener sus elementos.  VENTAJAS DE LOS SCHEMAS FRENTE A LOS DTD Usan sintaxis de XML, al contrario que los DTD. Permiten especificar los tipos de datos. Son extensibles.