Los formatos

El objetivo final de la iniciativa es lograr la publicación de la mayor cantidad posible de datos, empleando formatos estructurados, preferiblemente no propietarios y procesables de forma automática.

Cuanto mejor estructurados y enriquecidos estén los datos más fácil será su reutilización y la construcción de aplicaciones para su tratamiento automatizado. El uso de formatos estándar abiertos permitirá que los datos sean tratados con diversos tipos de herramientas sin necesidad de tener que adquirir licencias de uso.

Entre los formatos abiertos más comunes en que se pueden distribuir los datos destacamos los siguientes:

CSV (Comma- Separated Values): es un formato simple para el almacenamiento de datos tabulares en texto plano que se utiliza frecuentemente para el intercambio de información entre distintas hojas de cálculo que utilizan otros formatos propietarios.
HTML (HyperText Markup Language): lenguaje utilizado para describir la estructura y el contenido en forma de texto, así como para complementar el texto con objetos tales como imágenes, en la elaboración de páginas web.
JSON (JavaScript Object Notation): es un formato utilizado para intercambio de datos, siendo un subconjunto de la notación literal de objetos de JavaScript, pero independiente de lenguaje. Su empleo evita el uso de XML y se hizo muy popular sobre todo entre desarrollos AJAX.
KML (Keyhole Markup Language) KMZ (Keyhole Markup Language compressed): formato XML para la creación de modelos y almacenamiento de funciones geográficas como puntos, líneas, imágenes, polígonos y modelos. Se emplean principalmente para compartir mapas e información geográfica. Es el estándar del Open Geospatial Consortium y puede emplearse a través de Google Earth. Los ficheros KML habitualmente se distribuyen comprimidos como archivos KMZ.
ODS (OpenDocument Spreadsheet): formato de datos abierto y estándar, se emplea para el almacenamiento de hojas de cálculo que muestran información en celdas organizadas en filas y columnas. Cada una de esas celdas contiene datos o fórmulas con referencias - relativas o absolutas - a otras celdas.
RDF (Resource Description Framework): no es un formato en sí mismo, sino que define un framework de metadatos, como lenguaje para representar la información en la web. Es un modelo universal que permite intercambiar y enlazar a través de diferentes aplicaciones datos y recursos sin que pierdan su significado, lo que facilita la reutilización y el enriquecimiento de los recursos en la web. RDF se representa a través de diversas serializaciones, siendo la más habitual la que emplea la notación XML/RDF.
RSS (Really Simple Sindication): es un vocabulario que permite la catalogación de información de manera que sea posible encontrar información precisa adaptada a las preferencias de los/as usuarios/as. Los archivos RSS contienen metadatos sobre fuentes de información especificadas por los/as usuarios/as cuya función principal es avisarles de que los recursos que ellos/as seleccionaron para formar parte de ese RSS fueron actualizados sin necesidad de comprobar directamente la fuente, es decir, notifican de forma automática cualquier cambio que se realice en esos recursos.
SOAP (Simple Object Access Protocol): es uno de los protocolos abiertos utilizados en los servicios web, definiendo cómo dos objetos en diferentes procesos pueden comunicarse intercambiando datos XML.
WFS (Web Feature Service): servicio web que permite interactuar con los mapas servidos por WMS utilizando el lenguaje GML, derivado de XML. Permite recuperar datos vectoriales y la información alfanumérica ligada a los mismos y realizar consultas tanto espaciales como alfanuméricas. Su especificación está recogida en OGC (Open Geoespatial Consortium).
WMS (Web Map Service): servicio web en formato abierto estándar que produce vía http mapas de datos referenciados espacialmente, de forma dinámica a partir de información geográfica. Su especificación está recogida en OGC (Open Geoespatial Consortium).
XML (eXtensible Markup Language): es un metalenguaje extensible de etiquetas, entendido como una manera de definir lenguajes para diferentes necesidades, y particularmente para el intercambio de información estructurada entre diferentes plataformas. Describe los datos de forma que, empleando etiquetas, sea posible estructurarlos, tal como lo hace HTML, pero que en este caso no están predefinidas, sino que podemos definir nuevos vocabularios para cubrir nuestras necesidades; por ejemplo, KML (Keyhole Markup Language) para la creación de modelos y el almacenamiento de funciones geográficas, que utilizarán principalmente en aplicaciones de geoposicionamiento y mapas.