¿Qué es la sindicación de contenidos?

Cuando comencé a conectarme asiduamente a Internet descubrí muchos de sitios que me interesaban y que se actualizaban regularmente. Mi rutina típica consistía en visitar cada uno de ellos para estar al tanto de las novedades.

Con el paso del tiempo descubría más y más sitios de interés y, en poco tiempo, el número de sitios a consultar había sufrido un notable incremento. Junto a la cada vez mayor frecuencia de actualizaciones, generaban cientos de entradas diarias. Revisarlas se convirtió una tarea complicada que requería demasiado tiempo.

Hasta que descubrí la sindicación de contenidos, también llamada redifusión web. Bajo este término se encuentran un conjunto de formatos estándar que permite desarrollar aplicaciones que utilizan información, incluso con múltiples orígenes.

Esquema funcionamiento RSS
Esquema de funcionamiento de la sindicación de contenidos

Agregadores o lectores de contenido

Feed icon
El icono de feed. Inicialmente usado en Mozilla Firefox, se ha popularizado hasta convertirse en el estándar de facto.

Una de estas posibles aplicaciones, el agregador o lector, se encarga de comprobar automáticamente las actualizaciones de una serie de fuentes (alimentador, canal o sumario) que se le indican creando una vista unificada en la que se pueden consultar cientos de fuentes sin necesidad de acceder a ellas de una en una. Sería equivalente a crear un periódico o revista con contenidos personalizados. Esta funcionalidad básica puede tener acompañada recomendaciones de contenidos similares que puedan ser de interés o priorización de los contenidos para mostrar los más populares o los que más pueden interesar a una persona.

Aunque existen multitud de agregadores, el funcionamiento de todos ellos es muy similar: basta con indicarle al agregador la dirección de la página a la que se quiere suscribir y detectará el automáticamente el feed, si está referenciado de alguna forma en la web (enlace visible o en las cabeceras). Alternativamente, se puede buscar el icono del feed y añadir el enlace directo.

Dentro de la gran variedad existente, se pueden distinguir algunos grandes grupos:

  • On-line

    Son páginas web que muestran los titulares de las fuentes que se le indiquen. Cada una de estas webs tienen características y funcionalidades diferentes que pueden hacer que se ajusten más o menos a cada usuario.

    En los inicios los gestores más utilizados fueron Bloglines y Google Reader (ambos descontinuados). Posiblemente sus relevos más destacados son Feedly, The Old Reader y, aunque con un concepto un tanto diferente, Flipboard.

    Este tipo de agregadores suelen disponer de aplicaciones para dispositivos móviles. Asimismo, también permiten la priorización o recomendaciones personalizadas usando perfiles de preferencias de todos los usuarios.

  • De escritorio

    Son pequeños programas que ejecutan en el ordenador en segundo plano revisando y, habitualmente, descargando las novedades de las suscripciones para poder consultarlas sin conexión.

    Algunos ejemplos de estas aplicaciones podrían ser FeedDemon, RSS Bandit, RSSOwl

  • Extensiones

    Son plugins para algunas aplicaciones de uso muy cotidiano como el navegador (Sage para Firefox) o gestor de correo (RssPopper para Outloook). En algunos casos, esta funcionalidad está incorporada en la aplicación de forma nativa (Mozilla Thunderbird).

La tendencia actual es usar un agregador on-line o aplicación para dispositivos móviles.

Además, se puede cambiar entre agregadores mediante el uso de ficheros OPML (Outline Processor Markup Language) que consisten en un listado de feeds agrupados.

¿Cómo funciona esto?

Para entender cómo funciona la sindicación es necesario hablar de formatos.

Posiblemente el más popular sea RSS, un formato basado en XML, que permite anunciar los cambios o novedades de un sitio. De forma muy simplificada, un RSS es un fichero que contiene conjunto de actualizaciones, avisos, noticias… junto a sus datos asociados.

Ejemplo de un fichero RSS

Aunque RSS es el formato más extendido, también es relativamente común encontrar fuentes en formato Atom. En muchos casos se proporcionan los dos formatos pudiendo elegir entre ellos.

Ejemplo de un fichero Atom

En los ejemplos se ve que ambos formatos tienen muchas similitudes siendo posible convertir entre uno y otro de forma casi automática.

RSS 2.0Atom 1.0
rssPor motivos históricos.
channelfeed
titletitle
linklinkAdicionalmente, Atom incluye tipos mediante el atributo rel.
descriptionsubtitle
languagexml:langAtom utiliza el atributo estándar xml:lang.
copyrightrights
webMaster
managingEditorauthor / contributor
pubDatepublishedAtom sólo lo permite a nivel de entry, no tiene una equivalencia para feed.
lastBuildDateupdatedRSS sólo lo permite a nivel de channel, no tiene una equivalencia para item.
categorycategory
generatorgenerator
docs
cloud
ttlSe prefiere utilizar la cache de HTTP 1.1.
imagelogo / iconAtom recomienda utilizar una relación de aspecto 2:1 en logo. El elemento icon sería similar a un favicon.
rating
textInput
skipHours
skipDays
itementry
authorauthor
contributor
descriptionsummary / contentEn Atom se elige si se da un extracto summary o el contenido completo content. En RSS se usa description para el contenido o extracto.
comments
enclosureAtom permite usar rel="enclosure" en link.
guidid
sourceAtom permite usar rel="via" en link. El elemento source de Atom es para proporcionar metadatos y no tiene equivalente directo en RSS.
Equivalencia entre elementos de RSS 2.0 y Atom 1.0.

Se han publicado numerosas comparativas entre RSS y Atom en las que se describen las diferencias entre formatos, sin que ninguna sea determinante.

En líneas generales, el formato Atom es más estándar, genérico y potente. Sin embargo, estas virtudes son su gran debilidad.

RSS es mucho más sencillo de generar y utilizar. Soportó desde un inicio adjuntos (enclosures) muy utilizados en podcasting1. Esta sencillez y funcionalidad añadida hacen que RSS esté más extendido lo que inclina algo la balanza a su favor.

Un poco de historia

Ramanathan V. Guha en 2014.
Ramanathan V. Guha, autor de MCF, RDF y RSS 0.90

Para hablar de los orígenes de la sindicación de contenidos es necesario remontarse a los primeros trabajos de Ramanathan V. Guha.

Uno de esos trabajos fue el desarrollo de Meta Content Framework (MCF) para Apple entre junio de 1995 y abril de 1997. Ese mismo abril, se une a Netscape donde evolucionó la idea utilizando XML junto a Tim Bray, uno de sus creadores. Nestcape propuso este trabajo para estandarización W3C convirtiéndose el el precursor del formato Resource Description Framework (RDF).

Dave Winer en 2007
Dave Winer, autor de RSS 0.91 (UserLand) y RSS 2.0.

En diciembre del mismo 1997, Dave Winer presenta un formato propio basado en el reciente XML para su weblog Scripting News. Lo describe como que además de una página web ahora es una aplicación XML. Se trata de un desarrollo paralelo con un enfoque completamente diferente.

Un par de años después, en marzo de 1999, Nestcape introduce por primera vez las siglas RSS en su portal my.netscape.com como acrónimo de RDF Site Summary.

Dan Libby
Dan Libby, autor de RSS 0.90 y RSS 0.91 (Netscape).

Los autores de este formato (considerado RSS 0.90) son Dan Libby junto a Ramanathan V. Guha. Curiosamente, este formato no es compatible con la recomendación final de RDF, a pesar de tener compartir a Guha como coautor de ambos.

A partir de este momento se fragmenta el desarrollo, llegando a crearse dos versiones RSS 0.91.

  • RSS 0.91 (Nestcape) evolución creada por Dan Libby, simplificando el formato al eliminar RDF para basarlo en el formato desarrollado por Dave Winer.

  • RSS 1.0 desarrollada por el RSS-DEV Working group muy similar a la versión 0.90 pero basada en la recomendación final de RDF, lo que la hace incompatible con la versión de Netscape.

  • RSS 2.x es la rama desarrollada por Dave Winer en su empresa UserLand Software. Posteriormente cedió los derechos a Harvard.

En junio de 2003, se propone el desarrollo de un nuevo formato que sea estándar y corrija las deficiencias de RSS. Este formato, finalmente denominado Atom, se convirtió en estándar IETF en diciembre de 2005.

RSS timeline
Línea del tiempo de los principales formatos de sindicación. Para mejorar la legibilidad se han suprimido algunas versiones intermedias.

Actualmente, RSS Advisory Board (creada originalmente por Dave Winer) publica todas las especificaciones de RSS, incluyendo el RSS 0.90 y RSS 0.91 de Nestcape que se incorporaron en enero de 2008. La única excepción es RSS 1.0.

Por otro lado, IETF mantiene las especificaciones de Atom, tanto The Atom Syndication Format (RFC 4287) como The Atom Publishing Protocol (RFC 5023).


  1. Los fondos de escritorio de Windows que se actualizan automáticamente se basan en referenciar las imágenes en un feed. Otro ejemplo de posibles usos de estos formatos. ↩︎

Oscar Cubo Medina
Oscar Cubo Medina
Ingeniero en informática

Responsable técnico @ DC Rectorado—UPM. Ciencia, informática, música, libros y nuevas tecnologías.

Relacionado