Memoria Libre: Don Luis Zambrano

miércoles, junio 07, 2006

La informatica del exabyte

Esta es una de las ideas que está explorando la Universidad de Bristol con lo que ellos llaman "el desafío del Exabyte". Permítan esta traducción:

"En los últimos 25 siglos ha habido poco cambio en las formas en que manejamos nuestros datos. Normalmente, se les divide en pequeñas secciones con índices y catálogos, y se les categoriza muy elementalmente. Sin embargo, con terabytes de datos surgiendo cada segundo, esa ya no es una forma viable de lidiar con los datos.

La Internet, tal como la hemos visto en la última década, usa una estrategia diferente. Google coloca toda la data en una enorme pila central, y ofrece vistas dinámicas, controladas por las consultas, de esa data.

Pero esta forma ingenua, basada en la sintáxis, ya está sufriendo sus limitaciones, especialmente cuando se trata de integrar datos de fuentes y formatos diversos (imaágenes, sonidos y textos), de incorporar semántica y conocimiento de soporte, de lidiar con datos complejos e interconectados y de realizar análisis de las consultas, entre otras cosas.

El siglo 21 necesita técnicas innovadoras para crear conciencia de los datos y de dispositivos que nos permitan entender y asimilar los exabytes de datos que tenemos en la punta de los dedos.

Este nuevo e interesante campo de investigación es muy amplio. Solamente del lado computacional, la investigación se concentra, mas o menos, en 4 categori´as:

Mineri´a de datos y ana´lisis de patrones: Se trata de proyectos que tienen que ver con te´cnicas para analizar y minar datos con diversos tipos de estructuras, desde secuencias, por la Web, hasta redes sociales y de otros tipos. Estos proyectos usan algoritmos aproximados y eficientes y te´cnicas de inteligencia artificial, y tienen aplicaciones en bioinforma´tica, analisis de la mu´sica, ana´lisis ambientales, solo por nombrar algunas.

Almacenamiento y recuperacio´n inteligente: Se trata de temas como el almacenamiento de medios mezclados y la recuperacio´n de la informacio´n para la ciencia-e, fusio´n de datos y metadata en software personalizado y bu´squeda en datos encriptados y almacenados remo´tamente, sin desencriptarlos.

Diseño de hardware: Se trata de proyectos de sistemas tolerantes a fallas en un sentido ma´s amplio, para incluir diseño innovador tolerante a fallas para memorias de bajo poder y el uso de te´cnicas avanzadas de mineria de datos, tales como la programacio´n lo´gica inductiva, para mejorar el alcance de la verificacio´n automa´tica de hardware.

Medios digitales: Projectos dirigidos a la captura automa´tica y a la sintesis de los movimientos, en 3D, de insectos y otras criaturas pequeñas con aplicaciones de animacio´n por computadoras, y el uso de "imagineria" de rango muy dina´mico, para la manipulacio´n avanzada de las ima´genes.

Esta es apenas una muestra de los proyectos que se contemplan. El enfoque de investigacio´n de abajo hacia arriba (bottom-up manner) nos permitir´a hacer uso del enorme potencial de la tecnologi´a de la informacio´n para el presente y el futuro".