Ana María Fermoso García

Dra. Ana María Fermoso García
Facultad de Informática
Universidad Pontificia de Salamanca

ACCESO A DATOS RELACIONALES BAJO UN ENTORNO XML. UN CASO PRÁCTICO

Internet esta provocando grandes cambios en las organizaciones y su gestión. Toda organización tiene que acabar migrando a la Web. Por otro lado, la sociedad actual es también la sociedad de la información y el conocimiento, la información es poder y los datos tienen que acabar convirtiéndose en información , que es un concepto más amplio. Cuando un dato se convierte en información quiere decir que puede servirnos para la toma de decisiones del negocio, por ejemplo.

Los nuevos entornos de trabajo han hecho aparecer nuevos tipos y formatos de datos, como los utilizados para la publicación de información en la Web, HTML o XML. Sin embargo, en paralelo se tiene que seguir trabajando con los datos almacenados en las tradicionales bases de datos, como las bases de datos relacionales.

En conclusión, en la organización se tiene que trabajar al mismo tiempo con datos procedentes de fuentes heterogéneas más o menos estructuradas, y por tanto será necesario en muchos casos, algún método intermedio que sirva como mediador y que permita integrar estos datos con diferentes formatos para trabajar de forma conjunta con ellos.

En cuanto a los nuevos tipos de datos creados como respuesta a las necesidades de la Web, destaca XML como estándar de facto para la representación e intercambio de información en este entorno. Una de las consecuencias de trabajar en este medio suele ser la necesidad de intercambiar información con otros sistemas y para ello el formato XML se ha convertido en el formato más usado. Incluso están apareciendo sistemas de almacenamiento específico para este tipo de datos, que van más allá de los documentos XML tratados de forma independiente, nos referimos a las bases de datos nativas XML.

El mundo de las bases de datos también se ha visto afectado por los nuevos cambios. Por un lado, las tradicionales bases de datos relacionales siguen almacenando la mayor parte de información de la organización, pero en las últimas versiones de los sistemas de gestión de base de datos, se han visto obligados también a adaptarse a las nuevas necesidades, por ejemplo permitiendo también tratar y almacenar información en formato XML, aunque el tema del almacenamiento de información XML en bases de datos relacionales quede fuera del ámbito de este trabajo.

También en relación con las bases de datos han aparecido nuevos tipos como los data warehouse, que se han convertido en sistemas de almacenamiento de datos de fuentes heterogéneas, desde los que luego se analizan esos datos para convertirlos en información y conocimiento y así ayudar a la toma de decisiones de la organización. En estos nuevos sistemas se harán también necesarios métodos para permitir integrar estos datos como paso previo a su análisis.

En nuestra investigación, demostrada la importancia de XML en el medio Web por un lado, y la gran cantidad de información que continua siendo almacenada en las bases de datos relacionales, hemos estudiado como podemos tratar de forma conjunta datos procedentes de ambos entornos. Si los datos procedentes de uno u otro entorno pudiesen estar en el mismo formato común, XML al ser éste el lenguaje de la Web, sería más fácil la integración de los mismos, tanto si se necesitan para el intercambio de información a través de la red, como si se utilizan para su posterior almacenamiento y tratamiento dentro de un data warehouse, como acabamos de comentar.

El objeto de la investigación es proporcionar un entorno de acceso común para datos en formato XML y relacionales. Para el usuario resultará un sistema transparente en cuanto a que accederá a datos XML y relacionales de una forma muy similar, con lo que para él es como si toda la información estuviera en formato XML y sólo estuviese consultando datos de este tipo. Se trata por tanto de acceder a datos relacionales bajo un sistema con apariencia de consulta a datos XML y el resultado obtenido tras las consultas a la base de datos relacional, también sería XML.

Como resultado final se ha diseñado un nuevo sistema software denominado XBD (acceso Bases de Datos con XML). Se trata de un entorno de consulta a bases de datos relacionales basado en XML. El sistema aporta además de la herramienta software que lo implementa, un modelo de adaptación para permitir que cualquier base de datos sea accedida desde el mismo de una forma eficiente, y los lenguajes de consulta, también basados en XML, que se van a utilizar en el entorno XBD, derivados de las tecnologías XSL y XQuery de XML. En la ponencia se detallarán las características de este nuevo entorno de consulta XBD y se demostrarán sus aportaciones.

Los puntos fundamentales a tratar en la conferencia que se propone serían por tanto, primero estudiar las necesidades que las nuevas tecnologías plantean a las organizaciones y justificar así la utilidad del nuevo entorno de consulta a bases de datos relacionales que proponemos. En segundo lugar se trataría de hacer un estudio o situación actual de otros sistemas que también tienen relación con el tema de las bases de datos y XML, permitiendo obtener datos XML de fuentes relacionales. A continuación se pasaría a describir en detalle las características del nuevo sistema de consulta XBD que se ha diseñado, incluyendo su arquitectura, el modelo de adaptación que propone para que cualquier base de datos relacional pueda ser consultada en el entorno XBD, los lenguajes de consulta que en él se utilizan y el procesamiento en general de las consultas en este sistema. Finalmente se demostraría una vez más sus ventajas y las pruebas que con él se han realizado y por último se expondrían las nuevas líneas de investigación en las que estamos ya trabajando y que siguen relacionadas con el área de la integración entre datos relacionales y XML, pero tratada desde una nueva perspectiva.

José António Silva

Eng. José António Silva
Microsoft Portugal

XML no Office

Encontrar uma forma para descrever o significado da informação contida num documento tem sido o foco central da comunidade XML nas últimas décadas, quando ainda se estava no SGML (Standard Generallized Markup Language).

Dentro desta comunidade, há muito que acreditávamos que era possível separar o conteúdo principal do seu formato, e desta forma os utilizadores seriam capazes de evidenciar os elementos que considerarem mais importantes. Hoje, graças ao XML, um utilizador pode marcar um nome, endereço, assunto ou outro campo qualquer de um documento que esta a compor.

Diferentes entidades são capazes que representar informação, usando muitas vezes gramáticas diferentes, mas numa forma precisa e fácil de transformar entre plataformas ou organizações. Um mesmo documento num hospital, por exemplo uma prescrição, pode ter um processamento completamente diferente numa farmácia, numa seguradora, numa instituição financeira ou no Governo.

Se nos últimos anos vimos a Microsoft com muito maior foco do lado do processamento, transformação, workflow, armazenamento, etc.. em produtos como o SQL Server, o Biztalk Server, o Sharepoint, os ASP.NET Web Services, etc.. Agora chegou a altura de colocar todo o potencial do XML nas mãos dos utilizadores comuns com a implementação desta tecnologia no Office. Passarmos do simples browser para cenários de interactividade muito mais rica no cliente, tirando partido de web services e outros dados XML, com possibilidade de trabalhar offline e no contexto das aplicações mais usadas pelos utilizadores no seu dia-a-dia.

XATA logo