Sistema de soporte a la toma de decisiones para el análisis multifractal del genoma humano

  • Martha Eliana Mendoza Becerra Ph.D. (c) Investigador Grupo de I+D en Tecnologías de la Información (GTI), Universidad del Cauca, Popayán
  • Alba Viviana Camayo Otero Ingeniera de Sistemas, Universidad del Cauca, Auxiliar de Investigación en el Grupo de I+D en Tecnologías de la Información (GTI), Universidad del Cauca, Popayán
  • Adrián Fernando Martínez Molina Ingeniero de Sistemas, Universidad del Cauca, Auxiliar de Investigación en el Grupo de I+D en Tecnologías de la Información (GTI), Universidad del Cauca, Popayán
  • Émber Ubéimar Martínez Flor M.Sc. (c) en Ingeniería de Sistemas, Universidad del Valle Docente Asociado Tiempo Completo, Investigador Grupo BIMAC, Universidad del Cauca, Popayán
  • Carlos Alberto Cobos Lozada Ph.D. Coordinador del Grupo de I+D en Tecnologías de la Información (GTI), Universidad del Cauca, Popayán, Colombia

Abstract

En este artículo se presenta el modelo de datos multidimensional de dos data marts que forman parte de un Sistema de Soporte a la Toma de Decisiones en el área de la Genómica, el cual está basado en tecnologías de Bodegas de datos y OLAP. El primer data mart está relacionado con el “Análisis de unidades de información”, que permite almacenar y consultar información sobre las unidades de información (Exón o Intrón) en la estructura de un gen, el orden y la posición inicial y final de las unidades de información. El segundo data mart llamado “Análisis fractal” permite almacenar y consultar información sobre los genes, por ejemplo, el número de unidades de información y longitud del gen, y medidas adicionales obtenidas del análisis fractal realizadas por una investigación previa. Finalmente, se presentan los problemas durante el proceso de cargue de datos y el modelado de los datos, junto con las soluciones planteadas a los mismos, y algunas interfaces de la herramienta desarrollada.


Downloads

Download data is not yet available.

References

[1] BERIS. (2012, July 2012). Human Genome Project Information. Available: http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml

[2] GenBank. (2012, Septiembre de 2012). GenBank Overview. Available: http://www.ncbi.nlm.nih.gov/genbank/

[3] EMBL. (2012, September 2012). European Molecular Biology Laboratory. Available: http://www.embl.org/

[4] DDBJ. (2012, October 2012). DNA Data Bank of Japan. Available: http://www.ddbj.nig.ac.jp/

[5] P. Vélez, “Propuesta para la participación en la convocatoria nacional para el concurso de proyectos de investigación programa nacional de biotecnología “Análisis Multifractal del Genoma Humano para la Búsqueda de Regularidades con Significado Biológico y una Contribución a la Generación de Biotecnología de la Información”,” Universidad del Cauca 2004.

[6] P. Moreno, et al., “The human genome: a multifractal analysis,” BMC Genomics, Vol. 12, p. 506, 2011.

[7] P. E. Vélez, et al., “The Caenorhabditis elegans genome: a multifractal analysis,” Genetics and Molecular Research, Vol. 9, pp. 949-965, 2010.

[8] D. Florescu, et al., “Database techniques for the WorldWide Web: a survey,” SIGMOD Rec., Vol. 27, pp. 59-74, 1998.

[9] S. B. Davidson, et al., “Challenges in integrating biological data sources,” J Comput Biol, Vol. 2, pp. 557-72, 1995.

[10] W. Sujansky, “Heterogeneous database integration in biomedicine,” Comput. Biomed. Res., Vol. 34, pp. 285- 298, 2001.

[11] S. B. Davidson, et al., “K2/Kleisli and GUS: experiments in integrated access to genomic data sources,” IBM Syst. J., vol. 40, pp. 512-531, 2001.

[12] J. Hammer and M. Schneider, “Genomics Algebra: A New, Integrating Data Model, Language, and Tool for Processing and Querying Genomic Information,” presented at the 1st Biennial Conf. on Innovative Data Systems Research (CIDR), 2002.

[13] M. Fischer, et al., “DWARF--a data warehouse system for analyzing protein families,” BMC Bioinformatics, vol. 7, p. 495, 2006.

[14] S. P. Shah, et al., “Atlas - a data warehouse for integrative bioinformatics,” BMC Bioinformatics, vol. 6, p. 34, 2005.

[15] T. Kirsten, et al. (2004, Septiembre de 2012). A Data Warehouse for Multidimensional Gene Expression Analysis. Available: http://www.izbi.uni-leipzig.de/ izbi/Working%20Paper/2004/01_geware.pdf

[16] J. L. Y. Koh, et al., “A Classification of Biological Data Artifacts,” presented at the ICDT Workshop on Database Issues in Biological Databases (DBiBD), Edinburgh, Scotland, UK, 2005.

[17] R. Kimball, et al., The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing and Deploying Data Warehouses with CD Rom: John Wiley & Sons, Inc., 1998.

[18] R. Kimball and M. Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling: John Wiley & Sons, Inc., 2002.

[19] C. Imhoff, et al., Mastering Data Warehouse Design: Relational and Dimensional Techniques: Wiley, 2003.

[20] Pentaho. (2012, July 2012). Pentaho - Powerful Analytics Made Easy Available: http://www.pentaho.com/
Published
2013-06-30
How to Cite
Mendoza Becerra, M., Camayo Otero, A., Martínez Molina, A., Martínez Flor, Émber, & Cobos Lozada, C. (2013). Sistema de soporte a la toma de decisiones para el análisis multifractal del genoma humano. ITECKNE, 10(1), 45-56. https://doi.org/https://doi.org/10.15332/iteckne.v10i1.179
Section
Research and Innovation Articles