Sistema de soporte a la toma de decisiones para el análisis multifractal del genoma humano
DOI:
https://doi.org/10.15332/iteckne.v10i1.179Keywords:
Bodegas de Datos, OLAP, Bioinformá- tica. Proceso ETL, Date warehouse, Bioinformatics, ETL process.Abstract
En este artículo se presenta el modelo de datos multidimensional de dos data marts que forman parte de un Sistema de Soporte a la Toma de Decisiones en el área de la Genómica, el cual está basado en tecnologías de Bodegas de datos y OLAP. El primer data mart está relacionado con el “Análisis de unidades de información”, que permite almacenar y consultar información sobre las unidades de información (Exón o Intrón) en la estructura de un gen, el orden y la posición inicial y final de las unidades de información. El segundo data mart llamado “Análisis fractal” permite almacenar y consultar información sobre los genes, por ejemplo, el número de unidades de información y longitud del gen, y medidas adicionales obtenidas del análisis fractal realizadas por una investigación previa. Finalmente, se presentan los problemas durante el proceso de cargue de datos y el modelado de los datos, junto con las soluciones planteadas a los mismos, y algunas interfaces de la herramienta desarrollada.Downloads
References
BERIS. (2012, July 2012). Human Genome Project Information. Available: http://www.ornl.gov/sci/techresources/Human_Genome/home.shtml
GenBank. (2012, Septiembre de 2012). GenBank Overview. Available: http://www.ncbi.nlm.nih.gov/genbank/
EMBL. (2012, September 2012). European Molecular Biology Laboratory. Available: http://www.embl.org/
DDBJ. (2012, October 2012). DNA Data Bank of Japan. Available: http://www.ddbj.nig.ac.jp/
P. Vélez, “Propuesta para la participación en la convocatoria nacional para el concurso de proyectos de investigación programa nacional de biotecnología “Análisis Multifractal del Genoma Humano para la Búsqueda de Regularidades con Significado Biológico y una Contribución a la Generación de Biotecnología de la Información”,” Universidad del Cauca 2004.
P. Moreno, et al., “The human genome: a multifractal analysis,” BMC Genomics, Vol. 12, p. 506, 2011.
P. E. Vélez, et al., “The Caenorhabditis elegans genome: a multifractal analysis,” Genetics and Molecular Research, Vol. 9, pp. 949-965, 2010.
D. Florescu, et al., “Database techniques for the WorldWide Web: a survey,” SIGMOD Rec., Vol. 27, pp. 59-74, 1998.
S. B. Davidson, et al., “Challenges in integrating biological data sources,” J Comput Biol, Vol. 2, pp. 557-72, 1995.
W. Sujansky, “Heterogeneous database integration in biomedicine,” Comput. Biomed. Res., Vol. 34, pp. 285- 298, 2001.
S. B. Davidson, et al., “K2/Kleisli and GUS: experiments in integrated access to genomic data sources,” IBM Syst. J., vol. 40, pp. 512-531, 2001.
J. Hammer and M. Schneider, “Genomics Algebra: A New, Integrating Data Model, Language, and Tool for Processing and Querying Genomic Information,” presented at the 1st Biennial Conf. on Innovative Data Systems Research (CIDR), 2002.
M. Fischer, et al., “DWARF--a data warehouse system for analyzing protein families,” BMC Bioinformatics, vol. 7, p. 495, 2006.
S. P. Shah, et al., “Atlas - a data warehouse for integrative bioinformatics,” BMC Bioinformatics, vol. 6, p. 34, 2005.
T. Kirsten, et al. (2004, Septiembre de 2012). A Data Warehouse for Multidimensional Gene Expression Analysis. Available: http://www.izbi.uni-leipzig.de/ izbi/Working%20Paper/2004/01_geware.pdf
J. L. Y. Koh, et al., “A Classification of Biological Data Artifacts,” presented at the ICDT Workshop on Database Issues in Biological Databases (DBiBD), Edinburgh, Scotland, UK, 2005.
R. Kimball, et al., The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing and Deploying Data Warehouses with CD Rom: John Wiley & Sons, Inc., 1998.
R. Kimball and M. Ross, The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling: John Wiley & Sons, Inc., 2002.
C. Imhoff, et al., Mastering Data Warehouse Design: Relational and Dimensional Techniques: Wiley, 2003.
Pentaho. (2012, July 2012). Pentaho - Powerful Analytics Made Easy Available: http://www.pentaho.com/
Downloads
Published
How to Cite
Issue
Section
License
La revista ITECKNE se encuentra registrada bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional Por lo tanto, esta obra se puede reproducir, distribuir y comunicar públicamente, siempre que se reconozca el nombre de los autores y a la Universidad Santo Tomás. Se permite citar, adaptar, transformar, autoarchivar, republicar y crear a partir del material, siempre que se reconozca adecuadamente la autoría, se proporcione un enlace a la obra original y se indique si se han realizado cambios.
La Revista ITECKNE no retiene los derechos sobre las obras publicadas y los contenidos son responsabilidad exclusiva de los autores, quienes conservan sus derechos morales, intelectuales, de privacidad y publicidad. Sin embargo esta facultada para editar, publicar, reproducir y distribuir tanto en medios impresos como digitales, además de incluir el artículo en índices internacionales y/o bases de datos, de igual manera, se faculta a la editorial para utilizar las imágenes, tablas y/o cualquier material gráfico presentado en el artículo para el diseño de carátulas o posters de la misma revista.