BASES DE DATOS DESDE LOS INCAS HASTA NUESTROS DIAS.

Ing. Msc. Galo Mauricio López Sevilla

Al revisar a través de la historia, las sociedades desde siempre se han preocupado por registrar hechos históricos, registros económicos o simplemente contar sus bienes y pertenencias. Es así que podemos ver que en las sociedades antiguas se desarrollaron sistemas sencillos de registro como es el quipu, que podríamos decir que es la primera forma de almacenar un conjunto de datos, es decir, una base de datos como tal. Pero que es una base de datos? se puede decir que es un conjunto de información relacionada y formalmente definida y almacenada con carácter más o menos permanente, con el objeto de servir a múltiples y diferentes aplicaciones.
Parece extraño conocer que en culturas tan antiguas se hayan encontrado quipus como evidencia de una forma de sistematizar la información importante de esos pueblos. Así, los quipus fueron encontrados en los restos de la ciudad de Caral (la ciudad más antigua de América) y en restos de otras culturas además de la Inca.
Los quipus son un sistema de cuerdas de lana o algodón anudados, algunos tienen varios colores y longitudes con disposiciones diferentes. En ellos no solo se hacían registros matemáticos sino también se escribían poemas, canciones o relatos de los antiguos pobladores sudamericanos según menciona Garcilaso de la Vega en sus crónicas.
Los quipus constan de una cuerda principal o primaria que no contiene nudos de la que derivan otras cuerdas secundarias o colgantes que están anudadas y que contenían los registros de la información que escribían los quipucamayos.
Estos quipus eran creados y traducidos por un especialista llamado quipucamayo quien tenía su propio sistema de registro y que en muchos casos trabajaba para el Inca para mantener el registro de los bienes o estadísticas de cada situación del imperio del Tahuantinsuyo, se podría decir que los quipucamayos eran los primeros Administradores de Bases de Datos, esto por las tareas relacionadas a él.
Después de la invasión al territorio Inca, los españoles suprimieron el uso de los quipus llegando a quemarlos y en el intento de convertir en católicos a los indígenas asesinaron a los quipucamayos, borrando así una parte de la historia desde cuyas épocas podemos decir se usaban estos mecanismos de registro y almacenamiento de la información.
En épocas posteriores a los Incas, se tienen registros de información en textos escritos por letrados, sacerdotes e historiadores, hasta llegar al siglo anterior en donde surgen los sistemas de bases de datos informatizados, teniendo sus raíces en el proyecto estadounidense Apolo de mandar al hombre a la luna, en los años sesenta. En aquella época, no había ningún sistema que permitiera gestionar la inmensa cantidad de información que requería el proyecto. La primera empresa encargada del proyecto, NAA (North American Aviation), desarrolló un software denominado GUAM (General Update Access Method) que estaba basado en el concepto de que varias piezas pequeñas se unen para formar una pieza más grande, y así sucesivamente hasta que el producto final está ensamblado. Esta estructura, que tiene la forma de un árbol, es lo que se denomina una estructura jerárquica. A mediados de los sesenta, IBM se unió a NAA para desarrollar GUAM en lo que ahora se conoce como IMS (Information Management System). El motivo por el cual IBM restringió IMS al manejo de jerarquías de registros fue el de permitir el uso de dispositivos de almacenamiento serie, más exactamente las cintas magnéticas, ya que era un requisito del mercado por aquella época.
Posterior a esto evolucionan las Bases de datos sobre distintas formas de desarrollo, llamados modelos de construcción, así el modelo jerárquico, el infológico, el de red, etc. Pasamos entonces por diferentes tipos y modelos de Bases de Datos, cada una orientada a funciones y datos específicos, como por ejemplo bases de datos relacionales, objeto relacional, documental, espacial (georeferenciados y no georeferenciados), entre otras.
Así llegamos a la actualidad, en donde lo mas critico en Base de Datos ya no es su diseño o su implementación sino su almacenamiento y su seguridad, por cuanto nos encontramos en una era en la que hablamos de Peta bytes y Exabytes y existen cada día colecciones de datos sensibles más y más grandes. Dentro de las Bases de Datos más grandes podemos mencionar algunas como por ejemplo la del Centro de datos mundial del clima la misma que es operada por el Instituto Max Planck de Meteorología, cuenta con 220 Terabytes de datos accesibles vía web, incluyendo información sobre investigación del clima, tendencias anticipadas del clima y datos de simulaciones. Adicionalmente cuentan con más de 6 Peta bytes en cinta magnética, se puede decir que es uno de los respaldos de Base de Datos más grande del mundo.
Otra base de datos grande es la de National Energy Research Scientific Computing Center, incluye información de investigación nuclear, experimentos de física, simulaciones sobre los inicios del universo, entre otros. Sus bases de datos pasan de 2,8 peta bytes, es decir casi tres millones de Gigas de información.
AT&T empresa de telecomunicaciones cuenta con una bases de datos con más de 300 Terabytes de datos. Google que todos conocemos, desafortunadamente no revela mucho sobre su base de datos. Sin embargo, sabiendo que se hacen unas 90 millones de búsquedas diarias en sus páginas (y todas son almacenadas). A esto hay que agregar que almacenan información sobre los usuarios y sus hábitos de navegación, sobre los avisos publicitarios que muestran, y por supuesto, sobre las páginas donde hacen la búsqueda. Todo esto arroja varias centenas de Terabytes por año de funcionamiento.
Sprint, esta empresa de telecomunicaciones cuenta con 53 millones de suscriptores, y registra los datos de unos 365 millones de llamadas. La base de datos tiene más de 2,85 trillones de registros. ChoicePoint, empresa que se dedica a verificar la identificación y credenciales de personas en Estados Unidos. Cuenta con información personal de unas 250 millones de personas, en una base de datos estimada en 250 Terabytes.
YouTube.com, en alrededor de 3 años de funcionamiento, ha acumulado una cantidad impresionante de videos. Se estima que diariamente los usuarios ven 100 millones de videos en esta página, y agregan unos 80 mil nuevos videos por día. Con los videos, resulta difícil medir el tamaño (por diferencias en duración, etc.), pero se estimó recientemente en 50 Terabytes.
Amazon.com, la tienda más grande del mundo cuenta con casi 60 millones de clientes (de los cuales mantiene sus datos, compras, listas, etc.), así como con millones de ítems en inventario (de los cuales además de los datos, almacena los comentarios que hacen los usuarios sobre ellos). En su inventario cuenta con el texto completo de 250 mil libros. Solamente las bases de datos que se conocen públicamente, se estima tengan unos 42 terabytes.
La Agencia Central de Inteligencia ha reunido información sobre personas, lugares y cosas durante muchos años, a través de trabajo de campo e intrusión digital (entre otros métodos). Por la naturaleza del negocio, se conoce poco sobre el tamaño o contenido; sin embargo se estima que es monumental. Cada día la CIA libera o de-clasifica una gran cantidad de documentos, que pasan a ser de acceso público. Así también se pretende crear la mayor base de datos de la historia, la cual contará con información biométrica. Una de las ideas tiene que ver con confirmar la identidad de las personas gracias a la obtención de rasgos físicos como el iris, cicatrices o como la palma de la mano, y así poder determinar mejor si tal o cual es terrorista o bandido… la inversión necesaria para crear tal base es de unos 1000 millones de dólares, monto que para nuestra ciudad de Ambato serviría para construir más de 100 nuevos puentes sobre el rio Ambato.
Otra Base de Datos gigantesca es la de la Biblioteca del Congreso de Estados Unidos, la misma cuenta con más de 130 millones de ítems (29 millones de libros, 5 millones de documentos, mapas, imágenes, etc.), que van desde libros de cocina, hasta periódicos de la era colonial, pasando por transcripciones de las sesiones del congreso. Se estima el tamaño en 20 Terabytes. Crece a un ritmo de 10 mil ítems al día y ocupa 530 millas de estantes. Desafortunadamente, la mayor parte de la información no está digitalizada, ni existen planes de que lo esté.
Otra gigantesca Base de Datos es la del Archivo de Internet: Archive.org, a veces llamado «la Biblioteca de Alejandría de la Web» o también «la mayor colección de pornografía del mundo, en una sola habitación». Desde 1996 cientos de ordenadores rastrean y guardan «copias» de todo el contenido posible de la Web, o al menos lo que se puede rastrear, se va almacenando para el futuro, como en una gran biblioteca. Esta organización sin ánimo de lucro con el tiempo ha ido creciendo en cuanto a medios y tecnología, y desarrollando servicios prácticos para los usuarios. Uno de ellos es la popular Wayback Machine, que permite ver una «fotografía» de cómo era una web concreta en distintas épocas, con sólo teclear su dirección. Esta Base de Datos contiene: más de 10.000 millones de páginas archivadas, 250 gigabytes nuevos de datos que se añaden cada día, más de 200 servidores. Según la entrada en la Wikipedia del Archivo Internet ya en 2006 los archivo ocupaban dos peta bytes (2.000 terabytes = dos millones de gigabytes) y se añadían 20 terabytes cada mes. Al ritmo actual, los nuevos sitios web tardan entre 6 y 12 meses en ser incluidos.
Así entonces vemos la utilidad y evolución de las bases de datos hasta nuestros días; y aun así muchos de nosotros ni siquiera sabemos que a diario las usamos y somos parte de ellas, por ejemplo toda nuestra información de cuentas de correo electrónico se encuentra almacenada en algún lugar en el mundo dentro de una base de datos y accedemos y realizamos operaciones sobre ella sin ni siquiera saberlo. Esto por dar un ejemplo, pero todos usamos bases de datos en nuestras actividades diarias, en el banco, en el supermercado, etc.