MySQL vs PostGreSQL: Características y diferencias
1. Introducción
Común es la pregunta entre las personas que se adentran por primera vez en el mundo de las bases de datos
libres: ¿MySQL o PostGreSQL? En realidad no es una pregunta asociada específicamente a los "novatos", ya
que incluso los profesionales dedicados a este campo se realizan muchas veces esta misma pregunta. La verdad
es que no es una pregunta fácil de responder, y no carente de grandes controversias.
El objetivo de este documento será introducir las características de estos dos magníficos sistemas de gestión de
bases de datos, haciendo una pequeña comparativa entre ellas, con el fin de conducir a la elección más
adecuada para cada situación.
a. PostGreSQL
a.1. ¿Qué es PostGreSQL?
PostGreSQL es un sistema de gestión de bases de datos objeto-relacional (ORDBMS) basado en el proyecto
POSTGRES, de la universidad de Berkeley. El director de este proyecto es el profesor Michael Stonebraker, y
fue patrocinado por Defense Advanced Research Projects Agency (DARPA), el Army Research Office (ARO),
el National Science Foundation (NSF), y ESL, Inc.
PostGreSQL es una derivación libre (OpenSource) de este proyecto, y utiliza el lenguaje SQL92/SQL99, así
como otras características que comentaremos más adelante.
Fue el pionero en muchos de los conceptos existentes en el sistema objeto-relacional actual, incluido, más tarde
en otros sistemas de gestión comerciales. PostGreSQL es un sistema objeto-relacional, ya que incluye
características de la orientación a objetos, como puede ser la herencia, tipos de datos, funciones, restricciones,
disparadores, reglas e integridad transaccional. A pesar de esto, PostGreSQL no es un sistema de gestión de
bases de datos puramente orientado a objetos.
a.2. Historia de PostGreSQL
PostGreSQL (llamado también Postgres95) fue derivado del proyecto Postgres, como ya se ha comentado. A
sus espaldas, este proyecto lleva más de una década de desarrollo, siendo hoy en día, el sistema libre más
avanzado con diferencia, soportando la gran mayoría de las transacciones SQL, control concurrente, teniendo a
su disposición varios "language bindings" como por ejemplo C, C++, Java, Python, PHP y muchos más.
La implementación de Postgres DBMS comenzó en 1986, y no hubo una versión operativa hasta 1987. La
versión 1.0 fue liberada en Junio de 1989 a unos pocos usuarios, tras la cual se liberó la versión 2.0 en Junio de
1990 debido a unas críticas sobre el sistema de reglas, que obligó a su reimplementación. La versión 3.0
apareció en el año 1991, e incluyó una serie de mejoras como una mayor eficiencia en el ejecutor de peticiones.
El resto de versiones liberadas a partir de entonces, se centraron en la portabilidad del sistema. El proyecto se
dio por finalizado en con la versión 4.2, debido al gran auge que estaba teniendo, lo cual causó la imposibilidad
de mantenimiento por parte de los desarrolladores.
En 1994, Andrew Yu y Jolly Chen añadieron un intérprete de SQL a este gestor. Postgres95, como así se llamó
fue liberado a Internet como un proyecto libre (OpenSource). Estaba escrito totalmente en C, y la primera
versión fue un 25% más pequeña que Postgres, y entre un 30 y un 50% más rápida. A parte de la corrección de
algunos bugs, se mejoró el motor interno, se añadió un nuevo programa monitor, y se compiló usando la
utilidad GNU Make y el compilador gcc sin necesidad de parchearlo (como había hecho falta en versiones
anteriores).
2. En 1996, los desarrolladores decidieron cambiar el nombre a al DBMS, y lo llamaron PostGreSQL (versión
6.0) para reflejar la relación entre Postgres y las versiones recientes de SQL. Se crearon nuevas mejoras y
modificaciones, que repercutieron en un 20-40% más de eficiencia, así como la incorporación del estándar
SQL92.
La versión que se ofrece a fechas de este escrito, es la versión 7.2.1. Se puede encontrar más información
acerca de las características e historia en [PostGreSQL_Manual].
a.3. Características de PostGreSQL
A continuación se enumeran las principales características de este gestor de bases de datos:
1. Implementación del estándar SQL92/SQL99.
2. Soporta distintos tipos de datos: además del soporte para los tipos base, también soporta datos de tipo
fecha, monetarios, elementos gráficos, datos sobre redes (MAC, IP ...), cadenas de bits, etc. También
permite la creación de tipos propios.
3. Incorpora una estructura de datos array.
4. Incorpora funciones de diversa índole: manejo de fechas, geométricas, orientadas a operaciones con
redes, etc.
5. Permite la declaración de funciones propias, así como la definición de disparadores.
6. Soporta el uso de índices, reglas y vistas.
7. Incluye herencia entre tablas (aunque no entre objetos, ya que no existen), por lo que a este gestor de
bases de datos se le incluye entre los gestores objeto-relacionales.
8. Permite la gestión de diferentes usuarios, como también los permisos asignados a cada uno de ellos.
a.4. ¿Qué es lo que le falta?
PostGreSQL es un magnífico gestor de bases de datos, capaz de competir con muchos gestores comerciales,
aunque carezca de alguna característica casi imprescindible. Ésta es, bajo mi punto de vista, un conjunto de
herramientas que permitan una fácil gestión de los usuarios y de las bases de datos que contenga el sistema. Por
otro lado, la velocidad de respuesta que ofrece este gestor con bases de datos relativamente pequeñas puede
parecer un poco deficiente, aunque esta misma velocidad la mantiene al gestionar bases de datos realmente
grandes, cosa que resulta loable.
b. MySQL
b.1. ¿Qué es MySQL?
MySQL es un sistema de gestión de bases de datos relacional, licenciado bajo la GPL de la GNU. Su diseño
multihilo le permite soportar una gran carga de forma muy eficiente. MySQL fue creada por la empresa sueca
MySQL AB, que mantiene el copyright del código fuente del servidor SQL, así como también de la marca.
Aunque MySQL es software libre, MySQL AB distribuye una versión comercial de MySQL, que no se
diferencia de la versión libre más que en el soporte técnico que se ofrece, y la posibilidad de integrar este gestor
en un software propietario, ya que de no ser así, se vulneraría la licencia GPL.
Este gestor de bases de datos es, probablemente, el gestor más usado en el mundo del software libre, debido a
su gran rapidez y facilidad de uso. Esta gran aceptación es debida, en parte, a que existen infinidad de librerías
y otras herramientas que permiten su uso a través de gran cantidad de lenguajes de programación, además de su
fácil instalación y configuración.
b.2. Historia de MySQL
MySQL surgió como un intento de conectar el gestor mSQL a las tablas propias de MySQL AB, usando sus
propias rutinas a bajo nivel. Tras unas primeras pruebas, vieron que mSQL no era lo bastante flexible para lo
3. que necesitaban, por lo que tuvieron que desarrollar nuevas funciones. Esto resultó en una interfaz SQL a su
base de datos, con una interfaz totalmente compatible a mSQL.
Se comenta en el manual [MySQL_Manual] que no se sabe con certeza de donde proviene su nombre. Por un
lado dicen que sus librerías han llevado el prefijo 'my' durante los diez últimos años. Por otro lado, la hija de
uno de los desarrolladores se llama My. No saben cuál de estas dos causas (aunque bien podrían tratarse de la
misma), han dado lugar al nombre de este conocido gestor de bases de datos.
La versión estable de este gestor a días de hoy es la 3.23.49. Se puede encontrar más información sobre este
gestor en el manual [MySQL_Manual].
b.3. Características de MySQL
Las principales características de este gestor de bases de datos son las siguientes:
1. Aprovecha la potencia de sistemas multiprocesador, gracias a su implementación multihilo.
2. Soporta gran cantidad de tipos de datos para las columnas.
3. Dispone de API's en gran cantidad de lenguajes (C, C++, Java, PHP, etc).
4. Gran portabilidad entre sistemas.
5. Soporta hasta 32 índices por tabla.
6. Gestión de usuarios y passwords, manteniendo un muy buen nivel de seguridad en los datos.
b.4. ¿Qué es lo que le falta?
MySQL surgió cómo una necesidad de un grupo de personas sobre un gestor de bases de datos rápido, por lo
que sus desarrolladores fueron implementando únicamente lo que precisaban, intentando hacerlo funcionar de
forma óptima. Es por ello que, aunque MySQL se incluye en el grupo de sistemas de bases de datos
relacionales, carece de algunas de sus principales características:
1. Subconsultas: tal vez ésta sea una de las características que más se echan en falta, aunque gran parte de
las veces que se necesitan, es posible reescribirlas de manera que no sean necesarias.
2. SELECT INTO TABLE: Esta característica propia de Oracle, todavía no está implementada.
3. Triggers y Procedures: Se tiene pensado incluir el uso de procedures almacenados en la base de datos,
pero no el de triggers, ya que los triggers reducen de forma significativa el rendimiento de la base de
datos, incluso en aquellas consultas que no los activan.
4. Transacciones: a partir de las últimas versiones ya hay soporte para transacciones, aunque no por
defecto (se ha de activar un modo especial).
5. Integridad referencial: aunque sí que admite la declaración de claves ajenas en la creación tablas,
internamente no las trata de forma diferente al resto de campos.
Los desarrolladores comentan en la documentación que todas estas carencias no les resultaban un problema, ya
que era lo que ellos necesitaban. De hecho, MySQL fue diseñada con estas características, debido a que lo que
buscaban era un gestor de bases de datos con una gran rapidez de respuesta. Pero ha sido con la distribución de
MySQL por Internet, cuando más y más gente les están pidiendo estas funcionalidades, por lo que serán
incluidas en futuras versiones del gestor.
c. Comparativa
c.1. Introducción
Son muchos los benchmarks que se han publicado sobre estos gestores de bases de datos, aunque muchos de
ellos tienen una clara tendencia hacia uno de los dos bandos. Es por esto que hay que saber extraer bien las
conclusiones a partir de un benchmark. Por ejemplo, es importante que las comparaciones entre los dos gestores
se realicen en igualdad de condiciones, cosa que por otra parte, muchas veces resulta complicado debido a las
distintas implementaciones que poseen estos gestores.
4. Además, resulta muy complicado diseñar un buen benchmark, que tenga en cuenta todas las posibles mejoras
de rendimiento que pueda aplicar cada uno de estos gestores. Es lógico pues, que haya algunas pruebas que se
le apliquen a un gestor, y que no tenga ningún sentido realizarselas al otro.
A continuación se resumen las conclusiones obtenidas a partir de diversos benchmark's, intentando hacer un
descarte de los que tenían una clara tendencia hacia uno de los bandos.
c.2. PostGreSQL ...
Las características positivas que posee este gestor según las opiniones más comunes en Internet, son:
1. Posee una gran escalabilidad. Es capaz de ajustarse al número de CPUs y a la cantidad de memoria que
posee el sistema de forma óptima, haciéndole capaz de soportar una mayor cantidad de peticiones
simultáneas de manera correcta (en algunos benchmarks se dice que ha llegado a soportar el triple de
carga de lo que soporta MySQL).
2. Implementa el uso de rollback's, subconsultas y transacciones, haciendo su funcionamiento mucho más
eficaz, y ofreciendo soluciones en campos en las que MySQL no podría.
3. Tiene la capacidad de comprobar la integridad referencial, así como también la de almacenar
procedimientos en la propia base de datos, equiparándolo con los gestores de bases de datos de alto
nivel, como puede ser Oracle.
c.3.
Por contra, los mayores inconvenientes que se pueden encontrar a este gestor son:
1. Consume gran cantidad de recursos.
2. Tiene un límite de 8K por fila, aunque se puede aumentar a 32K, con una disminución considerable del
rendimiento.
3. Es de 2 a 3 veces más lento que MySQL.
c.4. Lo mejor de MySQL ...
Es evidente que la gran mayoría de gente usa este gestor en Internet, por lo que encontrar opiniones favorables
no ha resultado en absoluto complicado:
1. Sin lugar a duda, lo mejor de MySQL es su velocidad a la hora de realizar las operaciones, lo que le
hace uno de los gestores que ofrecen mayor rendimiento.
2. Su bajo consumo lo hacen apto para ser ejecutado en una máquina con escasos recursos sin ningún
problema.
3. Las utilidades de administración de este gestor son envidiables para muchos de los gestores comerciales
existentes, debido a su gran facilidad de configuración e instalación.
4. Tiene una probabilidad muy reducida de corromper los datos, incluso en los casos en los que los errores
no se produzcan en el propio gestor, sino en el sistema en el que está.
5. El conjunto de aplicaciones Apache-PHP-MySQL es uno de los más utilizados en Internet en servicios
de foro (Barrapunto.com) y de buscadores de aplicaciones (Freshmeat.net).
c.5. ...
Debido a esta mayor aceptación en Internet, gran parte de los inconvenientes se exponen a continuación, han
sido extraídos de comparativas con otras bases de datos:
1. Carece de soporte para transacciones, rollback's y subconsultas.
2. El hecho de que no maneje la integridad referencial, hace de este gestor una solución pobre para muchos
campos de aplicación, sobre todo para aquellos programadores que provienen de otros gestores que sí
que poseen esta característica.
5. 3. No es viable para su uso con grandes bases de datos, a las que se acceda continuamente, ya que no
implementa una buena escalabilidad.
Muchas gracias por compartir tus conocimientos. La segunda parte es responsabilidad del usuario que tenga interes en saber mas del tema.
Este documento fue extraido de la pagina de Daniel Pecos. Todos los derechos le pertenecen. http://www.danielpecos.com/docs/mysql_postgres/index.html