1. Revista Mexicana de Ingeniería Química
Universidad Autónoma Metropolitana - Iztapalapa
amidiq@xanum.uam.mc
ISSN (Versión impresa): 1665-2738
MÉXICO
2005
O. Soto Cruz / J. Páez Lerma
BALANCES EN PROCESOS DE FERMENTACIÓN: ANÁLISIS DE CONSISTENCIA Y
DE FLUJOS METABÓLICOS
Revista Mexicana de Ingeniería Química, año/vol. 4, número 001
Universidad Autónoma Metropolitana - Iztapalapa
Distrito Federal, México
pp. 59-74
Red de Revistas Científicas de América Latina y el Caribe, España y Portugal
Universidad Autónoma del Estado de México
2. REVISTA MEXICANA DE INGENIERIA QUIMICA Vol. 4 (2005) 59-74
AMIDIQ
BALANCES EN PROCESOS DE FERMENTACION: ANALISIS DE CONSISTENCIA Y
DE FLUJOS METABOLICOS
FERMENTATION PROCESS BALANCES: CONSISTENCY AND METABOLIC FLUX
ANALYSIS
O. Soto-Cruz * y J. Páez-Lerma
Departamento de Ingenierías Químicas y Bioquímica, Instituto Tecnológico de Durango Blvd. Felipe Pescador 1830
Ote. Col. Nueva Vizcaya, 34080, Durango, Dgo. México
Recibido 22 Junio 2004; Aceptado 14 Marzo 2005
Resumen
Los balances estequiométricos en procesos de fermentación son esenciales para su entendimiento y/o aplicación. El
cálculo de flujos metabólicos resulta fundamental en estudios cuantitativos de fisiología celular. Una poderosa
herramienta para la determinación de los flujos en la red de reacciones bioquímicas es el análisis de flujos
metabólicos, en el cual los flujos intracelulares son calculados usando un modelo estequiométrico que describe la
bioquímica del microorganismo. El análisis de flujos metabólicos es particularmente útil en conexión con estudios de
producción de metabolitos, donde el objetivo es dirigir tanto carbono como sea posible desde un sustrato hacia un
producto metabólico, además de permitir el cálculo de flujos extracelulares no medidos y rendimientos teóricos
máximos, identificación de vías metabólicas alternas y puntos ramificados de control metabólico En este trabajo se
presenta una revisión de las metodologías de análisis de consistencia y análisis de flujos metabólicos y su aplicación
a sistemas de fermentación.
Palabras clave: balances elementales, metabolismo, modelo estequiométrico.
Abstract
Stoichiometric balances in fermentation processes are esential for their understanding and/or application. The
calculation of metabolic flows is fundamental in quantitative studies of cellular physiology. Metabolic flux analysis
is a powerful tool for the determination of the flows in the network of biochemical reactions. Intracellular fluxes are
calculated using a stoichiometric model that describes the biochemistry of the microorganism. Metabolic flux
analysis is particularly useful in connection with studies of metabolite production, where the objective is to direct as
much carbon as it is possible from a substrate towards a metabolic product, besides to allow the calculation of non-
measured extracellular fluxes and maximum theoretical yields, identification of alternating metabolic pathways and
branched nodes of metabolic control. This work presents a revision of methodologies of consistency and metabolic
flux analysis and their application to fermentation systems.
Keywords: elemental balances, metabolism, stoichiometric model.
1. Introducción conocimiento metabólico de un
microorganismo en una red de reacciones
Los procesos de fermentación, son
bioquímicas y provee una medida del grado
caracterizados por el crecimiento de una
de ajuste entre varias vías metabólicas
población de microorganismos, que degradan
(Varma y Palsson, 1994; Stephanopoulos y
un sustrato, formando algún(os) producto(s)
col., 1998; Nielsen, 2001). El grado de ajuste
de fermentación, por lo que los balances del
entre vías metabólicas se entiende como la
proceso son esenciales para su entendimiento
producción de intermediarios en unas y el
y/o aplicación. El cálculo de flujos
consumo de los mismos en otras, por
metabólicos es una herramienta de la
ejemplo, cuando las condiciones ambientales
ingeniería metabólica y una determinación
cambian los flujos metabólicos son
fundamental en estudios cuantitativos de
redistribuidos de manera que se mantenga el
fisiología celular, ya que permite organizar el
*Autor para la correspondencia: E-mail: soto@itdurango.edu.mx
Tel/Fax: (61) 88186936
Publicado por la Academia Mexicana de Investigación y Docencia en Ingeniería Química, A. C. 59
3. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
balance de óxido-reducción en la célula 1.2 Calcular rendimientos teóricos máximos
(Varma y Palsson, 1994; Torres y Voit,
Con base en el modelo estequiométrico
2002). Una poderosa herramienta para la
y la especificación de algunas restricciones
determinación de los flujos en la red de
en el metabolismo, es posible calcular el
reacciones bioquímicas es el análisis de flujos
rendimiento teórico máximo para un
metabólicos (AFM), en el cual los flujos
metabolito (van Gulik y Heijnen, 1995). Por
intracelulares son calculados usando un
ejemplo, Jørgensen y col. (1995) calcularon
modelo estequiométrico que describe la
el rendimiento teórico máximo de penicilina
bioquímica del microorganismo (Jørgensen y
a partir de glucosa para Penicillium
col., 1995; Nissen y col., 1997;
chrysogenum en un medio complejo, bajo la
Stephanopoulos y col., 1998). Sin embargo,
suposición de ausencia de crecimiento,
ya que el análisis cuantitativo del
mientras que Causey y col., (2004) realizaron
metabolismo requiere datos experimentales,
un estudio similar para la conversión de
es importante que la consistencia de los datos
glucosa en piruvato por Escherichia coli.
sea confirmada, antes de utilizarlos en la
determinación de flujos metabólicos
1.3 Identificar vías alternativas
(Stephanopoulos y col., 1998).
El AFM puede considerarse como un La formulación del modelo
campo de importancia fundamental y estequiométrico requiere de una información
práctica, que puede proporcionar bioquímica detallada. Sin embargo, en
contribuciones básicas, en la medición y muchos casos algunos detalles son
entendimiento del control de flujos in vivo, desconocidos o puede no saberse si una vía
que lleva a cabo la célula (Stephanopoulos y determinada está activa bajo las condiciones
col., 1998; Nielsen, 2001). Esto es de experimentación. Además, puede haber
particularmente útil en conexión con estudios varias isoenzimas con funciones que no son
de producción de metabolitos, donde el conocidas en detalle. Calculando los flujos
objetivo es dirigir tanto carbono como sea metabólicos con diferentes arreglos de vías
posible desde un sustrato hacia un producto bioquímicas, puede ser posible identificar
metabólico (Nissen y col., 1997). Por otra cuál de los arreglos es el que más
parte, el AFM es de gran utilidad para probablemente esté activo. Este uso del AFM
(Nissen y col., 1997; Stephanopoulos y col., fue ilustrado por Aiba y Matsuoka (1979), en
1998): el que se considera el primer trabajo de
aplicación del AFM, dónde se examinaron
varias vías anapleróticas en la producción de
1.1 Calcular flujos extracelulares no medidos
ácido cítrico por Candida lipolytica. Por otra
parte, Zhao y col. (2004) estudiaron los
En algunos casos, el modelo
cambios en el metabolismo central de E. coli
estequiométrico y los flujos extracelulares
por cambios genéticos en la vía de las
medidos permiten calcular, además de los
pentosas fosfáto.
flujos intracelulares, flujos extracelulares no
medidos o incluso algunos que sí fueron 1.4 Identificación de puntos ramificados de
medidos pero fueron intencionalmente control metabólico (rigidez de nodos)
omitidos en los cálculos. En éste último caso,
el grado de concordancia entre los flujos Mediante la comparación de la
medidos y las predicciones del modelo, distribución de flujos bajo diferentes
pueden servir para validarlo. condiciones de operación es posible
identificar si un nodo es flexible o rígido.
60
4. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
En un nodo flexible las proporciones redundancia de datos. Esta se introduce
de los flujos en las diferentes ramas se cuando se emplean sensores múltiples para
ajustan de acuerdo a las condiciones de medir la misma variable, o cuando las
cultivo, mientras que en un nodo rígido mediciones obtenidas guardan ciertas
las proporciones son constantes restricciones, tales como cumplir con
independientemente de las condiciones de balances elementales (Nielsen y Villadsen,
cultivo (Stephanopoulos y Vallino, 1991). 1994). La redundancia de datos también
Por ejemplo, en la producción de lisina por puede ser usada para la identificación
Corynebacterium glutamicum, se determinó sistemática de fuentes de errores gruesos en
que los nodos de glucosa-6-fosfato, piruvato las mediciones (van der Heijden, y col.,
y oxalacetato son flexibles, mientras que el 1994b; Stephanopoulos y col., 1998). Para
nodo de fosfoenolpiruvato es rígido (Vallino que el análisis de consistencia pueda
y Stephanopoulos, 1993; Tryfona y Bustard, funcionar, los datos experimentales que se
2005). En este trabajo se presenta una empleen deben tener las siguientes
revisión de las metodologías de análisis de características (Stephanopoulos y col., 1998):
consistencia y análisis de flujos metabólicos
y su aplicación a sistemas de fermentación. a) Completos. Se deben medir todos los
En lo subsiguiente, como caso de estudio, se sustratos y productos presentes en cantidades
utilizan los sistemas lineales derivados del significativas, lo que implica el uso de
proceso de fermentación estudiado por Soto- medios químicamente definidos. Cuando se
Cruz (2002), en el que se realizó cultivo utilizan medios complejos, los balances
continuo de la bacteria ruminal Megasphaera elementales no se cumplen si se considera el
elsdenii. Las reacciones metabólicas metabolismo en su conjunto (catabolismo y
consideradas se presentan en la Fig. 1 y se anabolismo), por lo cual el estudio se
detallan en la Tabla 2. Pueden distinguirse restringe generalmente al catabolismo sin
tres tipos de compuestos. Sustratos, como el considerar el crecimiento de la biomasa.
L-lactato, productos como biomasa, acetato y
CO2 y; compuestos intermediarios, como b) Libres de ruido (tanto como sea posible).
Acetil CoA, ATP y Eritrosa4P. El ATP Ya que las tasas de reacción son derivadas de
proviene de la fosforilación del ADP, el cual las mediciones de concentración, el ruido en
se omite por simplicidad, en este tipo de tales mediciones introduce incertidumbre en
estudios. Así mismo, debe señalarse que las variables derivadas.
cuantificación de los flujos metabólicos no En el modelo de caja negra todas las
toma en cuenta la regulación metabólica, lo reacciones celulares son agrupadas en una
que es tema del análisis de control sola reacción y el método básicamente
metabólico. La comparación de los mapas de consiste en la validación de balances
flujos metabólicos, obtenidos bajo diferentes elementales, considerando a la biomasa como
condiciones de cultivo o utilizando diferentes una caja negra que intercambia materiales
cepas, permiten determinar el impacto de con el medio. Los flujos de entrada y salida
perturbaciones genéticas o ambientales de la caja negra son, por una parte, las tasas
(Stephanopoulos y col., 1998; Torres y Voit, específicas de consumo de sustrato
2002). (elementos del vector rS) y, por otra parte, las
tasas específicas de formación de producto
2. Análisis de consistencia de datos
(elementos del vector rP). Además existe
experimentales
acumulación de biomasa dentro de la caja, la
El análisis de consistencia de datos cual es representada como un flujo de salida
experimentales puede realizarse aplicando la con tasa específica µ.
61
5. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
Fig. 1. Red metabólica considerada para el caso de estudio.
Tabla 1. Valores de la distribución χ2 hasta cinco grados de libertad (Tomada de Stephanopoulos y
col., 1998).
Nivel de confianza
Grados de libertad 0.500 0.750 0.900 0.950 0.975 0.990
1 0.46 1.32 2.71 3.84 5.02 6.63
2 1.39 2.77 4.61 5.99 7.38 9.21
3 2.37 4.11 6.25 7.81 9.35 11.30
4 3.36 5.39 7.78 9.49 11.10 13.30
5 4.35 6.63 9.24 11.10 12.80 15.10
62
6. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
Ya que todas las reacciones celulares 3. Un conjunto de tasas específicas de
están agrupadas en una sola reacción, los todos los sustratos y productos, incluida la
coeficientes estequiométricos de está biomasa.
reacción global están dados por los
coeficientes de rendimiento con respecto a la 4. Un conjunto de tasas volumétricas de
biomasa. La reacción global es: todos los sustratos y productos, incluida la
biomasa.
M N
X + ∑ Y XPi Pi − ∑ Y SPi S i = 0 (1) Cualquiera de los arreglos anteriores
i =1 i =1 proporciona los mismos resultados. Lo más
Dónde: usual es utilizar coeficientes de rendimiento
expresados con respecto a uno de los
X = Biomasa sustratos, usualmente la fuente de carbono.
Antes de presentar los balances elementales,
rPi es conveniente introducir la expresión de las
Y XPi = = Coeficiente de rendimiento del
rX fórmulas elementales de los compuestos
producto i con respecto a la biomasa. involucrados, normalizados con respecto a su
contenido de carbono. Por ejemplo, la
Pi = Producto i fórmula elemental de la glucosa, que es
rSi C6H12O6, se expresa como CH2O en base a un
YSPi = = = Coeficiente de rendimiento del
rX átomo de carbono. Así, el balance de
sustrato j con respecto a la biomasa. carbono, en base C-mol y considerando un
solo sustrato, es expresado como:
Si = Sustrato i M
∑Y
i =1
SPi + YSX + YSC = 1 (2)
Como el coeficiente estequiométrico de
la biomasa es uno, la tasa de reacción está
dada por la tasa específica de crecimiento de Dónde:
la biomasa, la cual, junto con los coeficientes rPi
de rendimiento especifican completamente el Y SP i = = Coeficiente de rendimiento del
rS
sistema. En la aplicación del modelo de caja
producto i con respecto al sustrato.
negra para el análisis de consistencia, se
puede utilizar cualquiera de los siguientes rX
Y SX = = Coeficiente de rendimiento de
conjuntos de datos (Stephanopoulos y col., rS
1998): biomasa con respecto al sustrato.
1. Un conjunto de coeficientes de rCO 2
rendimiento como los que aparecen en la Y SC = = Coeficiente de rendimiento del
rS
reacción global, junto con la tasa específica CO2 con respecto al sustrato.
de crecimiento.
En la Ec. 2 los coeficientes de
2. Un conjunto de coeficientes de rendimiento tienen unidades de C-mol por
rendimiento con respecto a otra referencia cada C-mol de sustrato. El CO2 se considera
(por ejemplo un sustrato), junto con la tasa separado de los demás productos, ya que no
específica de consumo/formación de ese contribuye al balance generalizado de grado
compuesto de referencia. de reducción:
63
7. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
M
biológicos. De esta manera, las Ecs. 2 y 3
∑Y
i =1
SP i γ P + Y SX γ
i X =γ S
(3)
establecen que el carbono y el grado de
reducción que se introduce a la caja negra,
debe ser recuperado en los productos que
Dónde: salen de ella. Es importante mencionar que la
composición elemental de la biomasa,
γ S = grado de reducción del sustrato
normalizada con respecto a su contenido de
γ p = grado de reducción del producto i
i carbono, que tiene la forma CHaObNc,
γ X = grado de reducción de la biomasa depende de su contenido macromolecular
(proteínas, carbohidratos, lípidos, etc.) y, por
Este balance fue introducido por Roels lo tanto, de las condiciones de cultivo. Sin
(1983), como una generalización del trabajo embargo, excepto para situaciones extremas,
de Erickson y col. (1978), quienes definieron es razonable usar la composición promedio
el grado de reducción de un compuesto como (CH1.81O0.52N0.21, con un 6% p/p de cenizas),
el número de electrones disponible para cuando la composición exacta de la biomasa
transferirse al oxígeno en la combustión del no es conocida (Stephanopoulos y col.,
compuesto. En el balance generalizado de 1998).
grado de reducción, el grado de reducción de De una manera similar al balance de
un compuesto es un factor de cálculo que se carbono que se presenta en la Ec. 2, pueden
elige por conveniencia, de manera arbitraria, escribirse balances para los otros elementos
de modo que los coeficientes que participan en la reacción expresada en la
estequiométricos para el dióxido de carbono, Ec. 1. Estos balances pueden ser
el agua, la fuente de nitrógeno, la fuente de convenientemente escritos colocando la
azufre y la fuente de fósforo, desaparezcan composición elemental de la biomasa,
del balance generalizado de grado de sustratos y productos en las columnas de una
reducción (Nielsen y Villadsen, 1994). Es matriz E, cuyos renglones representan a cada
decir, no hay una definición física del grado uno de los elementos involucrados. Para el
de reducción; éste es únicamente un factor de caso de un proceso en el que, además de la
cálculo y el planteamiento de Erickson y col. biomasa, se tengan M productos y N
(1978) es un caso particular. Para obtener el sustratos, que incluyan I elementos
grado de reducción de un compuesto dado, se (normalmente C, H, O y N) en su
debe tomar en cuenta lo siguiente. En primer composición, se tendrá una matriz E de I
lugar, se elige al átomo de hidrógeno como la renglones por M+N+1 columnas. Este es un
unidad de grado de reducción. sistema con I restricciones (balances
En seguida se selecciona un compuesto elementales que se deben cumplir) y M+N+1
con grado de reducción cero para cada tasas de reacción (r), el cual puede ser
elemento: H2O para oxígeno, CO2 para el representado por:
carbono, NH3 para el nitrógeno, H2SO4 para
el azufre y H3PO4 para el fósforo. Estas dos Er = 0 (4)
elecciones permiten establecer que el grado
de reducción de cada uno de los átomos
involucrados es -2 para el oxígeno, 4 para el Los grados de libertad (F) del sistema
carbono, -3 para el nitrógeno, 6 para el azufre son F = M+N+1-I. Si se tienen exactamente
y 5 para el fósforo. Así, puede obtenerse el F tasas de reacción medidas, es posible
grado de reducción de los compuestos más calcular las demás, pero no hay redundancias
comunes que intervienen en procesos para validar la consistencia de los datos.
64
8. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
De manera que es recomendable todos los compuestos que intervienen en el
planear la medición de más mediciones que proceso, expresados en base C-mol, y sus
los grados de libertad del sistema. En el caso tasas netas de consumo/producción. Los
de un sistema en el que se tenga un número balances se escriben como sigue.
mayor de mediciones experimentales, que de Cada renglón de la matriz E contiene
grados de libertad, el sistema se denomina los coeficientes estequiométricos de un
sobredeterminado. En éste caso, la balance elemental (de arriba a abajo, C, H, O
redundancia de las mediciones puede ser y N) y cada columna contiene los coeficientes
usada para: de la fórmula, en base C-mol, de los
compuestos que intervienen en el proceso (de
• Calcular las tasas no medidas.
izquierda a derecha, lactato, biomasa, acetato,
• Incrementar la exactitud de las
mediciones disponibles. propionato, butirato, valerato, NH3, CO2 y
• Identificar si existe una fuente de errores H2O). Se tienen dos sustratos (lactato y NH3)
gruesos en las mediciones. y siete productos (biomasa, acetato,
propionato, butirato, valerato, CO2 y H2O),
Para el caso de estudio, el análisis de por lo tanto, los grados de libertad del
los datos comienza planteando los balances sistema son: F = 2 + 7 - 4 = 5. De manera que
elementales de C, H, O y N, lo cual se conoce se deben medir al menos cinco compuestos
como modelo de caja negra, considerando para que el sistema tenga solución única.
Balance de carbono:
rlactato + rbiomasa + racetato + rpropionato + rbutirato + rvalerato + rCO2 = 0 (5)
Balance de hidrógeno:
2rlactato + 1.81rbiomasa + 2racetato + 2rpropionato + 2rbutirato + 2rvalerato + 3rNH3 + 2rH2O = 0 (6)
Balance de oxígeno:
rlactato + 0.52rbiomasa + racetato + 2/3rpropionato + 1/2rbutirato + 2/5rvalerato + 2rCO2 + rH2O = 0 (7)
Balance de nitrógeno:
0.21rbiomasa + rNH3 = 0 (8)
Estas cuatro Ecs. constituyen un sistema lineal similar a la Ec. 4, que en este caso se escribe:
r Lactato
rBiomasa
r
0
Acetato
1 1 1 1 1 1 0 1 0
rPr opionato
2 1 . 81 2 2 2 2 3 0 2 0 (9)
1 rButirato =
0 . 52 1 2/3 1/ 2 2/5 0 2 1 0
rValerato
0 0 . 21 0 0 0 0 1 0 0 0
r NH 3
rCO
rH O
2
2
65
9. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
Ya que se midieron seis compuestos metodología que se detalla a continuación. La
(lactato, biomasa, acetato, propionato, matriz y el vector del lado izquierdo de la Ec.
butirato y valerato), el sistema es 9 pueden verse como vectores de dos
sobredeterminado y puede validarse la componentes que tienen como entradas a la
calidad de los datos experimentales, matriz Em y Ec, y los vectores rm y rc,
calculándose el índice de consistencia en el respectivamente, como se muestra a
modelo de caja negra, h (Stephanopoulos y continuación:
col., 1998), para lo cual se utiliza la
rLactato
rBiomasa
r
0 0
Acetato
1 1 1 1 1 1 0 1
rPr opionato 0
2 2 3 2
=
1 . 81 2 2 2 0
rButirato
1 2 / 5 0 1 0
0 . 52 1 2 / 3 1/ 2 2
rValerato (10)
0
0 . 21 0 0 0 0 1 0 0
0
rNH 3
r
CO 2
rH O
2
o bien: cuadrada, la solución del sistema está dada
por la Ec. (Noble y Daniel, 1977):
0
(11)
(E m
r
E c ) m
r
c
0
=
0
(
rc = − E c E c
T
)
−1 T
E C E m rm (13)
0
Una vez calculadas las tasas de
De manera que al hacer la multiplicación de consumo/producción no medidas, puede
matrices del lado izquierdo de la Ec. 11, se validarse la consistencia global de las tasas
obtiene: medidas y calculadas. Para esto, se inserta la
Ec. 13 en la Ec. 12, con lo que se obtiene:
E m rm + E c rc = 0 (12)
Rrm = 0 (14)
La matriz Em contiene los coeficientes de la donde R es la matriz de redundancia (van der
composición elemental de los compuestos Heijden y col., 1994a, van der Heijden y col.,
medidos y el vector rm contiene las tasas de 1994b) que está dada por:
consumo/producción de tales compuestos.
Por su parte, la matriz Ec contiene los
coeficientes de la composición elemental de
R = Em − Ec Ec Ec
T
( )−1
ET E m
c
(15)
los compuestos no medidos, mientras que el
vector rc contiene las tasas de El rango de R, es decir, el número de
consumo/producción de los compuestos no vectores renglón linealmente independientes,
medidos. Como el sistema es está relacionado con las variables medidas y
sobredeterminado y la matriz Ec no es especifica el número de ecuaciones
independientes que tienen que satisfacerse.
66
10. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
Las Ecs. linealmente dependientes se distribución χ2 y que los grados de libertad
eliminan, quedando la matriz de redundancia son iguales al rango de R (Wang –y
reducida, Rr, la cual constituye la base del Stephanopoulos, 1983; van der Heijden y
análisis posterior. Como consecuencia del col., 1994b, van der Heijden y col., 1994 c).
error experimental, la Ec. 14 no se cumple Por lo tanto, comparando el valor calculado
exactamente. Al eliminar los renglones de la función h con los valores de la
linealmente dependientes y multiplicar Rr por distribución χ2 a los grados de libertad
rm, debería obtenerse un vector cero. Sin correspondientes [rango(R)], es posible
embargo, debido al error experimental lo que validar la calidad de los datos y la
se obtiene es un vector de residuos, ε, dado aplicabilidad del modelo (Stephanopoulos y
por: col., 1998). Los valores de la distribución χ2
se presentan en la Tabla 1. La manera de
ε = Rr rm (16) interpretar los datos obtenidos es la siguiente.
Se rechaza la hipótesis de que la cantidad de
De manera que, si se dispone de estimaciones error presente en las mediciones no es
de los errores de medición, se puede suponer significativa, si h ≥ χ2 a un nivel de confianza
que el vector de error es normalmente y grados de libertad dados. Un nivel de
distribuido, con media cero y matriz de confianza de 90 o 95% es usualmente
varianza-covarianza F. van der Heijden y col. adecuado (Wang y Stephanopoulos, 1983).
(1994b) demostraron que los residuos de la Una vez que se ha determinado que no
ecuación 16 también son normalmente existen errores gruesos de medición, es decir,
distribuidos, con media cero y matriz de que la calidad de los datos se ha validado, se
varianza-covarianza, P, dada por: pueden calcular las tasas de
consumo/producción no medidas que
P = R r FR r
T
(17) contiene el vector rc, utilizando la Ec. 13
(Stephanopoulos y col., 1998). Más aún, es
La matriz F es una matriz diagonal cuadrada, posible calcular mejores estimados para las
cuyos elementos de la diagonal principal se tasas medidas, utilizando la Ec:
calculan elevando al cuadrado el producto de
los correspondientes valores de las tasas rm = rm + δ (19)
medidas por sus desviaciones estándar (Wang
y Stephanopoulos, 1983). Una vez que se
donde rm es el vector de estimados de las
tienen calculados el vector de residuos (ε) y
variables medidas y δ es el vector de los
su correspondiente matriz de
estimados de los errores de medición, que
varianza-covarianza (P), se puede calcular el
está dado por (van der Heijden y col., 1994b):
índice de consistencia, h, dado por:
−1 δ = FR r P −1 R r rm
T
(20)
h = εTP ε (18)
Si, por otra parte, el valor de la función h es
que es una función de prueba, la cual permite
mayor o igual al correspondiente valor de χ2,
establecer si los residuos son
indicando errores gruesos de medición, es
significativamente diferentes de cero. Si esto
posible identificar qué variable medida es la
ocurre, el modelo es incorrecto o existe error
fuente de tales errores. El procedimiento
sistemático en al menos una medición
consiste en eliminar cada una de las
(Stephanopoulos y col., 1998). Se ha
mediciones realizadas (una a la vez) del
demostrado que la función h sigue una
67
11. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
vector de tasas medidas, colocarla en el El producto final del cálculo es un mapa
vector de tasas no medidas y calcular la de flujos metabólicos que muestra la tasa (es
función h. Cuando al eliminar una medición decir el flujo) a la cual ocurre cada una de las
del vector de tasas medidas y calcular la reacciones (Stephanopoulos y col., 1998).
función h, se obtenga un valor más pequeño Sobre el sistema lineal contenido en la matriz
que el correspondiente de la función χ2, A, se pueden hacer algunos comentarios que
puede concluirse que la medición eliminada resultan valiosos y que es conveniente
es la fuente de error (Stephanopoulos y col., considerar antes de hacer experimento
1998) y corregirse su valor, calculándolo alguno. Si la matriz estequiométrica es
junto con las tasas no medidas, utilizando la singular, dos o más reacciones son
Ec.13. La metodología anteriormente linealmente dependientes y no existe una
expuesta permite, mediante los balances solución única del sistema (Nissen y col.,
elementales, validar calidad de los datos que 1997; Vanrollegem y Heijnen, 1998). Una
se obtiene de una fermentación, detectar singularidad típica aparece cuando el ciclo de
errores gruesos de medición y aún los ácidos tricarboxílicos, el ciclo del
corregirlos, además de calcular los datos no glioxalato y la reacción anaplerótica de la
medidos. piruvato carboxilasa se consideran juntas
(Stephanopoulos y col., 1998):
2. Análisis de flujos metabólicos
Ciclo de los ácidos tricarboxílicos: Piruvato →
Una vez que la consistencia de los datos 3CO2 + 4NADH + FADH + GTP
experimentales se ha validado y la red de
reacciones bioquímicas ha sido determinada, Ciclo del glioxalato: 2Piruvato → 2CO2 +
la información se colecta en una matriz Oxalacetato + 4NADH+ FADH
estequiométrica (A). Las tasas de reacción, o
flujos metabólicos, son calculadas con base Piruvato carboxilasa: Piruvato → + ATP + CO2
Oxalacetato
en una suposición de estado
pseudoestacionario para las concentraciones
Si ATP y GTP se consideran iguales (lo
intracelulares de los metabolitos (Vallino y
cual se hace frecuentemente en el análisis de
Stephanopoulos, 1990). Una consecuencia
reacciones celulares), es obvio que el ciclo
importante de esta suposición es que todos
del glioxalato es una combinación lineal de
los metabolitos que no se encuentren en una
las otras dos vías. Las singularidades sólo
ramificación de la red metabólica pueden ser
pueden ser eliminadas cambiando la red
eliminados, dando como resultado que todas
metabólica, adicionando o removiendo
las reacciones que ocurren entre dos
reacciones, sin embargo, esto debe hacerse
metabolitos localizados en ramificaciones
respetando los principios de la bioquímica
pueden representarse con una sola reacción,
fundamental (Nissen y col., 1997). Una
sin que esto signifique ninguna pérdida de
herramienta muy usada, para determinar la
información Vallino y Stephanopoulos, 1990;
presencia o ausencia de reacciones, es la
Vallino y Stephanopoulos, 1993), con lo que
realización de ensayos in vitro de enzimas
el modelo se hace más simple y más robusto
intracelulares (Nissen y col., 1997;
(Vallino y Stephanopoulos, 1990; Schulze,
Stephanopoulos y col., 1998).
1995). Como entrada para los cálculos se
Es importante señalar que cualquier
utiliza un conjunto de flujos extracelulares
modelo estequiométrico debe sujetarse a un
medidos, típicamente tasas de consumo de
análisis de sensibilidad, para lo cual el primer
sustratos y tasas de secreción de productos
indicador es el número de condición (C) de la
(Nissen y col., 1997).
68
12. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
matriz estequiométrica (Vallino y se tiene redundancia y la solución es única,
Stephanopoulos, 1990), que se calcula de la mientras que si se dispone de menos
siguiente manera (Noble y Daniel, 1977): mediciones de las necesarias, se obtiene toda
una familia de soluciones (Stephanopoulos y
C (A ) = A × A # (21) col., 1998). Si se requiere de una solución en
particular, y no es posible medir más
Dónde: variables para hacer determinado el sistema,
la programación lineal combinada con alguna
= alguna norma matricial función objetivo, es decir una restricción,
A# = pseudoinversa, dada por:
puede usarse para obtener una solución
deseada (Watson, 1986; Savinell y Palsson,
1992), por ejemplo, maximizar el
(
A# = AΤA )
−1
AΤ (22) rendimiento de algún componente dado (Fell
y Small, 1986; Varma y col., 1993a) o
C es un indicador del error numérico que minimizar algún costo (Varma y col., 1993b).
puede acumularse al resolver el sistema. Si C Finalmente, con más mediciones de las
es del orden de 10k y el vector de residuos es necesarias para tener un sistema determinado,
del orden de 10-eudoinversa, dada por: además del cálculo de los flujos metabólicos,
j
, puede esperarse un vector de errores del la validez del proceso puede ser
orden de 10k-j cuando se resuelve el sistema rigurosamente comprobada (Stephanopoulos
(Schulze, 1995). El análisis de sensibilidad y col., 1998).
del vector de flujos calculados (x) con Una vez que se ha determinado que los
respecto al vector de las tasas medidas (r) se datos experimentales cumplen
hace calculando la matriz (Vallino y satisfactoriamente con los balances
Stephanopoulos, 1990): elementales, se retoma el modelo
estequiométrico y se calcula la función índice
δx de consistencia para el modelo
= (A Τ A ) A Τ
−1
(23) estequiométrico propuesto, hME, para validar
δr
la suposición de estado pseudoestacionario
(Stephanopoulos y col., 1998).
Los elementos de la matriz dada por la Ec. 23
Cada una de las reacciones del modelo
permiten identificar qué flujos se verán
estequiométrico ocurre a una tasa de reacción
afectados por determinadas mediciones. Por
desconocida hasta este momento. Para la i-
ejemplo, si el ij-ésimo elemento de la matriz
ésima reacción, xi representa su tasa de
es mayor que 1, quiere decir que el flujo i es
reacción (es decir, el flujo). La tasa global de
particularmente sensible a errores en la
cambio (r), para cada metabolito intracelular,
medición de la tasa j (Schulze, 1995), lo que
es la suma algebraica de los flujos de las
significa que habrá que hacer la medición de
reacciones en las que interviene multiplicados
la tasa j con extremo cuidado. La
por los correspondientes coeficientes
determinación estequiométrica de los flujos
estequiométricos y, por la suposición de
metabólicos intracelulares puede basarse en
estado pseudoestacionario, es igual a cero. De
igual número de balances de metabolitos, o
manera que, para cada metabolito intracelular
en un número menor o mayor de tales
del caso de estudio, puede escribirse:
balances, dependiendo del número de
mediciones disponibles. En el primer caso no
69
14. O. Soto-Cruz y J. Páez-Lerma / Revista Mexicana de Ingeniería Química Vol. 4 (2005) 59-74
célula. Este sistema lineal es utilizado para donde las tasas ri corresponden a los flujos
validar la suposición de estado extracelulares medidos, lo cual puede
pseudoestacionario y, posteriormente para la deducirse de la Fig. 1. Por lo tanto, el vector
determinación de flujos metabólicos, de xc contiene los restantes flujos metabólicos
acuerdo a la metodología detallada a desconocidos. La matriz Am contiene las
continuación. La matriz A es equivalente a la columnas 1, 3, 6, 7, 8 y 19 de la matriz A,
matriz E, utilizada en el modelo de caja que corresponden a los flujos medidos,
negra, por lo que puede ser separada en dos mientras que la matriz Ac contiene las
matrices Am y Ac que contengan los restantes columnas de la matriz A. Una vez
coeficientes estequiométricos validada la suposición de estado
correspondientes a las tasas de reacción pseudoestacionario, las Ecs. 13 y 19 podrían
medidas y no medidas, respectivamente. De utilizarse para calcular los flujos metabólicos
manera similar, el vector x (vector de flujos desconocidos, es decir, los elementos del
desconocidos de las reacciones = [x1, x2, vector xc (Stephanopoulos y col., 1998). Sin
.x20]T) puede separarse en dos vectores xm y embargo, un método diferente descrito por
xc que contengan las tasas de reacción Tsai y Lee (1988), proporciona los mejores
medidas y no medidas, respectivamente. Así, estimados para los flujos metabólicos
la Ec. 40 puede escribirse como: medidos y no medidos. En este método la Ec.
40 se reformula para expresarse como:
Am xm + Ac xc = 0 (41)
xm 1 0 x m (43)
Ya que se tienen 20 flujos intracelulares
0 =
A = Tx
m A c x c
desconocidos y 15 balances estequiométricos,
los grados de libertad del sistema son 5, es
decir, se requiere medir al menos 5 flujos donde I es la matriz identidad de dimensión
para poder resolver el sistema. Sin embargo, igual al número de flujos medidos (en caso de
ya que se midieron 6 flujos, el sistema es estudio, de 6X6). En la matriz A las columnas
sobredeterminado. Por la similitud de la se intercambian para que al principio se
matriz A con la matriz E, las ecuaciones 14 a tengan juntas las columnas que corresponden
18 se utilizan para calcular la función h, a las reacciones cuyos flujos son medidos,
usando xm, Am y Ac en lugar de rm, Em y Ec, mientras que otro tanto se hace con el vector
para el modelo estequiométrico, con lo que se x. El primer renglón de la Ec. 43
puede validar la suposición de estado simplemente establece que xm es igual a xm,
pseudoestacionario (van der Heijden y col., mientras que el segundo renglón es idéntico
1994a, van der Heijden y col 1994b, van der con la Ec. 41. La Ec. 43 se escribe, para el
Heijden y col., 1994c). Para el caso de caso de estudio, de manera extendida como
estudio, el vector xm está dado por: se muestra Ec. 44:
Para mayor claridad, en la Ec. 44 las líneas
x1 rLactato separan a cada una de las matrices y vectores
que componen el sistema. Las Ecs. 43 y 44
x3 rPr opionato introducen una separación estricta entre los
x r vectores de flujos medidos y no medidos.
6 = Acetato Para resolver el sistema, se debe hacer una
x7 rValerato (42)
partición diferente de la matriz T, que se
x r muestra Ec. 45
8 Butirato
x r
19 Biomasa
71