3. Elaboración de gráficos y análisis de regresión

Uno de los objetivos del experimentador es tratar de expresar la relación entre las diferentes variables en su experimento en la forma de una ecuación matemática.

Cuando una cantidad se relaciona con otra por medio de alguna ecuación, se dice que una de las cantidades es función de la otra. Así, si la variable observable y está relacionada con la variable x, se dice que y es una función de x. Generalmente, esta relación se escribe, en notación abreviada, como y = f(x) la cual se lee: “y es una función de x”. Cuando los valores de y dependen de los de x, y se denomina variable dependiente y x es la variable independiente. La tarea que nos ocupa ahora es analizar las diferentes formas que puede adoptar una función f(x) obtenida a partir de una serie de datos experimentales.

Una de las mejores maneras de llegar al tipo de dependencia funcional que existe entre dos variables, es dibujar una gráfica de las variables en un sistema cartesiano de coordenadas. Los valores experimentales de la variable independiente se marcan en el eje horizontal (abscisa) y la variable dependiente se marca sobre el eje vertical (ordenada). Después de analizar si la tendencia de los puntos en el gráfico se ajusta a una línea recta o a una curva, se puede determinar la naturaleza de la función que relaciona las variables, especialmente si esta función tiene una forma sencilla.

La construcción de gráficas debe iniciarse con la elaboración de una tabla de los datos, los cuales pueden disponerse en columnas o en filas. Toda tabla debe llevar un titulo explicativo que indique el significado de los datos y la forma como fueron obtenidos.

Uno de los requisitos más importantes de un gráfico, es la elección de escalas para los dos ejes de coordenadas. Debe tenerse presente que un gráfico de datos de laboratorio carece de significado si no se identifica cada eje con la cantidad medida y las unidades utilizadas para medir. Algunas sugerencias para la elaboración de gráficas se presentan a continuación:

• Poner un título al gráfico que sea conciso y claro.
• Seleccionar una escala que facilite la representación y la lectura. Se deben elegir escalas que puedan subdividirse fácilmente. Valores recomendables son 1, 2, 5 y 10 unidades por escala de división. No se recomiendan escalas como 3, 7, 6, 9 debido a que hacen difícil la localización y la lectura de los valores en el gráfico. Procurar que el gráfico ocupe la mayor parte de hoja de papel.
• No es necesario representar ambas cantidades en la misma escala, ni que comience en cero.
• Representar todos los datos observados. Demarcar claramente los puntos experimentales con un punto dentro de un pequeño círculo, o dentro de un triángulo, o algún otro símbolo semejante. Unir el mayor número de puntos con una curva suave, de modo que aquellos que queden por fuera de la curva queden igualmente repartidos por encima y por debajo. Si el gráfico no es una recta, puede utilizarse para el trazado una plantilla especial llamada curvígrafo.


3.1 Relaciones lineales

La relación más simple entre variables es la de tipo lineal. La gráfica de una función lineal es una recta y la forma general de la función es como sigue:

y = mx + b                        (1)

en donde m es la pendiente de la línea y b su intercepto con el eje y, es decir el valor de y cuando x = 0. Por ejemplo, en la fórmula para convertir grados Fahrenheit (ºF) a grados centígrados (ºC):

ºF = 9/5 ºC + 32             (2)

9/5 es la pendiente de la línea y 32 es el intercepto con y cuando x = 0. Esta ecuación nos permite convertir grados Fahrenheit a grados centígrados o viceversa. En este caso se dice que la escala Fahrenheit está relacionada en forma lineal con la escala centígrada, aunque no son directamente proporcionales.

Si el gráfico de datos aparece sobre el papel como una recta que pasa por el origen, entonces su ecuación es de la forma y = mx, entonces y varía en forma directamente proporcional a x.

Ejemplo 1. Se midió la solubilidad del KCl en agua a diferentes temperaturas, expresada como g KCl/100 g H2O, y se obtuvieron los siguientes datos:

S (%)
30
31
35
36
40
42
45
49
51
T (ºC)
10
20
30
40
50
60
70
80
90

Encontrar la ecuación que relaciona la solubilidad del KCl en agua con la temperatura.

Los datos aparecen graficados en la figura 5. La tendencia es lineal o sea que se ajusta a una función de la forma y = mx + b, donde y corresponde a la solubilidad y x a la temperatura. Es decir que: S = mT + b.

Para estimar los valores de m y de b, se aplicará el método de los mínimos cuadrados:

                        (3)


Figura 5. Representación gráfica de los datos del ejemplo 1

En la tabla No. 2 aparecen las sumatorias que se requieren en la ecuación (3) para determinar el valor de la pendiente (m) y el intercepto (b).


Tabla No. 2 Determinación de una función lineal por mínimos cuadrados

x = T (°C)
y = S (%)
xy
x2
10
30
300
100
20
31
620
400
30
35
1050
900
40
36
1440
1600
50
40
2000
2500
60
42
2520
3600
70
45
3150
4900
80
49
3920
6400
90
51
4590
8100
S x = 450
(S x)2 = 202500
S y = 359
S xy = 19590
S x 2 = 28500

Con n = 9, se tiene que .   
   Análogamente, b = 26.2.

La función que representa la relación entre la solubilidad y la temperatura es, por lo tanto:

S = 0.273 T + 26.2.


3.2 Relaciones de proporcionalidad inversa

La relación inversa de primera potencia está dada por la ecuación:

y = k/x             o            xy = k                                                 (4)

Esta ecuación establece que y varía inversamente a la primera potencia de x, es decir conforme aumentan los valores de x, y disminuye, y al disminuir x, y aumenta; k es una constante de proporcionalidad. Un ejemplo de este tipo de función, en química, es la ley de Boyle, que establece la relación entre la presión P de un gas y su volumen V, a temperatura constante. Cuando los valores de P se grafican en función de V, a temperatura constante, se obtiene una hipérbola (figura 6).


Figura 6. Función inversa

La ecuación (4) puede escribirse en la siguiente forma:

               (5)

donde m = k   y   b = 0. De esta manera, la función inversa se ha convertido en una función lineal de la forma y = mx + b   con    x = 1/V. En este caso, se debe graficar P contra 1/V para obtener una recta (figura 7). El método de los mínimos cuadrados se aplica de manera similar a como se ilustró en el ejemplo 1 (véase el ejemplo 2).


Figura 7. Linearización de la ley de Boyle


3.3 Relaciones exponenciales y logarítmicas

Las funciones definidas por:

y = e x      y       y = e - x                           (6)

se denominan funciones exponenciales. Al convertirlas en una función logarítmica y graficar los datos se obtiene una línea recta. En efecto, al sacar logaritmo en ambos lados de la ecuación, se obtiene ln y = x que es una ecuación de la forma y’ = mx + b

Ejemplo 2. El peróxido de hidrógeno se descompone en agua y oxígeno de acuerdo con la reacción: H2O2 --> H2O + 1/2 O2(g). Se midió experimentalmente la concentración del peróxido a diferentes intervalos de tiempo:

Tiempo (s)
0
200
400
600
800
900
2000
Concentración (mol/L)
23.0
19.3
16.2
13.6
11.4
10.5
1.5

Se sabe que la descomposición del peróxido corresponde a una cinética de primer orden la cual se ajusta a una función exponencial (figura 8) de la forma:

C = Coe - kt                   (7)


Figura 8. Gráfico de los datos del ejemplo 2

donde k es una constante y Co, C es la concentración del peróxido en t = 0 s y después de t s, respectivamente.

Utilizando logaritmos, la ecuación (7) se convierte en ln C = - kt + ln Co que es la ecuación de una línea recta de pendiente m = k e intercepto b = ln Co   (figura 9). En la tabla No. 3 se muestran todos los cálculos necesarios para estimar el valor de k usando el método de los mínimos cuadrados ilustrado en el ejemplo 1.


Figura 9. Linearización de la función exponencial (ejemplo 2)

Tabla No. 3 Análisis de la descomposición del H2O2

x = t (s)
C (mol / L )
Ln C = y
xy
x2
0
23.0
3.14
0
0
200
19.3
2.96
592
40000
400
16.2
2.79
1114
160000
600
13.6
2.61
1566
360000
800
11.4
2.43
1945
640000
900
10.5
2.35
2116
810000
2000
1.5
0.41
811
4000000
S x = 4900
(S x)2 = 24010000
 
S y = 16.69
S xy = 8146
S x 2 = 6010000

El análisis da como resultado que m = k = - 0.0014. Por lo tanto: C = Co e - 0.0014t

3.4 Coeficiente de ajuste

Para todos los casos anteriores, el coeficiente de regresión r2 indica el nivel de concordancia entre los datos experimentales y la recta de regresión. Un valor de r2 igual o cercano a 1 indica un ajuste perfecto de los datos, mientras que valores más bajos de r2 indica que los datos no se acomodan satisfactoriamente a una línea recta en cuyo caso el comportamiento de las variables definitivamente no es lineal.
El coeficiente de regresión se determina mediante la expresión:

                       (8)