Saturday, 25 March 2017
Minimos cuadrados

Mínimos cuadrados

La técnica de mínimos cuadrados es empleada para obtener la ecuación que mejor se ajusta a un conjunto de datos. Se parte de la suposición "El comportamiento de los datos debe ser de tal forma", es decir, se puede suponer que el comportamiento de los datos deber lineal o bien logarítmico o cuadrático, etc. De esa familia se obtiene la que mejor representa a los datos.
Las condiciones utilizadas en la técnica de mínimos cuadrados son:
  • Se tiene definida una familia de funciones que tiende a representar al conjunto de datos.
  • La función probable de representar al conjunto de datos, debe ser tal que la suma de las diferencias entre el dato que predice la ecuación y el de la tabla de valores iniciales de cero.
  • La varianza entre los datos experimentales y los que predice la ecuación de mejor ajuste debe ser mínima.

Regresión lineal con una variable independiente

En muchos casos durante la realización de prácticas de laboratorio se encuentran situaciones en las que se requiere analizar la relación entre dos variables medibles (cuantitativas). Los objetivos de análisis podrían ser, por un lado determinar si dichas variables están asociadas y en qué sentido se da dicha asociación. Por otro lado, estudiar si los valores de una variable pueden ser utilizados para predecir el valor de la otra.
Se tiene un conjunto de datos que se supone pueden ser descritos por una ecuación lineal con cierto grado de precisión. La recta que describe a los datos posee dos parámetros de ajuste 8 pendiente e intercepción). En algunos casos la intercepción debe ser cero debido a consideraciones reales. Por ejemplo, en los experimentos de Física en muchos casos el objeto parte del reposo y de la posición inicial cero. En este caso, si se obtiene una relación entre velocidad y tiempo, la intercepción debe valer cero forsozamente. Debido a esta naturaleza se tienen dos tipos de análisis de regresión lineal, una que permite que la intercepción tenga un valor diferente de cero (libre) y otra que obliga a que esta sea cero (restringida).

Regresión lineal libre

En la regresión lineal libre la intercepción puede valer cero pero no obligatoriamente. Para calcular los coeficiente de regresión se puede utilizar las siguientes fórmulas:

Intercepción = (Suma x2 * Suma y - Suma x * Suma xy)/(n* Suma x2 - [Suma x]2)


Pendiente = (n*Suma xy - suma x * Suma xy)/(n*Suma x2 - [Sumax]2)


donde n es el número de pares ordenados de la tabla inicial.

En la determinación de los coeficientes de regresión, es muy útil la utilización del coeficiente de correlación r. si el valor de r es positivo la pendiente debe ser positiva si el r es negativo la pendiente debe ser negativa. Si r igual a 1, la recta de mejor ajuste debe tener pendiente positiva y pasar por todos los puntos. Si r = -1, la pendiente es negativa y la recta de mejor ajuste debe pasar por todos los puntos. Si valor absoluto de r es menor que uno significa que la reta de mejor ajuste no contiene a todos los puntos, puede darse el caso que ni siquiera unpunto sea contenido en ella.


Ejemplo:

Durante una prueba de materiales se realizacron mediciones de deformación de un hilo al ser expuesto a diferentes fuerzas. En el rango de fuerzas aplicadas, el comportamiento de los datos de fuerza vrs cambio de longitud se supone que es lineal. Sin tomar en cuenta que para una fuerza de 0 N la deformación debe ser 0 m, determine la ecuación que describe el comportamiento de los datos.

Tabla 1. Valores de deformación de un hilo al aplicársele una fuerza.
Fuerza (N) Deformación (mm)
3,0 10
4,1 13,3
5,0 17
6,2 19,5
7,0 22
8,0 25

Cuya gráfica de dispersión se muestra a continuación.

Figura 1.
Gráfica de dispersión de fuerza versus elongación para un resorte.
Gráfica de dispersión

Para aplicar las fórmulas antes mencionadas se necesita realizar la siguiente tabla.

Tabla 2. Valores asociados al cálculo de los coeficientes de regresión.
Fuerza (N) Deformación (mm) F*Deformación (Nmm) Fuerza2(N2)
3,0 10 30,0 9,0
4,1 13,3 54,5 16,8
5,0 17 85,0 25,0
6,2 19,5 120,9 38,4
7,0 22 154,0 49,0
8,0 25 200,0 64,0

Sume columnarmente los valores y obtenga los valores de la pendiente y la intercepción.

pendiente = ( 6*644,4 - 33,3*106,8)/(6*202.2 - 33,3*33,3) = 2,97 N/mm

intercepción = (202,2*106,8 - 33,3*644,4)/(6*202,2 - 33,3*33,3) = 1,31 N


La incertidumbre de la pendiente se calcula como Se*(n / [n*Suma x2 -(Suma x)2])0.5

La incertidumbre de la intercepción se calcula mediante Se*(Suma x2 / [n*Suma x2 - (Suma x)2])0.5

Donde Se = ([1/(n -2)]* Suma ( y - b - ax)2 )0.5, lo cual es conocido como error estándar de la función.

Regresión lineal restringida

La regresión lineal restringida puede ser usada para aquellas relaciones de proporcional directas y que para el valor de coordenada indipendiente igual a cero la variable dependiente tenga que valer cero.

El cálculo de la pendiente se realizaría mediante la siguiente fórmula:
pendiente = (Suma xy) /(Suma x2)

Para el caso de los datos anteriores la suma de los xy da 644, mientras que la suma de los x2 da 202.2, por lo tanto la recta de mejor ajuste restringida sería:

deformación = 3,19 * Fuerza

Nota: Para los dos casos se utiliza el error estándar de la función (Se) para evaluar que tan alejados se encuentran los valores de y iniciales respecto a la imagen correspondiente a la evaluada con la curva de mejor ajuste.

Se2 = (Suma de las restas entre las y inicial menos y predicho por la ecuación, al cuadrado) /( número de pares -2)
Se2 = Suma ( y - ycurva)2/(n-2)

{backbutton}