Quadrados Mínimos

Página Inicial
ESPAÇOS VETORIAIS
Espaços Vetoriais
Subespaços Vetoriais
Combinação Linear
Subespaços Gerados
Intersecção de Subespaços
Soma de Subespaços
Dependência Linear
Base e Dimensão
Mudança de Base

TRANSFORMAÇÕES LINEARES
Transformações Lineares
Núcleo e Imagem
Teorema do Núcleo e da Imagem
Isomorfismo e Automorfismo
Álgebra das Transformações Lineares
Matriz de uma Transformação

AUTOVALORES E AUTOVETORES
Autovalores e Autovetores
Polinômio Característico
Diagonalização

ESPAÇOS COM PRODUTO INTERNO
Produto Interno
Norma e Distância
Ortogonalidade

DETERMINANTES
Determinantes
Propriedades do Determinante
Cálculo de Determinantes

SISTEMAS LINEARES
Sistemas Lineares
Operações Elementares
Sistemas Triangulares
Eliminação Gaussiana

FATORAÇÕES MATRICIAIS
Fatoração LU
Fatoração de Cholesky
Fatoração Ortogonal
Fatoração QR - Processo de Gram-Schmidt
Fatoração QR - Transformações de Householder

QUADRADOS MÍNIMOS
Método de Quadrados Mínimos
Ajuste de Curvas
Problemas Aplicados

 OUTRAS APLICAÇÕES
Curvas e Superfícies por Pontos Especificados
Criptografia
Jogos de Estratégia
Classificação de Cônicas


Problemas de Quadrados Mínimos

Em diversas situações é comum que a solução de um problema leve a um sistema linear que teoricamente deveria ser consistente, mas que na prática não é, devido a erros em medições ou aproximações. Sistemas inconsistentes ou impossíveis são aqueles que não possuem nenhuma solução exata.

Um sistema Ax=bAx = b inconsistente também é importante em aplicações e, como não podemos obter sua solução exata, surge a necessidade de obtermos um elemento x¯\bar{x} que chegue o mais próximo possível de ser uma solução, no sentido de que minimiza o erro de aproximação.

Sistemas inconsistentes são geralmente da forma Ax=bAx = b, onde A𝕄m×n()A \in \mathbb{M}_{m \times n}(\mathbb{R}) com m>nm > n, isto é, com mais equações do que incógnitas. Queremos encontrar um elemento x¯n \bar{x} \in \mathbb{R}^n de modo que:

Ax¯-b2=min{Ax-b2xn}\left\| A\bar{x} - b \right\|_2 = \min\left\lbrace \left\| Ax - b \right\|_2 \mid x \in \mathbb{R}^n \right\rbrace
Dizemos que o elemento x¯\bar{x} é uma solução de quadrados mínimos para o sistema Ax=bAx = b. Se o sistema é consistente e x¯\bar{x} é uma solução exata, então o erro é nulo, pois Ax¯-b2=0\left\| A\bar{x} - b \right\|_2 = 0.

Seja r=Ax-br = Ax - b o vetor resíduo que resulta da aproximação xx como solução do sistema Ax=bAx = b. Se r=(r1,r2,...,rn)r = \left(r_1, r_2, ..., r_n\right), então uma solução de quadrados mínimos minimiza r2=r12+r22+...+rn2\left\| r \right\|_2 = \sqrt{r_1^2 + r_2^2 + ... + r_n^2} e, portanto, também minimiza:
r22=r12+r22+...+rn2\left\| r \right\|_2^2 = r_1^2 + r_2^2 + ... + r_n^2
Assim, o problema de encontrar, se possível, um vetor x¯\bar{x} que minimiza Ax-b2\left\| Ax - b \right\|_2 é denominado um problema de quadrados mínimos.

Revisão de Conceitos Básicos

Teorema 1: sejam WW um subespaço vetorial de dimensão finita de um espaço com produto interno VVvv um elemento de VVuu a projeção ortogonal de vv em WW. Então, uu é o elemento em WW mais próximo de vv, no seguinte sentido:

v-u2<v-w2\left\| v - u \right\|_2 < \left\| v - w \right\|_2
para qualquer wWw \in W distinto de uu.

Definição: Seja AA uma matriz m×nm \times n. O subespaço do n\mathbb{R}^n gerado pelos vetores linha de AA é denominado espaço linha de AA e o subespaço do m\mathbb{R}^m gerado pelos vetores coluna de AA é denominado espaço coluna de AA. O espaço solução do sistema linear homogêneo Ax=0Ax = 0, que é um subespaço do n\mathbb{R}^n, é denominado espaço nulo de AA.

Definição: Seja WW um subespaço vetorial de um espaço com produto interno VV. O conjunto de todos os elementos vVv \in V que são ortogonais a WW é denominado complemento ortogonal de WW.

Teorema 2: Seja AA uma matriz m×nm \times n. Então, o espaço nulo de AA e o espaço linha de AA são complementos ortogonais, isto é, um vetor vnv \in \mathbb{R}^n é ortogonal ao espaço linha de AA se, e somente se, Av=0Av = 0.

Como o espaço linha de AA é igual ao espaço coluna de AtA^t, aplicando o resultado anterior à matriz AtA^t, temos que o espaço nulo de AtA^t e o espaço coluna de AtA^t são complementos ortogonais.

As demonstrações destes resultados podem ser vistas AQUI.

Solução de Quadrados Mínimos

Considere um sistema linear Ax=bAx = b com mm equações e nn incógnitas, onde m>nm > n. Seja WW o espaço coluna da matriz AA. Para cada elemento xnx \in \mathbb{R}^n, o produto AxAx é uma combinação linear dos vetores coluna de AA. Dessa forma, à medida que xx varia sobre o n\mathbb{R}^n, o elemento AxAx varia sobre as possíveis combinações lineares dos vetores coluna de AA, ou seja, varia sobre o espaço coluna WW. Buscamos encontrar um elemento b¯\bar{b} pertencente ao espaço coluna de AA que minimiza b-b¯2\left\|b - \bar{b} \right\|_2.

Geometricamente, resolver o problema de quadrados mínimos do sistema Ax=bAx = b significa encontrar um vetor x¯n\bar{x} \in \mathbb{R}^n tal que b¯=Ax¯\bar{b} = A\bar{x} é o vetor em WW mais próximo de bb, ou seja, que minimiza b-Ax2\left\|b - Ax\right\|_2. Do Teorema 1 segue que o vetor em WW mais próximo de bb é a projeção ortogonal de bb em WW.

qm1

    Figura 1: uma solução de quadrados mínimos x¯\bar{x} fornece um vetor Ax¯WA\bar{x} \in W mais próximo de bb.

WW é também o espaço linha de AtA^t e, como Ax¯A\bar{x} é projeção ortogonal de bb em WW, segue que b-Ax¯b - A\bar{x} é ortogonal a WW. Pelo Teorema 2, b-Ax¯b - A\bar{x} está no espaço nulo de AtA^t, ou seja, satisfaz:

At(b-Ax¯)=0A^t(b - A\bar{x}) = 0
Dessa forma, uma solução de quadrados mínimos do sistema Ax=bAx = b deve satisfazer:

At(b-Ax)=0AtAx=AtbA^t(b - Ax) = 0 \Leftrightarrow A^tAx = A^tb
Este sistema é denominado sistema normal associado ao sistema Ax=bAx = b. Assim, o problema de encontrar uma solução de quadrados mínimos de um sistema linear corresponde a encontrar uma solução exata do sistema normal associado.

Estudaremos um método para encontrar a solução de quadrados mínimos de um sistema utilizando a fatoração ortogonal, e nesta seção mostramos que o sistema normal associado sempre possui solução, que é única caso a matriz AA tenha posto completo e infinitas soluções caso a matriz AA não tenha posto completo.

Voltar ao Topo.

Utilizando a Fatoração de Cholesky

No caso em que matriz AA tem posto completo, então AtAA^tA é simétrica definida positiva e, podemos obter sua fatoração de Cholesky:

AtA=GGtA^tA = GG^t
onde GG é triangular inferior com diagonal positiva. Dessa forma, temos AtAx=AtbGGtx=AtbA^tAx = A^tb \Leftrightarrow GG^tx = A^tb e a resolução do sistema normal associado segue da resolução dos sistemas triangulares:

(i)Gy=Atbe(ii)Gtx=y(i) \;Gy = A^tb \;\; e \;\;(ii)\; G^tx = y

Exemplo 1:
considere o seguinte sistema linear na forma matricial:

Ax=b[20-11-222-1001-1][x1x2x3]=[0606]Ax = b \Leftrightarrow \left[ \begin{array}{rrr} 2 & 0 & -1 \\ 1 & -2 & 2 \\ 2 & -1 & 0 \\ 0 & 1 & -1 \end{array} \right] \;\left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array} \right] = \left[ \begin{array}{r} 0 \\ 6 \\ 0 \\ 6 \end{array} \right]
Estamos interessados em encontrar uma solução de quadrados mínimos deste sistema inconsistente. Temos que:

AtA=[21200-2-11-120-1][20-11-222-1001-1]=[9-40-46-50-56]A^tA = \left[ \begin{array}{rrrr} 2 & 1 & 2 & 0 \\ 0 & -2 & -1 & 1 \\ -1 & 2 & 0 & -1 \end{array} \right]\; \left[ \begin{array}{rrr} 2 & 0 & -1 \\ 1 & -2 & 2 \\ 2 & -1 & 0 \\ 0 & 1 & -1 \end{array} \right] = \left[ \begin{array}{rrr} 9 & -4 & 0 \\ -4 & 6 & -5 \\ 0 & -5 & 6 \end{array} \right]
O sistema normal associado ao sistema Ax=bAx = b é dado por:

AtAx=Atb[9-40-46-50-56][x1x2x3]=[6-66]A^tAx = A^tb \Leftrightarrow \left[ \begin{array}{rrr} 9 & -4 & 0 \\ -4 & 6 & -5 \\ 0 & -5 & 6 \end{array} \right] \;\left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array} \right] = \left[ \begin{array}{r} 6 \\ -6 \\ 6 \end{array} \right]
A matriz AtAA^tA é simétrica definida positiva e, utilizando uma precisão de 4 casas decimais, obtemos o fator de Cholesky:

G=[3.000000-1.33332.054800-2.43330.2810]G = \left[ \begin{array}{rrr} 3.0000 & 0 & 0 \\ -1.3333 & 2.0548 & 0 \\ 0 & -2.4333 & 0.2810 \end{array} \right]
tal que AtA=GGtA^tA = GG^t. Assim, temos AtAx=AtbGGtx=AtbA^tAx = A^tb \Leftrightarrow GG^tx = A^tb. Resolvendo primeiro o sistema triangular inferior:

Gy=Atb[3.000000-1.33332.054800-2.43330.2810][y1y2y3]=[6.0000-6.00006.0000]Gy = A^tb \Leftrightarrow \left[ \begin{array}{rrr} 3.0000 & 0 & 0 \\ -1.3333 & 2.0548 & 0 \\ 0 & -2.4333 & 0.2810 \end{array} \right] \;\left[ \begin{array}{r} y_1 \\ y_2 \\ y_3 \end{array} \right] = \left[ \begin{array}{r} 6.0000 \\ -6.0000 \\ 6.0000 \end{array} \right]
obtemos a solução (y1,y2,y3)=(2.0000,-1.6222,7.3054)(y_1, y_2, y_3) = (2.0000, -1.6222, 7.3054). Resolvendo agora o sistema triangular superior:

Gtx=y[3.0000-1.3333002.0548-2.4333000.2810][x1x2x3]=[2.0000-1.62227.3054]G^tx = y \Leftrightarrow \left[ \begin{array}{rrr} 3.0000 & -1.3333 & 0 \\ 0 & 2.0548 & -2.4333 \\ 0 & 0 & 0.2810 \end{array} \right] \;\left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array} \right] = \left[ \begin{array}{r} 2.0000 \\ -1.6222 \\ 7.3054 \end{array} \right]
obtemos (x1,x2,x3)=(14,30,26)(x_1, x_2, x_3) = (14, 30, 26). Esta é a solução de quadrados mínimos do sistema inicial.


Exemplo 2: considere o seguinte sistema linear na forma matricial:

Ax=b[2-1013120-14521243011-3][x1x2x3x4]=[-10121]Ax = b \Leftrightarrow \left[ \begin{array}{rrrr} 2 & -1 & 0 & 1 \\ 3 & 1 & 2 & 0 \\ -1 & 4 & 5 & 2 \\ 1 & 2 & 4 & 3 \\ 0 & 1 & 1 & -3 \end{array} \right] \; \left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right] = \left[ \begin{array}{r} -1 \\ 0 \\ 1 \\ 2 \\ 1 \end{array} \right]
Queremos encontrar uma solução de quadrados mínimos deste sistema inconsistente. Temos que:

AtA=[23-110-11421025411023-3][2-1013120-14521243011-3]=[15-153-123311053146193101923]A^tA = \left[ \begin{array}{rrrrr} 2 & 3 & -1 & 1 & 0 \\ -1 & 1 & 4 & 2 & 1 \\ 0 & 2 & 5 & 4 & 1 \\ 1 & 0 & 2 & 3 & -3 \end{array} \right]\; \left[ \begin{array}{rrrr} 2 & -1 & 0 & 1 \\ 3 & 1 & 2 & 0 \\ -1 & 4 & 5 & 2 \\ 1 & 2 & 4 & 3 \\ 0 & 1 & 1 & -3 \end{array} \right] = \left[ \begin{array}{rrrr} 15 & -1 & 5 & 3 \\ -1 & 23 & 31 & 10 \\ 5 & 31 & 46 & 19 \\ 3 & 10 & 19 & 23 \end{array} \right]
O sistema normal associado ao sistema Ax=bAx = b é dado por:

AtAx=Atb[15-153-123311053146193101923][x1x2x3x4]=[-110144]A^tAx = A^tb \Leftrightarrow \left[ \begin{array}{rrrr} 15 & -1 & 5 & 3 \\ -1 & 23 & 31 & 10 \\ 5 & 31 & 46 & 19 \\ 3 & 10 & 19 & 23 \end{array} \right]\; \left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right] = \left[ \begin{array}{r} -1 \\ 10 \\ 14 \\ 4 \end{array} \right]
A matriz AtAA^tA é simétrica definida positiva e, utilizando uma precisão de 4 casas decimais, obtemos o fator de Cholesky:

G=[3.8730000-0.25824.7889001.29106.54291.234200.77462.12993.29282.6497]G = \left[ \begin{array}{rrrr} 3.8730 & 0 & 0 & 0 \\ -0.2582 & 4.7889 & 0 & 0 \\ 1.2910 & 6.5429 & 1.2342 & 0 \\ 0.7746 & 2.1299 & 3.2928 & 2.6497 \end{array} \right]
tal que AtA=GGtA^tA = GG^t. Assim, temos AtAx=AtbGGtx=AtbA^tAx = A^tb \Leftrightarrow GG^tx = A^tb. Resolvendo primeiro o sistema triangular inferior:

Gy=Atb[3.8730000-0.25824.7889001.29106.54291.234200.77462.12993.29282.6497][y1y2y3y4]=[-1.000010.000014.00004.0000]Gy = A^tb \Leftrightarrow \left[ \begin{array}{rrrr} 3.8730 & 0 & 0 & 0 \\ -0.2582 & 4.7889 & 0 & 0 \\ 1.2910 & 6.5429 & 1.2342 & 0 \\ 0.7746 & 2.1299 & 3.2928 & 2.6497 \end{array} \right] \;\left[ \begin{array}{r} y_1 \\ y_2 \\ y_3 \\ y_4 \end{array} \right] = \left[ \begin{array}{r} -1.0000 \\ 10.0000 \\ 14.0000 \\ 4.0000 \end{array} \right]
obtemos (y1,y2,y3,y4)=(-0.2582,2.0743,0.6171,-0.8491)(y_1, y_2, y_3, y_4) = (-0.2582, 2.0743, 0.6171, -0.8491). Resolvendo agora o sistema triangular superior:

Gtx=y[3.8730-0.25821.29100.774604.78896.54292.1299001.23423.29280002.6497][x1x2x3x4]=[-0.25822.07430.6171-0.8491]G^tx = y \Leftrightarrow \left[ \begin{array}{rrrr} 3.8730 & -0.2582 & 1.2910 & 0.7746 \\ 0 & 4.7889 & 6.5429 & 2.1299 \\ 0 & 0 & 1.2342 & 3.2928 \\ 0 & 0 & 0 & 2.6497 \end{array} \right] \; \left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \\ x_4 \end{array} \right] = \left[ \begin{array}{r} -0.2582 \\ 2.0743 \\ 0.6171 \\ -0.8491 \end{array} \right]
obtemos a solução aproximada (x1,x2,x3,x4)=(-0.5393,-1.2756,1.3550,-0.3205)(x_1, x_2, x_3, x_4) = (-0.5393, -1.2756, 1.3550, -0.3205). Esta é a solução de quadrados mínimos do sistema inicial.

Voltar ao Topo.

Utilizando a Fatoração Ortogonal

Considere um sistema linear Ax=bAx = b, com mm equações e nn incógnitas. Nosso problema é encontrar um elemento xnx \in \mathbb{R}^n tal que o vetor resíduo r=Ax-br = Ax - b que resulta da aproximação xx como solução do sistema seja o menor possível, ou seja, que r2=Ax-b2\left\| r \right\|_2 = \left\| Ax - b \right\|_2 seja mínima. Seja Qm×mQ \in \mathbb{R}^m \times \mathbb{R}^m uma matriz ortogonal qualquer e considere o seguinte sistema linear:

QtAx=QtbQ^tAx = Q^tb
Seja ss o vetor resíduo resultante da aproximação xx como solução deste novo sistema. Então:

s=QtAx-Qtb=Qt(Ax-b)=Qtrs = Q^tAx - Q^tb = Q^t(Ax - b) = Q^tr
Como QtQ^t é uma matriz ortogonal, ela preserva norma e, portanto, s2=Qtr2=r2\left\| s \right\|_2 = \left\| Q^tr \right\|_2 = \left\| r \right\|_2. Desta forma, um elemento x¯n\bar{x} \in \mathbb{R}^n que minimiza r2\left\| r \right\|_2 também minimiza s2\left\| s \right\|_2, isto é, os dois sistemas possuem as mesmas soluções de quadrados mínimos. Nos interessa encontrar uma matriz ortogonal QQ para a qual o sistema QtAx=QtbQ^tAx = Q^tb seja de fácil resolução.

Dada uma matriz Am×nA \in \mathbb{R}^m \times \mathbb{R}^n, sabemos que existe a fatoração ortogonal A=QRA = QR, onde QQ é ortogonal e RR é triangular superior. No caso em que m>nm > n, então existe Qm×mQ \in \mathbb{R}^m \times \mathbb{R}^mRm×nR \in \mathbb{R}^m \times \mathbb{R}^n tais que QQ é ortogonal e RR é uma matriz em blocos na forma:

R=[R^0]R = \left[\begin{array}{c} \hat{R} \\ 0 \end{array} \right]
onde R^n×n\hat{R} \in \mathbb{R}^n \times \mathbb{R}^n é triangular superior e A=QRA = QR.

Considere o sistema Ax=bAx = b com mm equações e nn incógnitas, onde m>nm > n. Usando a fatoração A=QRQtA=RA = QR \Leftrightarrow Q^tA = R obtemos um novo sistema da forma:

QtAx=QtbRx=cQ^tAx = Q^tb \Leftrightarrow Rx = c
onde c=Qtbc = Q^tb. Escrevendo o vetor cc em blocos da forma:

c=[c^d]c = \left[\begin{array}{c} \hat{c} \\ d \end{array} \right]
onde c^n\hat{c} \in \mathbb{R}^n, podemos expressar o vetor resíduo s=Rx-cs = Rx - c, que resulta da aproximação xx como solução do sistema Rx=cRx = c, da seguinte forma:

s=[R^0]x-[c^d]=[R^x-c^d]s = \left[\begin{array}{c} \hat{R} \\ 0 \end{array} \right] \; x - \left[\begin{array}{c} \hat{c} \\ d \end{array} \right] = \left[\begin{array}{c} \hat{R}x - \hat{c} \\ d \end{array} \right]
Assim,
s22=s12+...+sm2=R^x-c^22+d22\left\| s \right\|_2^2 = s_1^2 + ... + s_m^2 = \left\| \hat{R}x - \hat{c} \right\|_2^2 + \left\| d \right\|_2^2
Como o termo d22\left\| d \right\|_2^2 independe de x, s22\left\| s \right\|_2^2 é mínima quando R^x-c^22\left\| \hat{R}x - \hat{c} \right\|_2^2 é mínima. Logo, uma solução do sistema linear R^x=c^\hat{R}x = \hat{c} minimiza s22\left\| s \right\|_2^2, ou seja, é uma solução de quadrados mínimos do sistema Rx=cRx = c e também do sistema Ax=bAx = b.

Caso A tenha posto completo: neste caso temos que posto(A)=nposto(A) = n, uma vez que m>nm > n. Ao ser triangularizada, a matriz AA produz a matriz RR triangular superior m×nm \times n, com rii0r_{ii} \neq 0 para i=1,...,ni = 1,...,n. Desta matriz extraímos a matriz R^\hat{R} de ordem n×nn \times n triangular superior, com rii0r_{ii} \neq 0 para i=1,...,ni = 1,...,n, ou seja, det(R^)0det(\hat{R}) \neq 0. Assim, a matriz R^\hat{R} é inversível e, portanto, o sistema linear R^x=c^\hat{R}x = \hat{c} tem uma solução única, que também é a única solução de quadrados mínimos do sistema original Ax=bAx = b, e teremos R^x-c^22=0\left\|\hat{R}x - \hat{c}\right\|_2^2 = 0, o que implica s22=d22\left\| s \right\|_2^2 = \left\| d \right\|_2^2.

Caso A não tenha posto completo: considere posto(A)=rposto(A) = r, onde r<nr < n. Neste caso, ao obtermos a fatoração ortogonal de AA, a triangularização de AA terá apenas rr linhas linearmente independentes, ou seja, a matriz RR continua sendo triangular superior m×nm \times n, mas com apenas rr linhas não nulas. Assim, extraímos a matriz R^\hat{R} que é triangular superior de ordem r×nr \times n, com r<nr < n. Logo, o sistema R^x=c^\hat{R}x = \hat{c} possui mais incógnitas do que equações, ou seja, é indeterminado e admite infinitas soluções, pois algumas incógnitas são livres. E, para qualquer solução do sistema R^x=c^\hat{R}x = \hat{c} teremos R^x-c^22=0\left\|\hat{R}x-\hat{c}\right\|_2^2 = 0. Portanto, o sistema linear Ax=bAx = b possui infinitas soluções de quadrados mínimos, mas para todas elas temos que s22=d22\left\|s\right\|_2^2 = \left\|d\right\|_2^2


Exemplo 3: considere o seguinte sistema linear inconsistente:

Ax=b[132-122][x1x2]=[432]Ax = b \Leftrightarrow \left[ \begin{array}{rr} 1 & 3 \\ 2 & -1 \\ 2 & 2 \end{array}\right] \; \left[ \begin{array}{r} x_1 \\ x_2 \end{array}\right] = \left[ \begin{array}{r} 4 \\ 3 \\ 2 \end{array}\right]
Vamos determinar uma solução de quadrados mínimos através da fatoração ortogonal. Utilizando uma precisão de 4 casas decimais, obtemos a fatoração:

A=QR=[-0.33330.7297-0.5970-0.6667-0.6302-0.3980-0.66670.26530.6965][-3.0000-1.666703.350000]A = QR = \left[ \begin{array}{rrr} -0.3333 & 0.7297 & -0.5970 \\ -0.6667 & -0.6302 & -0.3980 \\ -0.6667 & 0.2653 & 0.6965 \end{array}\right] \;\left[ \begin{array}{rr} -3.0000 & -1.6667 \\ 0 & 3.3500 \\ 0 & 0 \end{array}\right]
onde QQ é ortogonal. Da matriz RR extraímos a matriz 2×22 \times 2 triangular superior:

R^=[-3.0000-1.666703.3500]\hat{R} = \left[ \begin{array}{rr} -3.0000 & -1.6667 \\ 0 & 3.3500 \end{array}\right]
Temos que QtAx=QtbRx=cQ^tAx = Q^tb \Leftrightarrow Rx = c, onde:

c=Qtb=[-0.3333-0.6667-0.66670.7297-0.63020.2653-0.5970-0.39800.6965][432]=[-4.66671.5589-2.1891]c = Q^tb = \left[ \begin{array}{rrr} -0.3333 & -0.6667 & -0.6667 \\ 0.7297 & -0.6302 & 0.2653 \\ -0.5970 & -0.3980 & 0.6965 \end{array}\right] \; \left[ \begin{array}{r} 4 \\ 3 \\ 2 \end{array}\right] = \left[ \begin{array}{r} -4.6667 \\ 1.5589 \\ -2.1891 \end{array}\right]
Queremos obter xx de modo a minimizar a norma do resíduo:

Rx-c=[-3.0000-1.666703.350000][x1x2]-[-4.66671.5589-2.1891]Rx - c = \left[ \begin{array}{rr} -3.0000 & -1.6667 \\ 0 & 3.3500 \\ 0 & 0 \end{array}\right] \; \left[ \begin{array}{r} x_1 \\ x_2 \end{array}\right] - \left[ \begin{array}{r} -4.6667 \\ 1.5589 \\ -2.1891 \end{array}\right]
Do vetor cc extraímos o vetor do 2\mathbb{R}^2:

c^=[-4.66671.5589]\hat{c} = \left[ \begin{array}{r} -4.6667 \\ 1.5589 \end{array}\right]
Assim, obtemos o sistema triangular superior:

R^x=c^[-3.0000-1.666703.3500][x1x2]=[-4.66671.5589]\hat{R}x = \hat{c} \Leftrightarrow \left[ \begin{array}{rr} -3.0000 & -1.6667 \\ 0 & 3.3500 \end{array}\right]\; \left[ \begin{array}{r} x_1 \\ x_2 \end{array}\right] = \left[ \begin{array}{r} -4.6667 \\ 1.5589 \end{array}\right]
cuja solução (x1,x2)=(1.2970,0.4653)(x_1, x_2) = (1.2970, 0.4653) é também a solução de quadrados mínimos do sistema inicial. Como esta é uma solução exata do sistema R^x=c^\hat{R}x = \hat{c}, temos que R^x-c^22=0\left\|\hat{R}x - \hat{c} \right\|_2^2 = 0 e, portanto, a soma dos quadrados dos resíduos de s=Rx-cs = Rx-c é dada apenas pela parte do vetor cc que sobrou ao extrairmos o vetor c^\hat{c}, ou seja:

s22=(-2.1891)224.7922\left\| s \right\|_2^2 = \left\| (-2.1891) \right\|_2^2 \approx 4.7922
que é igual a norma do resíduo r=Ax-br = Ax-b.


Exemplo 4: considere o seguinte sistema linear:

Ax=b[31-112001211-1][x1x2x3]=[-3-389]Ax = b \Leftrightarrow \left[ \begin{array}{rrr} 3 & 1 & -1 \\ 1 & 2 & 0 \\ 0 & 1 & 2 \\ 1 & 1 & -1 \end{array}\right] \; \left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array}\right] = \left[ \begin{array}{r} -3 \\ -3 \\ 8 \\ 9 \end{array}\right]
Vamos determinar uma solução de quadrados mínimos utilizando a fatoração ortogonal da matriz AA. Com uma precisão de 4 casas decimais, obtemos a decomposição:

A=QR=[-0.90450.3296-0.2563-0.0864-0.3015-0.75340.2698-0.51830-0.5180-0.78250.3455-0.3015-0.23540.49920.7775][-3.3166-1.80911.20600-1.9306-1.130100-1.8078000]A = QR = \left[ \begin{array}{rrrr} -0.9045 & 0.3296 & -0.2563 & -0.0864 \\ -0.3015 & -0.7534 & 0.2698 & -0.5183 \\ 0 & -0.5180 & -0.7825 & 0.3455 \\ -0.3015 & -0.2354 & 0.4992 & 0.7775 \end{array}\right]\; \left[ \begin{array}{rrr} -3.3166 & -1.8091 & 1.2060 \\ 0 & -1.9306 & -1.1301 \\ 0 & 0 & -1.8078 \\ 0 & 0 & 0 \end{array}\right]
onde QQ é uma matriz ortogonal. Da matriz RR extraímos a matriz 3×33\times3 triangular superior:

R^=[-3.3166-1.80911.20600-1.9306-1.130100-1.8078]\hat{R} = \left[ \begin{array}{rrr} -3.3166 & -1.8091 & 1.2060 \\ 0 & -1.9306 & -1.1301 \\ 0 & 0 & -1.8078 \end{array}\right]
Temos que QtAx=QtbRx=cQ^tAx = Q^tb \Leftrightarrow Rx = c, onde:

c=Qtb=[-0.9045-0.30150-0.30150.3296-0.7534-0.5180-0.2354-0.25630.2698-0.78250.4992-0.0864-0.51830.34550.7775][-3-389]=[0.9045-4.9913-1.807811.5758]c = Q^tb = \left[ \begin{array}{rrrr} -0.9045 & -0.3015 & 0 & -0.3015 \\ 0.3296 & -0.7534 & -0.5180 & -0.2354 \\ -0.2563 & 0.2698 & -0.7825 & 0.4992 \\ -0.0864 & -0.5183 & 0.3455 & 0.7775 \end{array}\right]\; \left[ \begin{array}{r} -3 \\ -3 \\ 8 \\ 9 \end{array}\right] = \left[ \begin{array}{r} 0.9045 \\ -4.9913 \\ -1.8078 \\ 11.5758 \\ \end{array}\right]
Queremos obter xx de modo a minimizar a norma do resíduo:

Rx-c=[-3.3166-1.80911.20600-1.9306-1.130100-1.8078000][x1x2x3]-[0.9045-4.9913-1.807811.5758]Rx-c = \left[ \begin{array}{rrr} -3.3166 & -1.8091 & 1.2060 \\ 0 & -1.9306 & -1.1301 \\ 0 & 0 & -1.8078 \\ 0 & 0 & 0 \end{array}\right]\;\left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array}\right] - \left[ \begin{array}{r} 0.9045 \\ -4.9913 \\ -1.8078 \\ 11.5758 \\ \end{array}\right]
Do vetor cc extraímos o vetor do 3\mathbb{R}^3:

c^=[0.9045-4.9913-1.8078]\hat{c} = \left[ \begin{array}{r} 0.9045 \\ -4.9913 \\ -1.8078 \end{array}\right]
Assim, obtemos o sistema triangular superior:

R^x=c^[-3.3166-1.80911.20600-1.9306-1.130100-1.8078][x1x2x3]=[0.9045-4.9913-1.8078]\hat{R}x = \hat{c} \Leftrightarrow \left[ \begin{array}{rrr} -3.3166 & -1.8091 & 1.2060 \\ 0 & -1.9306 & -1.1301 \\ 0 & 0 & -1.8078 \end{array}\right] \;\left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array}\right] = \left[ \begin{array}{r} 0.9045 \\ -4.9913 \\ -1.8078 \end{array}\right]
Resolvendo este sistema, obtemos (x1,x2,x3)=(-1,2,1)(x_1, x_2, x_3) = (-1, 2, 1), que também é a solução de quadrados mínimos do sistema inicial Ax=bAx = b. Como esta é uma solução exata do sistema R^x=c^\hat{R}x = \hat{c}, temos que R^x-c^22=0\left\|\hat{R}x - \hat{c} \right\|_2^2 = 0 e, portanto, a soma dos quadrados dos resíduos de s=Rx-cs = Rx-c é dada apenas pela parte do vetor cc que sobrou ao extrairmos o vetor c^\hat{c}, ou seja:

s22=11.575822133.9991\left\| s \right\|_2^2 = \left\| 11.5758 \right\|_2^2 \approx 133.9991
que é igual a norma do resíduo r=Ax-br = Ax-b.


Exemplo 5: considere agora um seguinte sistema linear para o qual a matriz AA não tem posto completo:

Ax=b[312124012112][x1x2x3]=[-3-389]Ax = b \Leftrightarrow \left[ \begin{array}{rrr} 3 & 1 & 2 \\ 1 & 2 & 4 \\ 0 & 1 & 2 \\ 1 & 1 & 2 \end{array}\right] \; \left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array}\right] = \left[ \begin{array}{r} -3 \\ -3 \\ 8 \\ 9 \end{array}\right]
Neste caso, posto(A)=2posto(A) = 2. Na fatoração ortogonal de AA com uma precisão de 4 casas decimais, obtemos:

A=QR=[-0.90450.32960.1811-0.2010-0.3015-0.7534-0.4893-0.0-0.51800.8514-0.0825-0.3015-0.2354-0.05380.9224][-3.3166-1.8091-3.61810-1.9306-3.8612000000]A = QR = \left[ \begin{array}{rrrr} -0.9045 & 0.3296 & 0.1811 & -0.2010 \\ -0.3015 & -0.7534 & -0.4893 & -0. \\ 0 & -0.5180 & 0.8514 & -0.0825 \\ -0.3015 & -0.2354 & -0.0538 & 0.9224 \end{array}\right] \; \left[ \begin{array}{rrr} -3.3166 & -1.8091 & -3.6181 \\ 0 & -1.9306 & -3.8612 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array}\right]
onde QQ é uma matriz ortogonal. Da matriz RR extraímos a matriz 2×32\times3 triangular superior:

R^=[-3.3166-1.8091-3.61810-1.9306-3.8612]\hat{R} = \left[ \begin{array}{rrr} -3.3166 & -1.8091 & -3.6181 \\ 0 & -1.9306 & -3.8612 \end{array}\right] 
Temos que QtAx=QtbRx=cQ^tAx = Q^tb \Leftrightarrow Rx = c, onde:

c=Qtb=[-0.9045-0.30150-0.30150.3296-0.7534-0.5180-0.23540.1811-0.48930.8514-0.0538-0.2010-0.3194-0.08250.9224][-3-389]=[0.9045-4.99137.25149.2025]c = Q^tb = \left[ \begin{array}{rrrr} -0.9045 & -0.3015 & 0 & -0.3015 \\ 0.3296 & -0.7534 & -0.5180 & -0.2354 \\ 0.1811 & -0.4893 & 0.8514 & -0.0538 \\ -0.2010 & -0.3194 & -0.0825 & 0.9224 \end{array}\right]\; \left[ \begin{array}{r} -3 \\ -3 \\ 8 \\ 9 \end{array}\right] = \left[ \begin{array}{r} 0.9045 \\ -4.9913 \\ 7.2514 \\ 9.2025 \end{array}\right]
Queremos obter xx de modo a minimizar a norma do resíduo:

Rx-c=[-3.3166-1.8091-3.61810-1.9306-3.8612000000][x1x2x3]-[0.9045-4.99137.25149.2025]Rx-c = \left[ \begin{array}{rrr} -3.3166 & -1.8091 & -3.6181 \\ 0 & -1.9306 & -3.8612 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{array}\right]\; \left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array}\right] - \left[ \begin{array}{r} 0.9045 \\ -4.9913 \\ 7.2514 \\ 9.2025 \end{array}\right]
Do vetor cc extraímos o vetor do 2\mathbb{R}^2:

c^=[0.9045-4.9913]\hat{c} = \left[ \begin{array}{r} 0.9045 \\ -4.9913 \end{array}\right]
Assim, obtemos o sistema triangular superior:

R^x=c^[-3.3166-1.8091-3.61810-1.9306-3.8612][x1x2x3]=[0.9045-4.9913]\hat{R}x = \hat{c} \Leftrightarrow \left[ \begin{array}{rrr} -3.3166 & -1.8091 & -3.6181 \\ 0 & -1.9306 & -3.8612 \end{array}\right]\; \left[ \begin{array}{r} x_1 \\ x_2 \\ x_3 \end{array}\right] = \left[ \begin{array}{r} 0.9045 \\ -4.9913 \end{array}\right] \Leftrightarrow
{-3.3166x1-1.8091x2-3.6181x3=0.9045-1.9306x2-3.8612x3=-4.9913\Leftrightarrow \left\lbrace \begin{array}{rrrrr} -3.3166 x_1 & -1.8091 x_2 & -3.6181 x_3 & = & 0.9045\\ & - 1.9306 x_2 & -3.8612 x_3 & = & -4.9913 \end{array} \right. 
Note que este sistema é indeterminado. Escrevendo x2x_2 em função de x3x_3 na segunda equação, temos: x2=-2x3+2.5854x_2 = -2x_3 + 2.5854. Substituíndo na primeira equação e isolando x1x_1, obtemos: x1=-1.6830x_1 = -1.6830. Assim, o sistema original possui infinitas soluções de quadrados mínimos e representamos o conjunto solução por:

S={x3x=(-1.6830,2.5854,0)+α(0,-2,1),paraqualquerα}S = \left\lbrace x \in \mathbb{R}^3 \mid x = (-1.6830, 2.5854, 0) + \alpha (0, -2, 1), \;\; para \;qualquer \;\alpha \in \mathbb{R}\right\rbrace 
E, para qualquer vetor xx em SS, teremos R^x-c^22=0\left\|\hat{R}x - \hat{c}\right\|_2^2 = 0. Assim, a soma dos quadrados dos resíduos de s=Rx-cs = Rx-c é dada apenas pela parte do vetor cc que sobrou ao extrairmos o vetor c^\hat{c}, ou seja:

s22=7.25142+9.20252137.2688\left\|s\right\|_2^2 = 7.2514^2 + 9.2025^2 \approx 137.2688
que é igual a norma do resíduo r=Ax-br = Ax-b.


Voltar ao Topo.
Última Atualização: 03/08/2016.