Pausa para recapitular

Antes de iniciarmos, gostaria de explicar uma série de termos fundamentais, como variância, desvio padrão, distribuição normal, estimativa, acurácia, precisão, média, valor esperado e variável aleatória.

Eu suponho que muitos leitores deste tutorial estão familiarizados com a estatística básica. Entretanto, no começo deste tutorial, eu havia prometido de suprir o conhecimento prévio necessário para o entendimento da operação do Filtro de Kalman. Se você está familiarizado com esse assunto, sinta-se livre para pular para a próxima seção.

Média e Valor Esperado

Média e Valor Esperado são termos intimamente relacionados. Todavia, eles são diferentes.

Por exemplo, dado cinco moedas distintas – duas de 5 centavos e três de 10 centavos, nós podemos facilmente calcular o valor médio por moeda apenas calculando a média dos seus valores.

Moedas
\[ V_{média}= \frac{1}{N} \sum _{n=1}^{N}V_{n}= \frac{1}{5} \left( 5+5+10+10+10 \right) = 8centavos \]

O resultado acima não pode ser definido como valor esperado, desde que os estados do sistema (valores das moedas) não são ocultos, e nós usamos toda a população (todas as 5 moedas) para o cálculo do valor médio.

Livro do Filtro de Kalman
Guia do Filtro de Kalman baseado em exemplos

Agora, assuma cinco medições distintas do peso de uma mesma pessoa: 79.8kg, 80kg, 80.1kg, 79.8kg, and 80.2kg.

Homem na balança

As medições são diferentes devido ao erro de medição aleatório das balanças. Nós não sabemos o verdadeiro valor do peso, já que ele é uma Variável Oculta. Entretanto, podemos estimar o peso calculando a média das medições.

\[ W= \frac{1}{N} \sum _{n=1}^{N}W_{n}= \frac{1}{5} \left(79.8+80+80.1+79.8+80.2 \right) =79.98kg \]

O resultado da estimativa é o valor esperado do peso.

A média é, normalmente, denotada pela letra grega μ.

O valor esperado é, normalmente, denotado pela letra E.

Variância e Desvio Padrão

A Variância é a medida de espalhamento do conjunto de dados em relação à sua média.

O Desvio Padrão é a raiz quadrada da variância.

O Desvio Padrão é denotado pela letra grega \( \sigma \) (sigma). Consequentemente, a variância é denotada por \( \sigma ^{2} \).

Por exemplo, queremos comparar as alturas de dois times escolares de basquete. A tabela a seguir provê as alturas dos jogadores de ambos os times e suas médias.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5 Média
Time A 1.89m 2.1m 1.75m 1.98m 1.85m 1.914m
Time B 1.94m 1.9m 1.97m 1.89m 1.87m 1.914m

Como se pode ver, a altura média de ambos os times é a mesma. Agora, vamos examinar a variância da altura.

Como a variância mede o espalhamento do conjuto de dados, gostaríamos de encontra qual é o desvio desses dados em relação à média. Nós podemos calcular a distância de cada média para cada variável subtraindo tais valores.

Denotaremos a altura por \( x \) e a média das alturas pela letra grega \( \mu \). A distância da média para cada variável será:

\[ x_{n}- \mu = x_{n}-1.914m \]

A tabela a seguir apresenta a distância da média para cada variável.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5
Time A -0.024m 0.186m -0.164m 0.066m -0.064m
Time B 0.026m -0.014m 0.056m -0.024m -0.044m

Alguns dos valores são negativos. Para se livrar de tal problema, vamos elevar as distâncias ao quadrado:

\[ \left( x_{n}- \mu \right) ^{2} = \left( x_{n}- 1.914m \right) ^{2} \]

A tabela a seguir apresenta os quadrados da distância da média para cada variável.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5
Time A 0.000576m2 0.034596m2 0.026896m2 0.004356m2 0.004096m2
Time B 0.000676m2 0.000196m2 0.003136m2 0.000576m2 0.001936m2

Para calcular a variância do conjunto de dados, precisamos encontrar o valor médio dos quadrados da distâncias da média:

\[ \sigma ^{2}= \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}- \mu \right) ^{2} \]

Para o time A, a variância seria:

\[ \sigma _{A}^{2} = \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}-\mu \right) ^{2}= \frac{1}{5} \left( 0.000576+ 0.034596+0.026896+ 0.004356+ 0.004096 \right) = 0.014m^{2} \]

Para o time B, a variância seria:

\[ \sigma _{B}^{2} = \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}-\mu \right) ^{2}= \frac{1}{5} \left( 0.000676+ 0.000196+0.003136+ 0.000576+ 0.001936 \right) = 0.0013m^{2} \]

Pode-se observar que, embora a média de ambos os times seja a mesma, a medida de espalhamento das alturas do Time A é maior que o espalhamento do Time B. Isso significa que os jogadores do Time A são mais diversificados, existem jogadores para diferentes posições, como armador, pivô e ala; enquanto que os jogadores Time B não são tão versáteis.

As unidades da variâncias estão elevadas ao quadrado; é mais conveniente analisar o desvio padrão. Como já mencionei anteriormente, o desvio padrão é a raiz quadrada da variância.

\[ \sigma =\sqrt[]{\frac{1}{N} \sum _{n=1}^{N} \left( x_{n} - \mu \right) ^{2}} \]

O desvio padrão das alturas dos jogadores do Time A seria 0.12m.

O desvio padrão das alturas dos jogadores do Time B seria 0.036m.

Agora, assuma que nós queremos calcular a média e variância de todos os jogadores de basquete de todas as escolas. É uma tarefa muito complicada; precisamos coletar os dados de todos os jogadores em todas as escolas.

Por outro lado, podemos estimar a média e a variância dos jogadores pegando um grande conjunto de dados e realizando os cálculos nesse conjunto.

Um conjunto de dados de 100 jogadores selecionados aleatoriamente pode ser o suficiente para uma estimação precisa.

Entretanto, quando estimamos a variância, a equação para o cálculo da variância é um pouco diferente. Ao invés de normalizar pelo fator \( N \) , nós normalizaremos pelo fator \( N-1 \):

\[ \sigma ^{2}= \frac{1}{N-1} \sum _{n=1}^{N} \left( x_{n}-\mu \right) ^{2} \]

O fator de \( N-1 \) é chamado de correção de Bessel.

Você pode ver a prova matemática para essa equação no visiondummy ou Wikipedia.

Distribuição Normal

Acontece que muitos fenômenos naturais seguem a Distribuição Normal. A distribuição normal, também conhecida como Gaussiana (nomeada em homenagem ao matemático Carl Friedrich Gauss), é descrita pela seguinte equação:

\[ f \left( x; \mu , \sigma ^{2} \right) = \frac{1}{\sqrt[]{2 \pi \sigma ^{2}}}e^{\frac{- \left( x- \mu \right) ^{2}}{2 \sigma ^{2}}} \]

A curva Gaussiana também é chamada de Função Densidade de Probabilidade (PDF) da distribuição normal.

O gráfico a seguir descreve as PDFs do tempo de entrega de pizza em três cidades: cidade “A”, cidade “B” e cidade “C”.

Gaussianas
  • Na cidade “A”, o tempo médio de entrega é 30 minutos e o desvio padrão é 5 minutos.
  • Na cidade “B”, o tempo médio de entrega é 40 minutos e o desvio padrão é 5 minutos.
  • Na cidade “C”, o tempo médio de entrega é 30 minutos e o desvio padrão é 10 minutos.

Podemos ver que as curvas Gaussianas das cidades “A” e “B” são idênticas; porém, seus centros são diferentes. Isso significa que, na cidade “A”, você espera 10 minutos a menos pela pizza, em média, enquanto a medida de dispersão permanece a mesma.

Também podemos ver que os centros das Gaussianas nas cidades “A” e “C” são os mesmos; entretanto, suas formas são diferentes. Portanto, o tempo médio de entrega é igual em ambas as cidades, mas a dispersão é diferente.

O gráfico a seguir descreve as proporções da distribuição normal.

Desvio Padrão
  • 68,26% dos tempos de entrega na Cidade A estão dentro do intervalo \( \mu \pm \sigma \) (25–35 minutos)
  • 95,44% dos tempos de entrega na Cidade A estão dentro do intervalo \( \mu \pm 2\sigma \) (20–40 minutos)
  • 99,74% dos tempos de entrega na Cidade A estão dentro do intervalo \( \mu \pm 3\sigma \) (15–45 minutos)

Normalmente, erros de medição seguem uma distribuição normal. O projeto do Filtro de Kalman assume uma distribuição normal para os erros de medição.

Variáveis Aleatórias

Uma variável aleatória descreve o estado oculto de um sistema. Uma variável aleatória é um conjunto de valores possíveis provenientes de um experimento aleatório.

A variável aleatória pode ser contínua ou discreta:

  • Uma variável aleatória contínua pode assumir qualquer valor dentro de um intervalo específico, como o tempo de carregamento de uma bateria ou o tempo de uma corrida de maratona.
  • Uma variável aleatória discreta é contável, como o número de visitantes de um site ou o número de estudantes em uma sala de aula.

A variável aleatória é descrita pela função densidade de probabilidade. Neste texto, a função densidade de probabilidade é caracterizada por:

  • \( \mu_{\scriptscriptstyle \!X} \) – a média da sequência de medições.
  • \(\sigma_{\scriptscriptstyle \!X}^{2} \) – a variância da sequência de medições.

Estimativa, Exatidão e Precisão

Uma Estimativa consiste em avaliar o estado oculto de um sistema. Por exemplo, a posição real de uma aeronave está oculta ao observador. Podemos estimar essa posição usando sensores, como radar. A estimativa pode ser muito aprimorada usando múltiplos sensores e aplicando algoritmos avançados de estimativa e rastreamento (como o Filtro de Kalman). Todo parâmetro medido ou calculado é uma estimativa.

Exatidão indica quão próxima a medição está do valor verdadeiro.

Precisão descreve a variabilidade em uma série de medições do mesmo parâmetro. Exatidão e precisão formam a base da estimativa.

A figura a seguir ilustra exatidão e precisão.

Exatidão e Precisão

Sistemas de alta precisão apresentam baixa variância em suas medições (ou seja, baixa incerteza), enquanto sistemas de baixa precisão apresentam alta variância (alta incerteza). O erro aleatório de medição produz essa variância.

Sistemas com baixa exatidão são chamados de sistemas enviesados, pois suas medições contêm um erro sistemático interno (viés).

A influência da variância pode ser significativamente reduzida pela média ou suavização das medições. Por exemplo, ao medir temperatura com um termômetro com erro aleatório, podemos realizar várias medições e calcular a média. Como o erro é aleatório, algumas medições estarão acima do valor verdadeiro e outras abaixo. A estimativa final ficará próxima do valor real. Quanto mais medições fizermos, mais precisa será a estimativa.

Por outro lado, um termômetro enviesado produz um erro sistemático constante na estimativa.

Todos os exemplos deste tutorial assumem sistemas não enviesados.

Resumo

A figura a seguir representa uma visão estatística da medição.

Visão estatística da medição

Uma medição é uma variável aleatória, descrita pela Função Densidade de Probabilidade (PDF).

A média das medições é o Valor Esperado da variável aleatória.

A diferença entre a média das medições e o valor verdadeiro é a exatidão das medições, também chamada de viés ou erro sistemático de medição.

A dispersão da distribuição representa a precisão da medição, também conhecida como ruído de medição, erro aleatório ou incerteza de medição.

Livro do Filtro de Kalman
Guia do Filtro de Kalman baseado em exemplos
Anterior Próximo