Antes de iniciarmos, gostaria de explicar uma série de termos fundamentais, como variância, desvio padrão, distribuição normal, estimativa, acurácia, precisão, média, valor esperado e variável aleatória.
Eu suponho que muitos leitores deste tutorial estão familiarizados com a estatística básica. Entretanto, no começo deste tutorial, eu havia prometido de suprir o conhecimento prévio necessário para o entendimento da operação do Filtro de Kalman. Se você está familiarizado com esse assunto, sinta-se livre para pular para a próxima seção.
Média e Valor Esperado são termos intimamente relacionados. Todavia, eles são diferentes.
Por exemplo, dado cinco moedas distintas – duas de 5 centavos e três de 10 centavos, nós podemos facilmente calcular o valor médio por moeda apenas calculando a média dos seus valores.
O resultado acima não pode ser definido como valor esperado, desde que os estados do sistema (valores das moedas) não são ocultos, e nós usamos toda a população (todas as 5 moedas) para o cálculo do valor médio.
Agora, assuma cinco medições distintas do peso de uma mesma pessoa: 79.8kg, 80kg, 80.1kg, 79.8kg, and 80.2kg.
As medições são diferentes devido ao erro de medição aleatório das balanças. Nós não sabemos o verdadeiro valor do peso, já que ele é uma Variável Oculta. Entretanto, podemos estimar o peso calculando a média das medições.
O resultado da estimativa é o valor esperado do peso.
A média é, normalmente, denotada pela letra grega μ.
O valor esperado é, normalmente, denotado pela letra E.
A Variância é a medida de espalhamento do conjunto de dados em relação à sua média.
O Desvio Padrão é a raiz quadrada da variância.
O Desvio Padrão é denotado pela letra grega \( \sigma \) (sigma). Consequentemente, a variância é denotada por \( \sigma ^{2} \).
Por exemplo, queremos comparar as alturas de dois times escolares de basquete. A tabela a seguir provê as alturas dos jogadores de ambos os times e suas médias.
| Jogador 1 | Jogador 2 | Jogador 3 | Jogador 4 | Jogador 5 | Média | |
|---|---|---|---|---|---|---|
| Time A | 1.89m | 2.1m | 1.75m | 1.98m | 1.85m | 1.914m |
| Time B | 1.94m | 1.9m | 1.97m | 1.89m | 1.87m | 1.914m |
Como se pode ver, a altura média de ambos os times é a mesma. Agora, vamos examinar a variância da altura.
Como a variância mede o espalhamento do conjuto de dados, gostaríamos de encontra qual é o desvio desses dados em relação à média. Nós podemos calcular a distância de cada média para cada variável subtraindo tais valores.
Denotaremos a altura por \( x \) e a média das alturas pela letra grega \( \mu \). A distância da média para cada variável será:
A tabela a seguir apresenta a distância da média para cada variável.
| Jogador 1 | Jogador 2 | Jogador 3 | Jogador 4 | Jogador 5 | |
|---|---|---|---|---|---|
| Time A | -0.024m | 0.186m | -0.164m | 0.066m | -0.064m |
| Time B | 0.026m | -0.014m | 0.056m | -0.024m | -0.044m |
Alguns dos valores são negativos. Para se livrar de tal problema, vamos elevar as distâncias ao quadrado:
A tabela a seguir apresenta os quadrados da distância da média para cada variável.
| Jogador 1 | Jogador 2 | Jogador 3 | Jogador 4 | Jogador 5 | |
|---|---|---|---|---|---|
| Time A | 0.000576m2 | 0.034596m2 | 0.026896m2 | 0.004356m2 | 0.004096m2 |
| Time B | 0.000676m2 | 0.000196m2 | 0.003136m2 | 0.000576m2 | 0.001936m2 |
Para calcular a variância do conjunto de dados, precisamos encontrar o valor médio dos quadrados da distâncias da média:
Para o time A, a variância seria:
Para o time B, a variância seria:
Pode-se observar que, embora a média de ambos os times seja a mesma, a medida de espalhamento das alturas do Time A é maior que o espalhamento do Time B. Isso significa que os jogadores do Time A são mais diversificados, existem jogadores para diferentes posições, como armador, pivô e ala; enquanto que os jogadores Time B não são tão versáteis.
As unidades da variâncias estão elevadas ao quadrado; é mais conveniente analisar o desvio padrão. Como já mencionei anteriormente, o desvio padrão é a raiz quadrada da variância.
O desvio padrão das alturas dos jogadores do Time A seria 0.12m.
O desvio padrão das alturas dos jogadores do Time B seria 0.036m.
Agora, assuma que nós queremos calcular a média e variância de todos os jogadores de basquete de todas as escolas. É uma tarefa muito complicada; precisamos coletar os dados de todos os jogadores em todas as escolas.
Por outro lado, podemos estimar a média e a variância dos jogadores pegando um grande conjunto de dados e realizando os cálculos nesse conjunto.
Um conjunto de dados de 100 jogadores selecionados aleatoriamente pode ser o suficiente para uma estimação precisa.
Entretanto, quando estimamos a variância, a equação para o cálculo da variância é um pouco diferente. Ao invés de normalizar pelo fator \( N \) , nós normalizaremos pelo fator \( N-1 \):
O fator de \( N-1 \) é chamado de correção de Bessel.
Você pode ver a prova matemática para essa equação no visiondummy ou Wikipedia.
Acontece que muitos fenômenos naturais seguem a Distribuição Normal. A distribuição normal, também conhecida como Gaussiana (nomeada em homenagem ao matemático Carl Friedrich Gauss), é descrita pela seguinte equação:
A curva Gaussiana também é chamada de Função Densidade de Probabilidade (PDF) da distribuição normal.
O gráfico a seguir descreve as PDFs do tempo de entrega de pizza em três cidades: cidade “A”, cidade “B” e cidade “C”.
Podemos ver que as curvas Gaussianas das cidades “A” e “B” são idênticas; porém, seus centros são diferentes. Isso significa que, na cidade “A”, você espera 10 minutos a menos pela pizza, em média, enquanto a medida de dispersão permanece a mesma.
Também podemos ver que os centros das Gaussianas nas cidades “A” e “C” são os mesmos; entretanto, suas formas são diferentes. Portanto, o tempo médio de entrega é igual em ambas as cidades, mas a dispersão é diferente.
O gráfico a seguir descreve as proporções da distribuição normal.
Normalmente, erros de medição seguem uma distribuição normal. O projeto do Filtro de Kalman assume uma distribuição normal para os erros de medição.
Uma variável aleatória descreve o estado oculto de um sistema. Uma variável aleatória é um conjunto de valores possíveis provenientes de um experimento aleatório.
A variável aleatória pode ser contínua ou discreta:
A variável aleatória é descrita pela função densidade de probabilidade. Neste texto, a função densidade de probabilidade é caracterizada por:
Uma Estimativa consiste em avaliar o estado oculto de um sistema. Por exemplo, a posição real de uma aeronave está oculta ao observador. Podemos estimar essa posição usando sensores, como radar. A estimativa pode ser muito aprimorada usando múltiplos sensores e aplicando algoritmos avançados de estimativa e rastreamento (como o Filtro de Kalman). Todo parâmetro medido ou calculado é uma estimativa.
Exatidão indica quão próxima a medição está do valor verdadeiro.
Precisão descreve a variabilidade em uma série de medições do mesmo parâmetro. Exatidão e precisão formam a base da estimativa.
A figura a seguir ilustra exatidão e precisão.
Sistemas de alta precisão apresentam baixa variância em suas medições (ou seja, baixa incerteza), enquanto sistemas de baixa precisão apresentam alta variância (alta incerteza). O erro aleatório de medição produz essa variância.
Sistemas com baixa exatidão são chamados de sistemas enviesados, pois suas medições contêm um erro sistemático interno (viés).
A influência da variância pode ser significativamente reduzida pela média ou suavização das medições. Por exemplo, ao medir temperatura com um termômetro com erro aleatório, podemos realizar várias medições e calcular a média. Como o erro é aleatório, algumas medições estarão acima do valor verdadeiro e outras abaixo. A estimativa final ficará próxima do valor real. Quanto mais medições fizermos, mais precisa será a estimativa.
Por outro lado, um termômetro enviesado produz um erro sistemático constante na estimativa.
Todos os exemplos deste tutorial assumem sistemas não enviesados.
A figura a seguir representa uma visão estatística da medição.
Uma medição é uma variável aleatória, descrita pela Função Densidade de Probabilidade (PDF).
A média das medições é o Valor Esperado da variável aleatória.
A diferença entre a média das medições e o valor verdadeiro é a exatidão das medições, também chamada de viés ou erro sistemático de medição.
A dispersão da distribuição representa a precisão da medição, também conhecida como ruído de medição, erro aleatório ou incerteza de medição.