Antes de iniciarmos, gostaria de explicar uma série de termos fundamentais, como variância, desvio padrão, distribuição normal, estimativa, acurácia, precisão, média, valor esperado e variável aleatória.
Eu suponho que muitos leitores deste tutorial estão familiarizados com a estatística básica. Entretanto, no começo deste tutorial, eu havia prometido de suprir o conhecimento prévio necessário para o entendimento da operação do Filtro de Kalman. Se você está familiarizado com esse assunto, sinta-se livre para pular para a próxima seção.
Média e Valor Esperado são termos intimamente relacionados. Todavia, eles são diferentes.
Por exemplo, dado cinco moedas distintas – duas de 5 centavos e três de 10 centavos, nós podemos facilmente calcular o valor médio por moeda apenas calculando a média dos seus valores.
O resultado acima não pode ser definido como valor esperado, desde que os estados do sistema (valores das moedas) não são ocultos, e nós usamos toda a população (todas as 5 moedas) para o cálculo do valor médio.
Agora, assuma cinco medições distintas do peso de uma mesma pessoa: 79.8kg, 80kg, 80.1kg, 79.8kg, and 80.2kg.
As medições são diferentes devido ao erro de medição aleatório das balanças. Nós não sabemos o verdadeiro valor do peso, já que ele é uma Variável Oculta. Entretanto, podemos estimar o peso calculando a média das medições.
O resultado da estimativa é o valor esperado do peso.
A média é, normalmente, denotada pela letra grega μ.
O valor esperado é, normalmente, denotado pela letra E.
A Variância é a medida de espalhamento do conjunto de dados em relação à sua média.
O Desvio Padrão é a raiz quadrada da variância.
O Desvio Padrão é denotado pela letra grega \( \sigma \) (sigma). Consequentemente, a variância é denotada por \( \sigma ^{2} \).
Por exemplo, queremos comparar as alturas de dois times escolares de basquete. A tabela a seguir provê as alturas dos jogadores de ambos os times e suas médias.
Jogador 1 | Jogador 2 | Jogador 3 | Jogador 4 | Jogador 5 | Média | |
---|---|---|---|---|---|---|
Time A | 1.89m | 2.1m | 1.75m | 1.98m | 1.85m | 1.914m |
Time B | 1.94m | 1.9m | 1.97m | 1.89m | 1.87m | 1.914m |
Como se pode ver, a altura média de ambos os times é a mesma. Agora, vamos examinar a variância da altura.
Como a variância mede o espalhamento do conjuto de dados, gostaríamos de encontra qual é o desvio desses dados em relação à média. Nós podemos calcular a distância de cada média para cada variável subtraindo tais valores.
Denotaremos a altura por \( x \) e a média das alturas pela letra grega \( \mu \). A distância da média para cada variável será:
A tabela a seguir apresenta a distância da média para cada variável.
Jogador 1 | Jogador 2 | Jogador 3 | Jogador 4 | Jogador 5 | |
---|---|---|---|---|---|
Time A | -0.024m | 0.186m | -0.164m | 0.066m | -0.064m |
Time B | 0.026m | -0.014m | 0.056m | -0.024m | -0.044m |
Alguns dos valores são negativos. Para se livrar de tal problema, vamos elevar as distâncias ao quadrado:
A tabela a seguir apresenta os quadrados da distância da média para cada variável.
Jogador 1 | Jogador 2 | Jogador 3 | Jogador 4 | Jogador 5 | |
---|---|---|---|---|---|
Time A | 0.000576m2 | 0.034596m2 | 0.026896m2 | 0.004356m2 | 0.004096m2 |
Time B | 0.000676m2 | 0.000196m2 | 0.003136m2 | 0.000576m2 | 0.001936m2 |
Para calcular a variância do conjunto de dados, precisamos encontrar o valor médio dos quadrados da distâncias da média:
Para o time A, a variância seria:
Para o time B, a variância seria:
Pode-se observar que, embora a média de ambos os times seja a mesma, a medida de espalhamento das alturas do Time A é maior que o espalhamento do Time B. Isso significa que os jogadores do Time A são mais diversificados, existem jogadores para diferentes posições, como armador, pivô e ala; enquanto que os jogadores Time B não são tão versáteis.
As unidades da variâncias estão elevadas ao quadrado; é mais conveniente analisar o desvio padrão. Como já mencionei anteriormente, o desvio padrão é a raiz quadrada da variância.
O desvio padrão das alturas dos jogadores do Time A seria 0.12m.
O desvio padrão das alturas dos jogadores do Time B seria 0.036m.
Agora, assuma que nós queremos calcular a média e variância de todos os jogadores de basquete de todas as escolas. É uma tarefa muito complicada; precisamos coletar os dados de todos os jogadores em todas as escolas.
Por outro lado, podemos estimar a média e a variância dos jogadores pegando um grande conjunto de dados e realizando os cálculos nesse conjunto.
Um conjunto de dados de 100 jogadores selecionados aleatoriamente pode ser o suficiente para uma estimação precisa.
Entretanto, quando estimamos a variância, a equação para o cálculo da variância é um pouco diferente. Ao invés de normalizar pelo fator \( N \) , nós normalizaremos pelo fator \( N-1 \):
O fator de \( N-1 \) é chamado de correção de Bessel.
Você pode ver a prova matemática para essa equação no visiondummy ou Wikipedia.
Acaba que muitos fenômenos naturais seguem a Distribuição Normal. Continuando o exemplo com a altura dos jogadores de basquete, se nós construirmos um grande conjunto de dados de jogadores randomicamente selecionados e construirmos um gráfico da frequência das alturas pelas alturas, nós obteremos uma curva em formato de “sino”, como mostrado no seguinte gráfico:
Como você pode observar, a curva é simétrica ao redor do valor médio, que é 1.9 metros. A frequência dos valores ao redor da média é maior do que a frequência dos valores distantes.
O desvio padrão das alturas é igual a 0.2 metros. 68.26% dos valores estão dentro de um desvio padrão da média. Como você pode ver no gráfico abaixo, 68.26% dos valores estão entre 1.7 metros e 2.1 metros (a área verde é 68.26% da área total abaixo da curva).
95.44% dos valores estão dentro de dois desvios padrão das médias.
99.74% dos valores estão dentro de três desvios padrão das médias.
A distribuição normal, também conhecida como Gaussiana (nomeada em homenagem ao matemático Carl Friedrich Gauss), e é descrito pela seguinte equação:
A curva Gaussiana também é chamada de Usualmente, os erros de medição são distribuídos normalmente. A modelagem do Filtro de Kalman assume distribuição normal dos erros de medição.
Um matemático, um físico e um engenheiro estão viajando numa via com limite de velocidade de 60km/h (quilômetros por hora). Eles são parados por um policial que mediu a velocidade do carro com um radar móvel.
A medição do radar é de 70km/h. A medição do radar móvel distribui normalmente com um desvio padrão de 5km/h.
A medição do radar móvel é uma Variável Randômica. Nós não sabemos o valor preciso da velocidade; o Valor Esperado da velocidade é 70km/h.
O matemático diria que a velocidade do carro pode ser qualquer número entre infinito negativo e infinito positivo, enquanto a probabilidade da velocidade estar entre 65km/h e 75km/h é de 68.29%.
O físico diria que a velocidade do carro pode ser qualquer número maior do que a velocidade da luz negativa e menor do que a velocidade da luz positiva.
O engenheiro diria que a velocidade do carro pode ser qualquer número acima de zero e abaixo de 140km/h (visto que a direção do movimento do carro é positiva e a velocidade máxima do carro é 140km/h).
O policial diria que a velocidade do carro era de 70km/h e escreveria uma bela multa.
A variável randômica pode ser contínua ou discreta:
Todas as medidas são variáveis randômicas contínuas.
Estimativa é sobre avaliar um estado oculto de um sistema. A verdadeira posição de uma aeronave é oculta para o observador. Nós podemos estimar a posição da aeronave usando sensores, como radares. A estimativa pode ser melhorada significativamente por meio do uso de múltiplos sensores, aplicando cálculos avançados e algoritmos de rastreamento (assim como o Filtro de Kalman. Toda medida ou parâmetro computado é uma estimativa.
Exatidão indica quão próximo o cálculo está do valor verdadeiro.
Precisão descreve quanta variabilidade há em um número de medições de mesmo parâmetro. Exatidão e precisão formam a base para a estimativa.
A figura a seguir ilustra a exatidão e a precisão.
Os sistemas de alta precisão tem uma baixa variância nas suas medições (i.e. baixa incerteza), enquanto os sistemas de baixa precisão possuem alta variância em suas medições (i.e. alta incerteza). A variância é produzida por um erro randômico de cálculo.
Os sistemas de baixa exatidão são chamados de sistemas enviesados,já que suas medições possuem erros sistemáticos embutidos (viés).
A influência da variância pode ser significativamente reduzida, calculando a média ou suavizando cálculos. Por exemplo, se nós medirmos a temperatura usando um termômetro com um erro randômico de medição, nós podemos fazer múltiplas medidas e fazer a média delas. Visto que, o erro é randômico, algumas medições podem estar acima do verdadeiro valor e outras abaixo do verdadeiro valor. A estimativa estaria próxima do valor real. Quanto mais medições nós fazemos, mais perto da estimativa nós estamos.
Por outro lado, se o termômetro estiver enviesado, a estimativa irá incluir um erro sistemático constante
Todos os exemplos nesse tutorial assumem sistemas enviesados.
A figura a seguir representa uma visão estatística das medições.
A medição é uma variável randômica, descrita pela Função Densidade de Probabilidade (Probability Density Function - PDF).
A média das medidas é o Valor Esperado das variáveis randômicas.
O deslocamento entre a média das medidas e o valor real é a exatidão das medidas, também conhecida como viés ou erro sistemático de medição.
A dispersão da distribuição é a medição da precisão, também conhecida como ruído de medição ou erro randômico de medição ou incerteza de medição.