Pausa para recapitular

Antes de iniciarmos, gostaria de explicar uma série de termos fundamentais, como variância, desvio padrão, distribuição normal, estimativa, acurácia, precisão, média, valor esperado e variável aleatória.

Eu suponho que muitos leitores deste tutorial estão familiarizados com a estatística básica. Entretanto, no começo deste tutorial, eu havia prometido de suprir o conhecimento prévio necessário para o entendimento da operação do Filtro de Kalman. Se você está familiarizado com esse assunto, sinta-se livre para pular para a próxima seção.

Média e Valor Esperado

Média e Valor Esperado são termos intimamente relacionados. Todavia, eles são diferentes.

Por exemplo, dado cinco moedas distintas – duas de 5 centavos e três de 10 centavos, nós podemos facilmente calcular o valor médio por moeda apenas calculando a média dos seus valores.

Moedas
\[ V_{média}= \frac{1}{N} \sum _{n=1}^{N}V_{n}= \frac{1}{5} \left( 5+5+10+10+10 \right) = 8centavos \]

O resultado acima não pode ser definido como valor esperado, desde que os estados do sistema (valores das moedas) não são ocultos, e nós usamos toda a população (todas as 5 moedas) para o cálculo do valor médio.

Agora, assuma cinco medições distintas do peso de uma mesma pessoa: 79.8kg, 80kg, 80.1kg, 79.8kg, and 80.2kg.

Homem na balança

As medições são diferentes devido ao erro de medição aleatório das balanças. Nós não sabemos o verdadeiro valor do peso, já que ele é uma Variável Oculta. Entretanto, podemos estimar o peso calculando a média das medições.

\[ W= \frac{1}{N} \sum _{n=1}^{N}W_{n}= \frac{1}{5} \left(79.8+80+80.1+79.8+80.2 \right) =79.98kg \]

O resultado da estimativa é o valor esperado do peso.

A média é, normalmente, denotada pela letra grega μ.

O valor esperado é, normalmente, denotado pela letra E.

Variância e Desvio Padrão

A Variância é a medida de espalhamento do conjunto de dados em relação à sua média.

O Desvio Padrão é a raiz quadrada da variância.

O Desvio Padrão é denotado pela letra grega \( \sigma \) (sigma). Consequentemente, a variância é denotada por \( \sigma ^{2} \).

Por exemplo, queremos comparar as alturas de dois times escolares de basquete. A tabela a seguir provê as alturas dos jogadores de ambos os times e suas médias.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5 Média
Time A 1.89m 2.1m 1.75m 1.98m 1.85m 1.914m
Time B 1.94m 1.9m 1.97m 1.89m 1.87m 1.914m

Como se pode ver, a altura média de ambos os times é a mesma. Agora, vamos examinar a variância da altura.

Como a variância mede o espalhamento do conjuto de dados, gostaríamos de encontra qual é o desvio desses dados em relação à média. Nós podemos calcular a distância de cada média para cada variável subtraindo tais valores.

Denotaremos a altura por \( x \) e a média das alturas pela letra grega \( \mu \). A distância da média para cada variável será:

\[ x_{n}- \mu = x_{n}-1.914m \]

A tabela a seguir apresenta a distância da média para cada variável.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5
Time A -0.024m 0.186m -0.164m 0.066m -0.064m
Time B 0.026m -0.014m 0.056m -0.024m -0.044m

Alguns dos valores são negativos. Para se livrar de tal problema, vamos elevar as distâncias ao quadrado:

\[ \left( x_{n}- \mu \right) ^{2} = \left( x_{n}- 1.914m \right) ^{2} \]

A tabela a seguir apresenta os quadrados da distância da média para cada variável.

Jogador 1 Jogador 2 Jogador 3 Jogador 4 Jogador 5
Time A 0.000576m2 0.034596m2 0.026896m2 0.004356m2 0.004096m2
Time B 0.000676m2 0.000196m2 0.003136m2 0.000576m2 0.001936m2

Para calcular a variância do conjunto de dados, precisamos encontrar o valor médio dos quadrados da distâncias da média:

\[ \sigma ^{2}= \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}- \mu \right) ^{2} \]

Para o time A, a variância seria:

\[ \sigma _{A}^{2} = \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}-\mu \right) ^{2}= \frac{1}{5} \left( 0.000576+ 0.034596+0.026896+ 0.004356+ 0.004096 \right) = 0.014m^{2} \]

Para o time B, a variância seria:

\[ \sigma _{B}^{2} = \frac{1}{N} \sum _{n=1}^{N} \left( x_{n}-\mu \right) ^{2}= \frac{1}{5} \left( 0.000676+ 0.000196+0.003136+ 0.000576+ 0.001936 \right) = 0.0013m^{2} \]

Pode-se observar que, embora a média de ambos os times seja a mesma, a medida de espalhamento das alturas do Time A é maior que o espalhamento do Time B. Isso significa que os jogadores do Time A são mais diversificados, existem jogadores para diferentes posições, como armador, pivô e ala; enquanto que os jogadores Time B não são tão versáteis.

As unidades da variâncias estão elevadas ao quadrado; é mais conveniente analisar o desvio padrão. Como já mencionei anteriormente, o desvio padrão é a raiz quadrada da variância.

\[ \sigma =\sqrt[]{\frac{1}{N} \sum _{n=1}^{N} \left( x_{n} - \mu \right) ^{2}} \]

O desvio padrão das alturas dos jogadores do Time A seria 0.12m.

O desvio padrão das alturas dos jogadores do Time B seria 0.036m.

Agora, assuma que nós queremos calcular a média e variância de todos os jogadores de basquete de todas as escolas. É uma tarefa muito complicada; precisamos coletar os dados de todos os jogadores em todas as escolas.

Por outro lado, podemos estimar a média e a variância dos jogadores pegando um grande conjunto de dados e realizando os cálculos nesse conjunto.

Um conjunto de dados de 100 jogadores selecionados aleatoriamente pode ser o suficiente para uma estimação precisa.

Entretanto, quando estimamos a variância, a equação para o cálculo da variância é um pouco diferente. Ao invés de normalizar pelo fator \( N \) , nós normalizaremos pelo fator \( N-1 \):

\[ \sigma ^{2}= \frac{1}{N-1} \sum _{n=1}^{N} \left( x_{n}-\mu \right) ^{2} \]

O fator de \( N-1 \) é chamado de correção de Bessel.

Você pode ver a prova matemática para essa equação no visiondummy ou Wikipedia.

Distribuição Normal

Acaba que muitos fenômenos naturais seguem a Distribuição Normal. Continuando o exemplo com a altura dos jogadores de basquete, se nós construirmos um grande conjunto de dados de jogadores randomicamente selecionados e construirmos um gráfico da frequência das alturas pelas alturas, nós obteremos uma curva em formato de “sino”, como mostrado no seguinte gráfico:

Gaussiano

Como você pode observar, a curva é simétrica ao redor do valor médio, que é 1.9 metros. A frequência dos valores ao redor da média é maior do que a frequência dos valores distantes.

O desvio padrão das alturas é igual a 0.2 metros. 68.26% dos valores estão dentro de um desvio padrão da média. Como você pode ver no gráfico abaixo, 68.26% dos valores estão entre 1.7 metros e 2.1 metros (a área verde é 68.26% da área total abaixo da curva).

Desvio Padrão

95.44% dos valores estão dentro de dois desvios padrão das médias.
99.74% dos valores estão dentro de três desvios padrão das médias.

A distribuição normal, também conhecida como Gaussiana (nomeada em homenagem ao matemático Carl Friedrich Gauss), e é descrito pela seguinte equação:

\[ f \left( x; \mu , \sigma ^{2} \right) = \frac{1}{\sqrt[]{2\pi \sigma ^{2}}}e^{\frac{- \left( x- \mu \right) ^{2}}{2\sigma ^{2}}} \]

A curva Gaussiana também é chamada de Usualmente, os erros de medição são distribuídos normalmente. A modelagem do Filtro de Kalman assume distribuição normal dos erros de medição.

Variáveis Randômicas

Um matemático, um físico e um engenheiro estão viajando numa via com limite de velocidade de 60km/h (quilômetros por hora). Eles são parados por um policial que mediu a velocidade do carro com um radar móvel.

A medição do radar é de 70km/h. A medição do radar móvel distribui normalmente com um desvio padrão de 5km/h.

A medição do radar móvel é uma Variável Randômica. Nós não sabemos o valor preciso da velocidade; o Valor Esperado da velocidade é 70km/h.

O matemático diria que a velocidade do carro pode ser qualquer número entre infinito negativo e infinito positivo, enquanto a probabilidade da velocidade estar entre 65km/h e 75km/h é de 68.29%.

O físico diria que a velocidade do carro pode ser qualquer número maior do que a velocidade da luz negativa e menor do que a velocidade da luz positiva.

O engenheiro diria que a velocidade do carro pode ser qualquer número acima de zero e abaixo de 140km/h (visto que a direção do movimento do carro é positiva e a velocidade máxima do carro é 140km/h).

O policial diria que a velocidade do carro era de 70km/h e escreveria uma bela multa.

A variável randômica pode ser contínua ou discreta:

  • O tempo de carga de uma bateria ou o tempo de uma maratona são variáveis randômicas contínuas.
  • O número de visitantes de um website ou o número de estudantes em uma classe são variáveis randômicas discretas, pois elas podem ser contadas.

Todas as medidas são variáveis randômicas contínuas.

Estimativa, Exatidão e Precisão

Estimativa é sobre avaliar um estado oculto de um sistema. A verdadeira posição de uma aeronave é oculta para o observador. Nós podemos estimar a posição da aeronave usando sensores, como radares. A estimativa pode ser melhorada significativamente por meio do uso de múltiplos sensores, aplicando cálculos avançados e algoritmos de rastreamento (assim como o Filtro de Kalman. Toda medida ou parâmetro computado é uma estimativa.

Exatidão indica quão próximo o cálculo está do valor verdadeiro.

Precisão descreve quanta variabilidade há em um número de medições de mesmo parâmetro. Exatidão e precisão formam a base para a estimativa.

A figura a seguir ilustra a exatidão e a precisão.

Exatidão e Precisão

Os sistemas de alta precisão tem uma baixa variância nas suas medições (i.e. baixa incerteza), enquanto os sistemas de baixa precisão possuem alta variância em suas medições (i.e. alta incerteza). A variância é produzida por um erro randômico de cálculo.

Os sistemas de baixa exatidão são chamados de sistemas enviesados,já que suas medições possuem erros sistemáticos embutidos (viés).

A influência da variância pode ser significativamente reduzida, calculando a média ou suavizando cálculos. Por exemplo, se nós medirmos a temperatura usando um termômetro com um erro randômico de medição, nós podemos fazer múltiplas medidas e fazer a média delas. Visto que, o erro é randômico, algumas medições podem estar acima do verdadeiro valor e outras abaixo do verdadeiro valor. A estimativa estaria próxima do valor real. Quanto mais medições nós fazemos, mais perto da estimativa nós estamos.

Por outro lado, se o termômetro estiver enviesado, a estimativa irá incluir um erro sistemático constante

Todos os exemplos nesse tutorial assumem sistemas enviesados.

Sumário

A figura a seguir representa uma visão estatística das medições.

Visão estatística das medições

A medição é uma variável randômica, descrita pela Função Densidade de Probabilidade (Probability Density Function - PDF).

A média das medidas é o Valor Esperado das variáveis randômicas.

O deslocamento entre a média das medidas e o valor real é a exatidão das medidas, também conhecida como viés ou erro sistemático de medição.

A dispersão da distribuição é a medição da precisão, também conhecida como ruído de medição ou erro randômico de medição ou incerteza de medição.

Anterior Próximo