Estatística de Dados

From wwwelab
Revision as of 17:09, 12 March 2013 by Ist165721 (talk | contribs)
Jump to navigation Jump to search

Descrição

Esta experiência consiste num sistema automático de lançamento de dados de seis faces. Para se contarem as pintas, procede-se à aquisição e análise automática da imagem destes dados.

Os valores permitem estudar a lei das probabilidades e elaborar um estudo estatístico de fenómenos aleatórios. Pode-se, também, utilizar as imagens para desenvolver algoritmos próprios, aplicando os mesmos no estudo de várias ferramentas de visão por computador.

Ligações

  • Video: [indisponível]
  • Laboratório: Básico em e-lab.ist.eu[1]
  • Sala de controlo: Aleatório
  • Nivel: ***
The #evp parser function was deprecated in EmbedVideo 2.0. Please convert your parser function tag to #ev.

<swf height="320" width="320">http://www.elab.tecnico.ulisboa.pt/anexos/descricoes-flash/EstatisticaDados.swf</swf>


Aparato Experimental

A experiência consiste num altifalante posicionado na horizontal com uma plataforma no topo do cone de k-line (cartão estruturado com poliuretano), onde se encontram espalhados 14 dados. Na parte superior, a 30 cm da plataforma, está uma câmara de vídeo e um led branco de alto brilho para iluminar a plataforma.

Montagem para a Estatística de Dados
Montagem

O lançamento dos dados é conseguido através da excitação do altifalante com uma onda sonora, vibrando a plataforma com a mesma frequência da onda.

Esta plataforma tem uma parede que impede os dados de saírem da plataforma e do campo de visão da webcam. Esta parede é bastante alta, para impedir a entrada de luz que não provenha do seu sistema de iluminação.

Com este aparato, obtêm-se imagens como a da figura 2.

Figura 2: Imagem original

O processamento desta imagem é feito segundo o fluxograma abaixo e o resultado deste processamento leva a uma imagem como a da figura 3.

Figura 3: Imagem após reconhecimento
Fluxograma


Protocolo

O protocolo de execução da experiência é simples porque consiste em excitar, convenientemente, a plataforma para que esta consiga baralhar os dados. De seguida, descreve-se os principais elementos do configurador da sala de controlo para uma melhor compreensão dos mesmos.

Figura 4: Configurador da “sala de controlo” da experiência

Som (lançamento dos dados)

Os dados são lançados (baralhados) pelo movimento oscilante da plataforma onde se encontram. Pode-se seleccionar as frequências inicial e final da onda sonora que vai ser transmitida à plataforma de lançamento dos dados. Esta onda é gerada na altura, ou seja, não há uma colecção de ficheiros de som que já estão gravados com todas as combinações possíveis.

A frequência mínima possível é 20 Hz e a máxima é de 150 Hz.

Abaixo de 20 Hz, não há resposta do altifalante, do amplificador, nem da placa de som que permita a vibração da plataforma. Acima dos 150 Hz, por inércia, a vibração da plataforma tem uma amplitude muito reduzida, logo não é suficiente para comunicar movimento aos dados.

Escolhemos também a duração desta onda sonora, com um mínimo de 1.5 s e um máximo de 10 s. 1.5 s é suficiente para os dados se baralharem um pouco mas para certas frequências perto dos limites, são poucos os que mudam a face virada para cima. 10 s já permite que haja uma desordem dos dados bastante elevada embora desnecessária na maioria dos casos.

Imagem

Escolhemos quantas imagens pretendemos analisar, ao escolher o número de amostras. No mínimo podemos ter uma amostra e, no máximo, vinte.

Uma amostra serve para verificarmos como funciona o motor de detecção, quais os passos que ele segue e quanto tempo demora em cada passo. Com vinte amostras é possível vermos a distribuição que se espera aproximar à “gaussiana” (apesar de tal só acontecer, em teoria, para trinta amostras, pelo menos).

Video

Podemos escolher ver ou não o vídeo do processo de baralhar os dados.

Este vídeo é composto por uma sequência de imagens em formato .jpeg, logo não é um vídeo no verdadeiro sentido da palavra, podendo demorar a transferência de dados de acordo com a velocidade da rede.

Visto que o vídeo exige uma elevada utilização da largura de banda disponível, é aconselhável o seu uso apenas para uma amostra e para ver uma única vez, com intuito lúdico, dado que se torna repetitivo.


Protocolo Avançado

Após a aquisição de suficientes contagens, constrói-se um gráfico do número de ocorrências e faz-se um ajuste à função de distribuição Gaussiana esperada, representada por:

\[ p(x) = y_0 + A e ^{- \frac{(x- \mu)^2}{\sigma ^2}} \]

Figura 5: Distribuição estatística de exemplo

Como se têm 14 dados, espera-se que o valor mais provável seja 49, o que é comprovado por este ajuste efectuado pela acumulação de valores.

A melhor forma de realizarmos este estudo é articular os resultados de vários utilizadores e verificarmos como melhora o ajuste em função do número crescente de amostras adicionadas.

O valor esperado para o valor médio do lançamento de N dados de seis faces é dado por:

\[ \bar{\mu} = \frac{6N+N}{2} \]


Manual de Utilização

É possível escolhermos os parâmetros todos da análise de imagem.

  • Black&White Threshold: para definir o valor, em escala de cinzento, acima do qual os pixéis ficam a branco.
  • Para a Transformada de Hough:
    • Threshold1: define o valor acima do qual um pixel da imagem da transformada de Hough é considerado para análise posterior;
    • Threshold2: faz a média dos pixéis na vizinhança do pixel que passou o teste anterior e, se essa média for acima deste Threshold2, esse pixel é considerado para análise posterior;
    • Threshold3: à partida, qualquer pixel detectado numa zona a branco do dado é desprezado, mas, se esse pixel apresentar uma média (calculada para o teste anterior) superior a este Threshold3, então esse pixel é aproveitado. Isto, porque os dados têm, por vezes, o centro das pintas a branco.
  • Convolution Thresold: define o valor acima do qual um pixel da imagem da convolução é considerado para análise posterior;
  • Propriedades dos dados:
    • Raio da pinta: raio esperado, em pixéis, para a(s) pinta(s) do(s) dado(s) (Nota: Este algoritmo espera que as pintas sejam circulares).
    • Largura do dado: distância máxima, em pixéis, entre pintas. Ou seja, para dados de 6 pintas, esta será a distância duma pinta num canto ao outro, na diagonal.
    • Número de dados esperado: quantidade de dados esperada. Se for detectada uma quantidade superior e alguns desses não forem detectados como "compatíveis" com dados, então estes serão eliminados (Nota: O algoritmo compara as posições das pintas com conjuntos detectados, com base na proximidade das pintas. Estes conjuntos são comparados com o que se espera obter num dado com a quantidade de pintas que esse conjunto tiver; se essa comparação der positiva, o conjunto fica marcado como "compatível", se não tenta-se fazer trocas e/ou eliminação de pintas até se obter conjuntos "compatíveis" com dados).


Ligações