Estatística de Dados
Contents
Descrição
Esta experiência consiste num sistema automático de lançamento de dados de seis faces. Para se contarem as pintas, procede-se à aquisição e análise automática da imagem destes dados.
Os valores permitem estudar a lei das probabilidades e elaborar um estudo estatístico de fenómenos aleatórios. Pode-se, também, utilizar as imagens para desenvolver algoritmos próprios, aplicando os mesmos no estudo de várias ferramentas de visão por computador.
Ligações
- Video: [indisponível]
- Laboratório: Básico em e-lab.ist.eu[1]
- Sala de controlo: Aleatório
- Nivel: ***
<swf height="320" width="320">http://www.elab.tecnico.ulisboa.pt/anexos/descricoes-flash/EstatisticaDados.swf</swf>
Aparato Experimental
A experiência consiste num altifalante posicionado na horizontal com uma plataforma no topo do cone de k-line (cartão estruturado com poliuretano), onde se encontram espalhados 14 dados. Na parte superior, a 30 cm da plataforma, está uma câmara de vídeo e um led branco de alto brilho para iluminar a plataforma.
O lançamento dos dados é conseguido através da excitação do altifalante com uma onda sonora, vibrando a plataforma com a mesma frequência da onda.
Esta plataforma tem uma parede que impede os dados de saírem da plataforma e do campo de visão da webcam. Esta parede é bastante alta, para impedir a entrada de luz que não provenha do seu sistema de iluminação.
Com este aparato, obtêm-se imagens como a da figura 2.
O processamento desta imagem é feito segundo o fluxograma abaixo e o resultado deste processamento leva a uma imagem como a da figura 3.
Protocolo
O protocolo de execução da experiência é simples porque consiste em excitar, convenientemente, a plataforma para que esta consiga baralhar os dados. De seguida, descreve-se os principais elementos do configurador da sala de controlo para uma melhor compreensão dos mesmos.
Som (lançamento dos dados)
Os dados são lançados (baralhados) pelo movimento oscilante da plataforma onde se encontram. Pode-se seleccionar as frequências inicial e final da onda sonora que vai ser transmitida à plataforma de lançamento dos dados. Esta onda é gerada na altura, ou seja, não há uma colecção de ficheiros de som que já estão gravados com todas as combinações possíveis.
A frequência mínima possível é 20 Hz e a máxima é de 150 Hz.
Abaixo de 20 Hz, não há resposta do altifalante, do amplificador, nem da placa de som que permita a vibração da plataforma. Acima dos 150 Hz, por inércia, a vibração da plataforma tem uma amplitude muito reduzida, logo não é suficiente para comunicar movimento aos dados.
Escolhemos também a duração desta onda sonora, com um mínimo de 1.5 s e um máximo de 10 s. 1.5 s é suficiente para os dados se baralharem um pouco mas para certas frequências perto dos limites, são poucos os que mudam a face virada para cima. 10 s já permite que haja uma desordem dos dados bastante elevada embora desnecessária na maioria dos casos.
Imagem
Escolhemos quantas imagens pretendemos analisar, ao escolher o número de amostras. No mínimo podemos ter uma amostra e, no máximo, vinte.
Uma amostra serve para verificarmos como funciona o motor de detecção, quais os passos que ele segue e quanto tempo demora em cada passo. Com vinte amostras é possível vermos a distribuição que se espera aproximar à “gaussiana” (apesar de tal só acontecer, em teoria, para trinta amostras, pelo menos).
Video
Podemos escolher ver ou não o vídeo do processo de baralhar os dados.
Este vídeo é composto por uma sequência de imagens em formato .jpeg, logo não é um vídeo no verdadeiro sentido da palavra, podendo demorar a transferência de dados de acordo com a velocidade da rede.
Visto que o vídeo exige uma elevada utilização da largura de banda disponível, é aconselhável o seu uso apenas para uma amostra e para ver uma única vez, com intuito lúdico, dado que se torna repetitivo.
Protocolo Avançado
Após a aquisição de suficientes contagens, constrói-se um gráfico do número de ocorrências e faz-se um ajuste à função de distribuição Gaussiana esperada, representada por:
\[ p(x) = y_0 + A e ^{- \frac{(x- \mu)^2}{\sigma ^2}} \]
Como se têm 14 dados, espera-se que o valor mais provável seja 49, o que é comprovado por este ajuste efectuado pela acumulação de valores.
A melhor forma de realizarmos este estudo é articular os resultados de vários utilizadores e verificarmos como melhora o ajuste em função do número crescente de amostras adicionadas.
O valor esperado para o valor médio do lançamento de N dados de seis faces é dado por:
\[ \bar{\mu} = \frac{6N+N}{2} \]
Manual de Utilização
É possível escolhermos os parâmetros todos da análise de imagem.
- Black&White Threshold: para definir o valor, em escala de cinzento, acima do qual os pixéis ficam a branco.
- Para a Transformada de Hough:
- Threshold1: define o valor acima do qual um pixel da imagem da transformada de Hough é considerado para análise posterior;
- Threshold2: faz a média dos pixéis na vizinhança do pixel que passou o teste anterior e, se essa média for acima deste Threshold2, esse pixel é considerado para análise posterior;
- Threshold3: à partida, qualquer pixel detectado numa zona a branco do dado é desprezado, mas, se esse pixel apresentar uma média (calculada para o teste anterior) superior a este Threshold3, então esse pixel é aproveitado. Isto, porque os dados têm, por vezes, o centro das pintas a branco.
- Convolution Thresold: define o valor acima do qual um pixel da imagem da convolução é considerado para análise posterior;
- Propriedades dos dados:
- Raio da pinta: raio esperado, em pixéis, para a(s) pinta(s) do(s) dado(s) (Nota: Este algoritmo espera que as pintas sejam circulares).
- Largura do dado: distância máxima, em pixéis, entre pintas. Ou seja, para dados de 6 pintas, esta será a distância duma pinta num canto ao outro, na diagonal.
- Número de dados esperado: quantidade de dados esperada. Se for detectada uma quantidade superior e alguns desses não forem detectados como "compatíveis" com dados, então estes serão eliminados (Nota: O algoritmo compara as posições das pintas com conjuntos detectados, com base na proximidade das pintas. Estes conjuntos são comparados com o que se espera obter num dado com a quantidade de pintas que esse conjunto tiver; se essa comparação der positiva, o conjunto fica marcado como "compatível", se não tenta-se fazer trocas e/ou eliminação de pintas até se obter conjuntos "compatíveis" com dados).