Uma luva colorida e uma webcam. Este é todo o hardware necessário para operar um novo sistema de computação baseada em gestos, criada por um estudante do MIT, nos Estados Unidos.
Interface por gestos usa luva colorida e webcam2D versus 3D
Outros protótipos de interfaces gestuais já utilizaram fitas coloridas ou reflexivas coladas na ponta dos dedos ou mesmo em luvas.
"Mas isto é informação 2D. Você está usando apenas as pontas dos dedos e nem mesmo sabe que fita corresponde a qual dedo," critica Robert Wang, criador da nova interface, bem mais espalhafatosa.
A luva colorida permite a geração de um modelo 3D da mão na tela do computador, praticamente em tempo real, com uma defasagem mínima. "Este [equipamento] de fato captura a configuração 3D da sua mão e dos seus dedos. Nós sabemos como os seus dedos estão se movimentando," diz Wang.
Luvas coloridas
Foram testados diversos designs de luva, com pontos coloridos e "remendos" de diversos formatos. A versão atual, que apresentou os melhores resultados até agora, possui 20 formatos irregulares, usando 10 cores diferentes.
O número de cores é restrito porque o sistema deve ser capaz de reconhecer cada uma delas com confiabilidade, em diversas condições de iluminação e com diferentes objetos no background da cena.
Diversão e uso sério
A vocação da nova tecnologia de interface por gestos são os videogames. Mundos virtuais, por exemplo, permitem que o usuário pegue e manipule objetos usando apenas gestos com as mãos.
Mas Wang afirma que engenheiros e projetistas também poderão usar o sistema para manipular de forma mais intuitiva modelos 3D de produtos comerciais, equipamentos mecânicos ou grandes obras de construção civil - veja a demonstração no vídeo abaixo.
Diminuição da resolução
O software de reconhecimento das imagens foi baseado em uma outra pesquisa do MIT, quando Antonio Torralba e seus colegas desenvolveram um algoritmo que reconhece imagens diminuindo sua resolução.
Depois que a webcam captura a imagem, o software retira o background, deixando a luva superposta a um fundo branco. Então o programa reduz drasticamente a resolução da imagem resultante, até atingir 40 por 40 pixels.
Finalmente, ele compara a imagem capturada com uma base de dados contendo centenas de modelos digitais de 40 x 40 pixels, até encontrar aquela que corresponda à posição atual.
Esse mecanismo, que elimina a necessidade de cálculos, retorna uma resposta em uma fração de segundo, praticamente eliminando os retardos no uso da luva.