Tecnologia

Como usar a conversão de fala em texto do Chrome

O Google introduziu uma maneira de conversar com seu navegador, desde que esse navegador seja o Chrome. Ele não responderá, mas fará o seu lance. Essas instruções cobrem o básico do novo recurso de conversão de fala em texto, que é funcional, mas ainda precisa ser amplamente implementado.

Agora jogando: Vê isto: Use a conversão de fala em texto no Google Chrome 2:55

Em primeiro lugar, certifique-se de que está usando o Google Chrome 11 ( baixar para windows | Mac | Linux ) ou posterior, e que você tem um microfone. Em seguida, você precisa navegar para um site que suporte a nova API de fala. Atualmente, isso é limitado a Google Tradutor , que por si só se limita a traduções originadas em inglês. Espere que isso mude à medida que os desenvolvedores do site começarem a implementar o recurso. Um outro problema é que, por ser um recurso totalmente novo, também está limitado no momento no Google Tradutor a traduções originadas em inglês.

Então: defina o Google Tradutor para inglês e clique no microfone que aparece no canto inferior direito da caixa de entrada. Fale a frase que deseja traduzir. Quando você terminar de falar, o Google irá traduzi-lo automaticamente. Você também pode usar a opção Ouvir do site (à direita do campo de texto) para ouvir como é a tradução.

Sites que atualmente usam a API de fala
Google Tradutor
Web2Voice , que demonstra a reprodução, o controle e a pesquisa de vídeo incorporado
Web site de demonstração HTML5

Atualmente, existem algumas opções não oficiais para jogar com a API Speech-to-HTML. o Site Web2Voice que descobri em um fórum de grupos do Google HTML5 do Chromium implementou a compatibilidade básica do YouTube usando a nova API de fala. Clique no ícone do microfone e diga 'trailer do Lanterna Verde' para procurar trailers do próximo filme. Se você clicar e disser 'Reproduzir trailer oficial', ele reproduzirá o trailer com essas palavras no título. Para pausar, clique e diga 'parar'. Para retomar, clique e diga 'reproduzir'.



Esta não é uma implementação oficial, uma vez que apareceria no site do YouTube. Mas isso certamente dá uma forte indicação do que a API é capaz. Infelizmente, ter que clicar no microfone para cada entrada é um pouco chato. Você também pode clicar no botão de pausa. Também irritante é que o recurso tem problemas para distinguir entre a reprodução de áudio do computador e sua voz.

O que isso provavelmente será extremamente útil é a acessibilidade no próximo Google Chrome OS. Se você está gastando todo o seu tempo de computação no navegador, como estará no Chrome OS, e usar o teclado não é fácil para você, é necessário ter opções de fala para comando sob demanda.

Se você descobrir mais opções para a API, deixe-me saber nos comentários abaixo.