;

El futuro del reconocimiento de voz y la conversión de texto a voz en el iPhone según Apple

¡Y seguimos con las patentes de Apple! La compañía ha solicitado una nueva a la oficina de patentes y marcas de los EE.UU. en la que se describe un sistema de reconocimiento de voz y conversión de texto a voz diseñado para funcionar en entornos ruidosos basado en hardware que ampliaría notablemente las características actuales de control por voz presentes en el iPhone.

La patente describe los problemas de mantener una conversación telefónica cuando alguno de los implicados se encuentra en un lugar ruidoso (como un restaurante atestado de gente) o realizando alguna actividad que le impide hablar (como encontrarse en mitad de una reunión o en el cine disfrutando de una película). Actualmente nos limitaríamos a gritar (normalmente haciendo que la señal llegue aún más distorsionada) o a susurrar (poniendo las cosas igualmente difíciles en el otro extremo).

La solución de Apple ofrece diferentes alternativas entre las que destaca, la conversión de texto a voz en cualquier punto de la conversación, de modo que mientras que uno seguiría hablando normalmente, el otro recibiría una transcripción de sus palabras en la pantalla del iPhone a las que podría responder escribiendo mensajes de texto.

Una segunda patente relacionada indirectamente con la anterior, revela una versión mejorada del sistema por el cual rechazamos una llamada entrante en el que además del actual botón para contestar, aparecerían opciones para dirigir la llamada automáticamente a nuestro buzón de voz o para rechazarla. En este último caso, manteniendo pulsado el botón de colgar se desplegarían varias posibles respuestas que se enviarían a la otra persona en la que le daríamos un motivo: reunión, cine, conduciendo…

Sin duda, dos patentes muy interesantes que esperemos lleguen rápidamente a iOS. La primera en particular tiene un enorme número de aplicaciones que incluyen un mejor acceso universal permitiendo una comunicación telefónica más fluida con personas con discapacidades auditivas o del habla y, en un futuro, una posible puerta a la traducción simultánea automática.

Ayer mismo os hablábamos de las nuevas voces de Mac OS X Lion creadas por Nuance, una compañía especializada en el reconocimiento de voz e imágenes responsable de aplicaciones como Dragon Dictation, y pocos días atrás nos hacíamos eco de los últimos rumores acerca de los posibles frutos que la relación entre estas dos empresas podría dar en iOS 5. Crucemos los dedos para que la WWDC 2011 nos traiga más novedades en este sentido el próximo 6 de junio.

Vía | Patently Apple

Portada de Applesfera