Tal vez uno de los episodios más sorprendentes del mundo de la informática, es la interacción ser humano – máquina. No solemos prestarle atención porque afortunadamente, el grado de desarrollo de la tecnología hoy en día es tan grande que esa cortante filo que separa los dos mundos está más difuminado que nunca. Pero no es suficiente para lo que está por venir.
Costó años de investigación crear máquinas lo suficientemente complejas que elaboraran tareas que el hombre era incapaz de hacer por si solo. Ese fue el primer paso. Una vez desarrolladas, las máquinas tenían un potencial enorme, y la barrera que nos separaba de ellas no era más que quien las usaba: sólo podía hacerlo prácticamente quien las inventaba, ya que la complejidad de convertir nuestras órdenes en tareas procesables era muy alta.
Para conseguirlo, pasamos de los engranajes, las válvulas, los cientos de botones y las tarjetas perforadas, a los lenguajes de programación más elaborados. Por fin, la ciencia era capaz de comunicarse mediante lenguajes más o menos estructurados y lo más importante, más homogéneos entre varias computadoras. Y de repente, en un movimiento que muy pocas personas esperaban, llegaron los usuarios. Eso lo cambió todo.
La inteligibilidad mutua

Esta propiedad lingüística se refiere a la capacidad de dos hablantes de variedades diferentes para comprenderse mutuamente sin haber estudiado o aprendido la variedad ajena. Es algo muy subjetivo, atado a condicionantes culturales como el grado cultural o educativo de los “hablantes”. Cuando los usuarios no-científicos llegaron a la informática, ocurrió algo similar. Necesitábamos comunicarnos con las máquinas, y ellas con nosotros, pero ninguna de las dos partes entendía muy bien al otro. Al menos no del todo.
Todas las empresas de informática de mundo han trabajado en esto. Sin embargo, hoy hablaremos de lo que hizo Apple ya que estamos en Applesfera, y porque personalmente que es una de las compañías que más han ayudado a la popularización de algo básico para comprender el acercamiento entre el ser humano y la máquina: las interfaces, definida como un modo de dar comunicación entre distintos niveles.
Las tres interfaces importantes

Aunque quizás sea una lista con matices, para explicar el camino recorrido hasta ahora hablaré de las tres interfaces más importantes que, en mi opinión, existen en la informática hoy en día:
-
El teclado: Elemento básico en cualquier computadora hoy en día, fue de los primeros dispositivos en diferenciarse de las grandes máquinas de válvulas y miles de botones, llevando la posibilidad más cercana y conocida a los usuarios, acostumbrados durante años a las máquinas de escribir. Las interfaces todavía eran textuales y se necesitaba un alto grado de conocimiento del lenguaje de la máquina para comunicarnos con ella.
-
La interfaz gráfica y el ratón: Sin duda, la visualización de la información organizada como una metáfora de la vida real (“escritorio”, “carpetas”, “archivos”…) fue la que más rápidamente caló en el usuario. El ratón, como elemento de control e introducción de datos sin ningún tipo de conocimiento previo, fue decisivo para popularizar la informática y acercarla más a la gente.
-
Las pantallas táctiles: Lo estamos viviendo ahora mismo. La llegada de la tecnología táctil a los dispositivos ha aumentado el uso y sobre todo, el abanico de usuarios que pueden usarlos, no necesitando ni siquiera previo conocimiento de ningún ordenador. Es la interfaz más usable que se ha desarrollado hasta ahora, ya que directamente “tocamos” los elementos que un sistema pone ante nosotros como opciones. Utilizamos también nuevas metáforas de la vida real para movernos, como el desplazamiento inercial en las listas, la ampliación con dos dedos de las imágenes, los giros de las mismas tal y como si tuviéramos impresa la interfaz en un papel.
Pero, durante años, existe un método para comunicarse con los ordenadores que es incluso más vieja que la tecnología informática. Como todo gran descubrimiento basado en la lógica de la anticipación del futuro, lo hemos visto cientos de veces en la ciencia ficción casi desde mitad del siglo XX. Ahora, hoy, es quizás el momento en la historia de la humanidad que más cerca estemos de conseguirlo.
La cuarta interfaz
Incluso la Apple decadente de finales de los ochenta tenía claro cuando investigó el futuro cual era el siguiente paso. Se trata de conseguir un sistema por el cual los ordenadores nos entiendan, hablándoles en nuestro lenguaje natural. Y esta vez, lo de “hablarles” es algo literal. Para ello, aquella Apple de John Sculley prototipó en un vídeo ficticio como debería ser la interfaz perfecta. Lo llamaron Knowledge Navigator, y como véis en el vídeo de arriba, era prácticamente un tablet venido a más con una inteligencia artificial que reconocía las conversaciones naturales.
Es importante matizar ésto: no hablamos de reconocimiento de voz, sino de reconocimiento de una conversación natural como la que podríamos tener con un ser humano. Se trata de que el sistema debe ser lo suficientemente sofisticado como para saber encadenar el hilo de una conversación y abstraerse de lo básico como para saber qué comandos se destilan de ella.
Y ahí está lo importante, lo más bello y quizás lo más complicado de esta tecnología con la que soñamos desde hace décadas: la cuarta interfaz traslada a la parte de la máquina la parte más complicada de la comunicación con las computadores, que no es otra cosa que saber lo que tenemos que decirle y cómo tenemos que decírselo. En esta cuarta interfaz, nosotros hablamos de forma natural y es la máquina quien se encarga de esa tarea. Por primera vez en la historia, la complejidad de las metáforas y las interpretaciones se traslada a la parte electrónica. Un gran paso para el hombre.
Siri y OS X 10.9: Un comienzo

Independientemente de que estoy completamente seguro que todas las empresas están desarrollando algo así para sus sistemas operativos, creo que la alternativa que más ha sorprendido últimamente al mundo de la informática en cuanto a la traslación del lenguaje natural en comandos, ha sido la llegada de Siri. Todavía es un sistema primitivo y tiene muchas cosas que mejorar, pero la aproximación que ha supuesto en el terreno del que hablamos es innegable.
Las noticias de contener a Siri en OS X pueden ser el auténtico cambio que muchos esperan como el fin del interfaz de usuario de los sistemas operativos tradicionales. Al fin y al cabo, todas las empresas tienen ya su interpretación gráfica en sus sistemas operativos (tanto móviles y de escritorio) y estaréis de acuerdo conmigo en que, salvo por supuesto cambios estéticos o funcionalidades, lo que vemos hoy sigue siendo lo que se ideó cuando crearon los primeros interfaces gráficos.
Todavía estamos lejos de tener un HAL9000 (sin demencia, espero) o del Jarvis de Tony Stark, pero estoy convencido que cuando Siri llegue a nuestros Macs vendrá cargado de usos que nos sorprenderán, otros que acogeremos con escepticismo, pero sin duda, todos ellos servirán de punto de partida para todo lo que vendrá después. Que no es otra cosa que controlar y recibir información de nuestro ordenador de la forma más natural posible: hablándole como hablaríamos a otra persona, sin complicados comandos que conocer ni aprendizaje previo que hacer más que la intención de comunicarnos.
“Siri, formatea este texto, añade las imágenes de la carpeta de mi usuario y programa esta entrada para las 12:00 del martes. Abre iTunes, pon The Look de Metronomy y busca alguien en mi agenda con disponibilidad para comer a las 14:00”
Más información | Especial historia de Mac OS X
Ver 59 comentarios
59 comentarios
joanserra2404
¡Muy interesante el artículo! (Comentario dictado a SIRI)
db.betancour
Me voy a salir del tema solo para felicitar por el nivel del contenido. He venido leyendo desde hace algún tiempo la gran cantidad de artículos, y lejos, como profesional del diseño, este me ha parecido uno de los mas interesantes en vuestro blog.
Muchas gracias!
kaitche
Hasta hace unos meses Siri era el lider indiscutible en reconocimiento, velocidad y resultados. Pero, sinceramente, creo que Google Now supera a Siri en estos momentos. Lo cual me parece genial para que haya competencia y se mejoren este tipo de sistemas, que aun tienen un largo camino que recorrer.
87521
Me ha encantado el artículo y, especialmente, el vídeo. Sí, Siri anda algo por detrás de Google en reconocimiento de voz (la comparación de ambos programas usando el mismo teléfono es desastrosa para el asistente de la manzana) pero es alucinante como en los años 80 Apple ya tenía clarísimos conceptos tan futuristas entonces como el iPad (2010), Siri (2011) o la importancia de dispositivos todo en uno en la educación.
Es curioso también ver cómo pensaban ya en aplicaciones al límite de lo sencillo (arrastras los dos vídeos y se vuelven uno) o como el color morado del fondo del asistente está presente en el Siri actual (¿de qué color es la lucecita del micro?).
Parece que habían pensado en un tablet multiventana, algo presente en algunos Android pero todavía no en iOS. ¿Será una de las novedades del nuevo sistema operativo móvil?
Una pasada la capacidad de mirar al futuro de esta gente. Esperamos que las actuales cabezas pensantes de Apple no la pierdan.
Gracias, Pedro.
Alberto Romero Gil
Hola, acabo de llegar, alguien sabe donde vive Sarah Connor....
krisnova
No se puede abarcar mucho y apretar poco. Primero que me tome bien un dictado y luego vemos si comprende lo que dicto.
darien
Esto me parece el comienzo de un futuro muy lejano. Despues de unos meses con Siri ya ni siquiera la uso para poner la alarma. Entre que igual no me termina de entender porque me sale un gallo o no ... Termino antes haciéndolo a mano.
Además el hecho de que tengas que activarlo. Lo suyo sería que fuera omnisciente, que con que estés en la misma habitación ya pudieras decirle algo.
Oye Siri tal
Con la tecnología de ahora no lo veo por tema de batería igual.
Ójala llegue pronto todo esto.
melibeotwin
Esto suena a ciencia ficción.
Jose Sanabria
Todo llegara :)
xpacho4
Paciencia, dentro de poco tendremos a Jarvis... xD
dreyes
Personalmente pienso que es más importante la evolución de tecnología estilo Kinect, aunque el reconocimiento de voz tambien es importante.
tharostatos
No me imagino en una oficina cualquiera a todos los trabajadores con charlas con su ordenador... sería simplemente un caos.
danigoian
A lo mejor me sorprenden, y cuando esto exista de verdad, me convence la solución aparecida, pero por ahora prefiero jugar a videojuegos con el mando en vez de con todo mi cuerpo o los brazos. También prefiero pulsar botones(táctiles o físicos) que estar hablándole al ordenador, pienso que, o estas completamente solo, o se pierde intimidad (como comentabais más arriba con las oficinas). Aun me siento raro hablando por el manos libres cuando hay gente a mi alrededor.
ernestosantanaphoto
Me parece que le voy a dar un positivo a este artículo SÓLO por el hecho de no haber mencionado ni una sola vez a Minority Report.
abarritericola
decirte Pedro que tu edición de hoy tremenda bien quizás donde mas se este invirtiendo tanto en potencial humano como en dinero sea en lo que tu comentas de que el ordenador nos entienda cuando le mandamos algo pero no de una manera cualquiera , sino literalmente . en el porcentaje que se invierte pues yo no podria dar cifras como es obvio ,pero si que puedo decir por lo que conozco que se esta trabajando muy fuerte para llevarlo ha cabo
Saludos
churichuro
I LOVE SIRI !!!
esta tecnología esta muy verde...es cierto....pero en el mundo actual la "evolución" de los sistemas es muy dinamica, y se pueden ver cambios a una velocidad vertiginosa .
Siri y el reconocimiento elemental de comandos de voz en este momento funcionan. con menor o mayor exactitud, es cierto pero funcionan y están aquí... y eso, ya es un avance.
excelente articulo!
charlyebrown
La interfaz definitiva, o quizás y para no limitar, (aunque no soy capaz de imaginar un paso posterior), el siguiente paso para mi, sería que la máquina entendiese nuestro pensamiento. Yo pienso y la máquina me responde por medio de sus outputs, video, imagen, sonido, texto... Esa sería la forma más cómoda y gratificante de comunicación con un ordenador, desde mi punto de vista.
alex.castell1
Entonces, pronto le podré decir a mi ordenador: Mac, te necesito!
Y acto seguido el mac vendrá hacia mí echando chispas, y abrirá la puerta y el techo para que pueda entrar a toda prisa…
O quizás debiera decir KITT. En resumidas cuentas, será como en la fantástica serie de los '80 pero con pantallas táctiles.
Usuario desactivado
Coincido con Pedro, la evolución natural de la interacción con la maquina es la comunicación verbal y ya se han dado los primeros pasos mejorando la tecnología del habla. A partir de ahí hay un mundo de mejoras y perfeccionamiento, en un punto muy inicial se encuentra Siri o Google Now (lo mas conocidos) donde la maquina interpreta pequeños comandos, cuando se perfeccione será capaz de interpretar todos los comandos posibles de interacción, esto ya será un grandísimo avance y se lo podría poner la etiqueta de "cuarta interface".
El siguiente paso sería la inteligencia artificial computacional, eso ya es otra cosa, donde la máquina sería capaz de interactuar con un ser humano como si de un ser humano se tratara, con capacidad para el aprendizaje (dejemos a un lado las emociones). Es utópico a día de hoy pero más que probable en un futuro, solo hay que ver los avances científicos en robótica, algoritmos genéticos o redes neurona artificiales.
martin_garcia
Caray! que me ha puesto a pensar este artículo, si tiene mucho que darnos en los próximos años. Es probable que sea el paso siguiente y el momento indicado para darlo.
Mis felicitaciones a Pedro, se nota como este artículo (y los últimos por mencionar) se despegan del estándar, enhorabuena amigo!
Saludos!
dokidokisuki
Desde que skynet no se active …no veo problema
David Ruiz
La verdad esta MUY interesante el artículo. Me gustó mucho. No se si alguien ha visto la película de Piratas de Silicon Valley, está muy buena y te despeja un poco todas las dudas de lo difícil que era en aquellos tiempos que alguien usara una computadora. Era algo impensable creer que cualquier persona podría usarlas y ahora vemos hasta niños pequeñitos usándolas. La mejoría de los dispositivos de entrada, depende mucho de la evolución del software, es por eso que Apple ha ganado tanto en este terreno, al ser dueño tanto del Software, como del Hardware que fabrica. Los tiempos van cambiando y cada vez tenemos más necesidades, si antes para enviar un correo electrónico necesitabas sentarte en tu terminal y hacer todo el trabajo ahí, ahora solo necesitas sacar de tu bolsillo tu móvil y hacerlo. Hay mas cosas que quisiéramos hacer con el pero hasta el momento no es posible. Bueno, tengo un poco de trabajo, así que me tengo que retirar. Espero encontrar mas artículos como este y como muchos que veo en este blog. Felicidades y saludos.
elnoel
Ya, y la "Quinta interfaz" es cuando te meten el puerto lightning en la nuca y ya tienes conexion directa con la diosa Siri del cyberespacio.
Como Apple siga al paso que va, no creo que lleguemos a ver la cuarta ni la quinta interfaz.
gonzalo.sancheztemes
Alguien podria explicarme que es un desarrollador, apps para desarrolladores...?? y si es interesante hacerme desarrolador
Alejandro Herrero
Estoy convencido que las órdenes por voz, o, mejor dicho, como bien explica el artículo, la correcta interpretación del lenguaje, será parte importante en nuestra comunicación futura con las máquinas. Aunque yo lo veo más funcional y útil en cuestiones "menores" (notense las comillas).
También puede ser que mi mente no sea capaz de imaginar un hipotético HAL9000 gestionando, por ejemplo, un transbordador espacial. Me imagino situaciones y momentos verdaderamente complejos de llevar a cabo y, con la mentalidad de hoy, y lo lejana (hipotéticamente) que está esa tecnología, me resulta dificil imaginar que el hombre sea capaz de dejar al azar del correcto funcionamiento del software de reconocmiento de lenguaje una tarea no solo compleja, sino crítica para la propia supervivencia de las personas.
Pero claro, lo miro desde la mentalidad "atrasada" de lo que conocemos y tenemos hoy, y pese a mi escepticismo a la hora de tener una certeza de que nosotros lo veamos, estoy convencido que tarde o temprano el HAL de Stanley Kubrick dejará de ser ciencia ficción para convertirse en realidad.
En un futuro mucho más cercano, que seguramente todos veamos, y no dentro de mucho, imagino hogares completamente domotizados y controlados por la voz. Ahora bien, creo que para que esos "hogares inteligentes" sean capaces de entendernos más allá de una serie de comandos preestablecidos, todavía queda mucho que evolucionar.
De todas formas, aunque subscribo todo lo que comenta el autor en su artículo, por el que le felicito, yo tengo una visión escéptica a corto plazo. Quizás sea infundado ese escepticismo, pero así lo veo.
El lenguaje hablado es algo único y exclusivo del ser humano, y , pese a ello, dos humanos que hablan el mismo idioma pueden comunicarse sin problemas utilizando expresiones, palabras, tonos y acentos completamente opuestos sin que ello suponga un handicap para que la correcta comunicación.
Un ratón, con unos pocos botones pulsado en unos lugares preestablecidos, el teclado, perfectamente codificado, o los gestos táctiles, están a años luz de lo que el lenguaje hablado es capaz de transmitir. Estas tres interfaces tienen algo en común, un reducido conjunto de instrucciones. En realidad hoy día estas interfaces no entienden nada, son completamente "bobas", simplemente responden a un vocabulario predefinido de forma predefinida. El salto para que una máquina sea capaz de algo más que responder a unas órdenes predefinidas es muy grande, complejo, y tiene un largo camino que recorrer, aunque subscribo en que soluciones como SIRI (que encuentro absurda en un teléfono), son unos más que interesantes primeros pasos. Me imagino al grupo de programadores que se están rompiendo las neuronas para que SIRI funcione algo mejor, y me apiado de ellos.
Interesante artículo ;)
angelbello1
Estamos muy lejos de eso........ primero que Siri entienda mi acento andaluz y luego hablamos.
falonsop
Me parece que has visto mucho Star Trek, Siri esta a años luz de entender minimamente el lenguaje humano de forma mas o menos correcta.