Al final de su presentación I/O el miércoles, Google sacó una sorpresa del tipo “una cosa más”. En un video cortoGoogle mostró un par de gafas de realidad aumentada que tienen un propósito: mostrar traducciones de idiomas audibles justo en frente de sus ojos. En el video, el gerente de producto de Google, Max Spear, llamó a la capacidad de este prototipo “subtítulos para el mundo”, y vemos a los miembros de la familia comunicándose por primera vez.
Ahora espera un segundo. Al igual que muchas personas, hemos usado Google Translate antes y, en gran medida, lo consideramos una herramienta muy impresionante que provoca muchas fallas vergonzosas. Si bien podemos confiar en que nos dará indicaciones para llegar al autobús, eso no es lo mismo que confiar en que interpretará y transmitirá correctamente las historias de la infancia de nuestros padres. ¿Y Google no ha dicho que finalmente está rompiendo la barrera del idioma antes?
En 2017, Google comercializó la traducción en tiempo real como una característica de sus Pixel Buds originales. Nuestro antiguo colega Sean O’Kane describió la experiencia como “una idea loable con una ejecución lamentable” e informó que algunas de las personas con las que lo probó dijeron que sonaba como si fuera un niño de cinco años. Eso no es exactamente lo que Google mostró en su video.
Además, no queremos pasar por alto el hecho de que Google promete que esta traducción se llevará a cabo dentro de un par de gafas AR. No es por tocar un punto sensible, pero la realidad de la realidad aumentada ni siquiera ha alcanzado a Google. video conceptual de hace una década. Ya sabes, el que actuó como predecesor del muy difamado y vergonzoso de llevar ¿Google vidrio?
Para ser justos, las gafas de traducción AR de Google parecen mucho más enfocadas de lo que Glass estaba tratando de lograr. Por lo que mostró Google, están destinados a hacer una cosa: mostrar texto traducido, no actuar como una experiencia informática ambiental que podría reemplazar un teléfono inteligente. Pero incluso entonces, hacer gafas AR no es fácil. Incluso una cantidad moderada de luz ambiental puede dificultar la visualización de texto en pantallas transparentes. muy dificil. Ya es bastante desafiante leer subtítulos en un televisor con algo de luz solar a través de una ventana; ahora imagina esa experiencia pero atada a tu cara (y con la presión adicional de entablar una conversación con alguien que no puedes entender por ti mismo).
Pero bueno, la tecnología avanza rápidamente: Google puede superar un obstáculo que ha ha bloqueado a sus competidores. Eso no cambiaría el hecho de que Google Translate no es una varita mágica para la conversación entre idiomas. Si alguna vez ha intentado tener una conversación real a través de una aplicación de traducción, entonces probablemente sepa que debe hablar despacio. Y metódicamente. Y claramente A menos que quiera arriesgarse a una traducción distorsionada. Un desliz de la lengua, y es posible que haya terminado.
La gente no conversa en el vacío o como lo hacen las máquinas. Al igual que cambiamos de código cuando hablamos con asistentes de voz como Alexa, Siri o el Asistente de Google, sabemos que tenemos que usar oraciones mucho más simples cuando nos ocupamos de la traducción automática. E incluso cuando hablamos correctamente, la traducción aún puede resultar incómoda y mal interpretada. algunos de nuestros Borde colegas que hablan coreano con fluidez señalaron que Cuenta regresiva de pre-roll propia de Google para E/S mostró una versión honorífica de “Bienvenido” en coreano que nadie usa en realidad.
Esa pifia levemente vergonzosa palidece en comparación con el hecho de que, según los tuits de Rami Ismail y sam ettingerGoogle mostró más de media docena de guiones al revés, rotos o incorrectos en una diapositiva durante su presentación de Translate. (policía androide notas que un empleado de Google ha reconocido el error y que se ha corregido en la versión de YouTube del discurso de apertura). Para ser claros, no es que esperemos la perfección, pero Google está tratando de decirnos que está cerca de descifrar la traducción en tiempo real, y ese tipo de errores hacen que parezca increíblemente improbable.
Felicidades a @Google por obtener la escritura árabe al revés y desconectada durante @sundarpichaiLa presentación de *Google Translate*, porque las pequeñas empresas emergentes independientes como Google no pueden permitirse contratar a nadie con conocimientos de escritura árabe a nivel de escuela primaria de 4 años. pic.twitter.com/pSEvHTFORv
— Rami Ismail (رامي) (@tha_rami) 11 de mayo de 2022
Google está tratando de resolver un inmensamente problema complicado Traducir palabras es fácil; entender la gramática es difícil pero posible. Pero el lenguaje y la comunicación son mucho más complejos que esas dos cosas. Como ejemplo relativamente simple, la madre de Antonio habla tres idiomas (italiano, español e inglés). A veces toma prestadas palabras de un idioma a otro a mitad de una oración, incluido su dialecto italiano regional (que es como un cuarto idioma). Ese tipo de cosas son relativamente fáciles de analizar para un ser humano, pero ¿podrían las gafas prototipo de Google lidiar con eso? No importa las partes más complicadas de la conversación como referencias poco claras, pensamientos incompletos o insinuaciones.
No es que el objetivo de Google no sea admirable. Absolutamente queremos vivir en un mundo donde todos puedan experimentar lo que hacen los participantes de la investigación en el video, mirando con asombro cuando ven las palabras de sus seres queridos aparecer ante ellos. Derribar las barreras del idioma y entendernos unos a otros de maneras que antes no podíamos es algo que el mundo necesita mucho más; es sólo que hay un largo camino por recorrer antes de llegar a ese futuro. La traducción automática está aquí y lo ha estado durante mucho tiempo. Pero a pesar de la plétora de idiomas que puede manejar, todavía no habla humanos.