¿Por qué Autocorrección en iPhone sigue siendo tan horrible?
Todos hemos estado allí. Quieres escribir una oración simple como «¿Qué quieres comer hoy?» y parece «¿Qué quieres para el lanzamiento ordenado?» Los errores de autocorrección son tan comunes, y lo han sido durante tanto tiempo, que ya casi no los reconocemos a menos que sean involuntariamente graciosos.
¿Por qué es esto? Estamos llegando a los 15 años del iPhone, el dispositivo que fue pionero y popularizó la entrada de teclado solo táctil, y la autocorrección ha estado con nosotros de una forma u otra desde la década de 1990, cuando Word corrigió automáticamente el bloqueo accidental de mayúsculas o los errores ortográficos comunes. .
Después de décadas y miles de millones de dispositivos vendidos, sin mencionar el ascenso meteórico del aprendizaje automático y la inteligencia artificial, la autocorrección parece tan tonta como siempre. En cierto modo, también parece haber retrocedido, al hacer sustituciones sin sentido cuando un simple intercambio de letras produciría la palabra correcta. ¿Es realmente difícil la corrección automática? ¿O ni siquiera está tratando de funcionar de la manera que necesita? ¿Ya no es una prioridad?
IDG
La marcha de los nueve
Supe por primera vez del concepto llamado «marcha de los nueve» hace unos 20 años (aunque no sé de dónde se originó ese término). Estaba investigando y escribiendo sobre el último software de dictado de voz. Era el momento en que los usuarios de computadoras tendrían que comprar software como Dragon Dictate para hablar con sus máquinas.
El software de dictado con una precisión del 90% puede sonar bien, pero es inútil. Si tiene que corregir una palabra de cada 10, no ahorrará mucho tiempo. Incluso el 99 por ciento de precisión no es lo suficientemente bueno, en realidad. 99.9 por ciento es donde las cosas se ponen interesantes… si puede dictar 1,000 palabras a su computadora y solo necesita arreglar una, tiene un gran ahorro de tiempo al alcance de su mano (sin mencionar una increíble herramienta de accesibilidad).
Pero el 99 por ciento de precisión no es solo un 9 por ciento mejor que el 90 por ciento. De hecho, es mejor que el 1000 por ciento, una mejora de 10 veces, porque la tasa de error va de un error en 10 palabras a un error en 100 palabras.
Por cada «nueve» acumulado en la precisión de cualquier proceso automatizado, lo estás haciendo al parecer solo un poco mejor para los humanos, pero tienes que hacer una mejora diez veces mayor para llegar allí. En otras palabras, el 99,9999 por ciento no tocar mucho mejor que el 99,999 por ciento para un usuario, pero aún 10 veces más difícil para la computadora.
¿Está el autocorrector atascado en una rutina de «marcha de nueve»? ¿Está secretamente dando grandes saltos que nos parecen desvanecerse pequeños? No lo creo. La tasa de error de la corrección automática sigue siendo bastante alta, mientras que la potencia informática a su disposición (especialmente para tareas de aprendizaje automático) es cientos de veces mayor que hace diez años. Creo que es hora de buscar en otro lado.
Procesamiento del lenguaje natural que no es
Ya sea que esté hablando de asistentes de voz como Siri o Alexa, dictado de voz o autocorrección, a las empresas de tecnología les gusta decir que están usando «procesamiento de lenguaje natural».
Pero verdadero el procesamiento del lenguaje natural permanece fuera del alcance de cualquiera de estos sistemas de consumo. Lo que nos queda es un análisis estadístico de partes del discurso impulsado por el aprendizaje automático que carece casi por completo de significado semántico.
Considera lo siguiente: “Ve a la tienda de la esquina y tráeme una barra de mantequilla. Asegúrate de que no esté salado.
Si le preguntara a alguien a qué se refiere «eso», cualquiera sabría de inmediato que me refiero a la mantequilla, aunque, gramaticalmente, «eso» bien podría referirse a la tienda. Pero, ¿quién ha oído hablar alguna vez de una tienda sin sal? Si cambiamos esa segunda oración a «Verificar que esté abierto hoy», sabemos que «eso» se refiere a la tienda.
Esto es algo bastante mundano para los humanos, pero las computadoras son terrible de hecho, porque los sistemas lingüísticos se construyen sin entender qué significan realmente las palabras, qué tipo de palabras son y cómo se escriben.
Todos estos sistemas basados en el lenguaje (asistentes de voz, dictado, autocorrección) dependen de una gran cantidad de contratistas mal pagados para tomar muestras de voz u oraciones de texto y etiquetarlas meticulosamente: sustantivo, verbo, adjetivo, adverbio, lenguaje obsceno, nombre propio, etc El sistema de lenguaje de la computadora puede saber que si escribió «prueba esta sopa que acabo de hacer», la palabra mal escrita debería ser «sopa», porque debería ser un sustantivo y tiene la mayoría de las mismas letras que la palabra que no escribió accidente mío . pero el no sabe que sopa en realidad lo es Ni ninguna de las otras palabras en la oración: sabor, hecho, sólo…
Creo que esta es la verdadera razón por la que la autocorrección sigue siendo tan mala. No importa qué tan sofisticado sea su aprendizaje automático o el tamaño de su conjunto de entrenamiento si no sabe lo que significan las palabras, incluso superficialmente.

IDG
Google predice automáticamente oraciones completas en Gmail, pero incluso eso es solo un análisis estático muy sofisticado. Utilice el aprendizaje automático para determinar qué frases siguen más comúnmente a las palabras que acaba de usar al responder a un correo electrónico con una distribución particular de palabras clave y frases. aun no sabe que es medio.
Para usar mi ejemplo original: la autocorrección sugirió «¿Qué desea para el lanzamiento ordenado» porque no saber es una frase sin sentido. Si mi iPhone supiera lo que realmente significan estas palabras, no solo su función gramatical, sería fácil que la autocorrección solo proporcionara sugerencias que son, ya sabes, un posible lenguaje humano. (Por supuesto, que también es una mezcolanza de gramática imposible solo muestra cuán mala sigue siendo la autocorrección).
La autocorrección ya no parece ser una prioridad
La cuestión es que la corrección automática no es la prioridad de una sola vez. ¿Cuándo fue la última vez que vio a Apple dar un gran paso adelante en la precisión de la corrección automática en el marketing de iOS?
En los primeros días de los teléfonos inteligentes, cuando todos nos acostumbrábamos a escribir con pulgares grandes en pantallas táctiles diminutas, la capacidad de corregir nuestros errores con dedos gordos era un gran punto de venta. Era una característica clave que denotaba el software elegante y fácil de usar de un dispositivo.
La autocorrección, a pesar de todos sus defectos, es vieja y aburrida ahora. Hemos vivido con sus debilidades durante tanto tiempo que el mercado realmente no lo considera un sello distintivo de usabilidad. Pasamos a otros temas, como funciones de cámara y notificaciones sofisticadas. Estoy seguro de que hay ingenieros inteligentes y trabajadores en Apple y Google que se dedican a la autocorrección, pero probablemente obtenga una fracción de los recursos proporcionados al equipo responsable de tomar fotos un poco mejores, porque fotos un poco mejores pueden vender teléfonos y marginalmente. mejor corrección automático no puede.
Se necesitará un gran salto en el modelado y el poder de la IA antes de que nuestros teléfonos tengan una idea del significado semántico de las palabras. Pero ciertamente, incluso ahora, se podría hacer mucho más para filtrar frases incoherentes y sugerencias de autocorrección basura que crean tonterías incoherentes.
Solo me gustaría ver alguna mejora. Cualquier cosa para sacar el autocorrector de la rutina en la que estaba en orden.
He estado escribiendo sobre tecnología profesionalmente durante toda mi vida profesional como adulto, más de 20 años. Me gusta entender cómo funciona la tecnología complicada y explicarla de una manera que cualquiera pueda entender.