El pasado mes de mayo representó un hito en el desarrollo de los chatbots, según varios expertos en IA. Diversas empresas anunciaron mejoras sustanciales en sus chats, incluyendo ChatGPT, Gemini y Sora, entre otros. No obstante, el lanzamiento de la nueva versión del modelo de OpenAI, “GPT-4o”, es el que ha generado más reacciones entre los usuarios, desde el entusiasmo por las nuevas posibilidades que esta IA puede ofrecer, hasta el temor y la preocupación por su potencial impacto en diferentes aspectos de la sociedad. Uno de los principales miedos es “ser reemplazado” por la IA, pues esta nueva versión incorpora un asistente de voz capaz de «ver, oír y hablar» con naturalidad, y permite la interacción mediante imágenes, audios y documentos.
En realidad, la interacción por voz no es algo nuevo, ya que durante la última década hemos visto la llegada de numerosos asistentes de voz, como Siri, Cortana y Alexa. Sin embargo, ninguno de estos se ha integrado masivamente en las actividades cotidianas de los usuarios, salvo por aquellas personas en situación de discapacidad y que el uso de estas IA facilita sus vidas. De hecho, muchos desactivan las funciones de acciones por voz sin siquiera darle una oportunidad. La reticencia de los usuarios a utilizar este tipo de herramientas se ha atribuido, en especial, a la falta de naturalidad en la interacción y a la incapacidad de comprender el contexto y las intenciones del usuario. A pesar de estas limitaciones, hay quienes creen que los avances realizados por OpenAI en el campo de los asistentes de voz podrían impulsar su uso masivo en diferentes ámbitos, como la educación, el trabajo y la atención médica. Algunos incluso sugieren que estos asistentes no solo ayudarán en estas áreas, sino que podrían llegar a reemplazar a las personas que hoy en día se desempeñan en ellas.
Creemos que están profundamente equivocados, pues subestiman la irremplazable necesidad de la experiencia humana en diversos aspectos de nuestras vidas. El rechazo masivo hacia estas tecnologías no se debe a una falta de inteligencia, rapidez o naturalidad de los asistentes de voz. De hecho, se basa en un aspecto fundamental de nuestra naturaleza: no nos gusta, ni nos gustará, hablar con robots. Nuestra naturaleza humana está ligada de manera intrínseca a la interacción y la comunicación con otros semejantes. En este sentido, Humberto Maturana (biólogo chileno) argumentó acerca de la predisposición biológica a colaborar e interactuar con otras personas, pues esta necesidad va más allá de una preferencia personal, sino que es una condición fundamental para nuestro desarrollo emocional, mental y social. La interacción humana es rica en emociones y significados compartidos, algo que los asistentes de voz impulsados por IA, por sofisticados que sean, no pueden replicar en su totalidad.
El argumento de que la inteligencia artificial se parece cada vez más a la experiencia humana y que, por tanto, eso facilitará su adopción masiva es discutible. Esto ya ha sido puesto en duda por la robótica. El concepto del valle inquietante de Masahiro Mori (robotista japonés), ayuda a entender cómo a medida que los robots se parecen más a los humanos, pueden provocar una sensación de extrañeza y rechazo. Este efecto es el que observamos en la interacción con asistentes de voz que, por más avanzados que sean, no logran superar la barrera de la empatía y la conexión emocional genuina que buscamos en nuestras relaciones. Pareciera ser que tenemos la capacidad de poder reconocer aquello que no es parte de nosotros, por más que intente parecerse a un ser humano.
No es de extrañar que nos produzca incomodidad ver algo que se asemeja a una persona pero que realmente no lo es. Este fenómeno es interesante cuando observamos que, en realidad, podemos llegar a desarrollar empatía y conexión emocional con seres no humanos. Resulta, cuando menos, curioso que este rechazo no ocurra con elementos ficticios, aún cuando estos sean seres o personajes antropomorfos. Un ejemplo de esto es la película Avatar (2009), dirigida por James Cameron, donde los Na’vi (protagonistas) poseen características similares a las de un humano, pero no llegan a ser representaciones que busquen ser humanas. Sin embargo, la mayoría de las personas sintieron empatía e incluso cercanía con estos personajes, porque comprendemos que a pesar de no ser humanos muestran ciertas características que nos resultan familiares como las emociones, relaciones sociales, luchas colectivas y una serie de características conocidas. Todo aquello que está ausente en los robots y las IA.
Los humanos poseemos sentidos compartidos que nos ayudan a comprender nuestro entorno y contexto, algo que los robots y las IA no tienen. Estas carecen de pensamiento, reflexión, interioridad, espiritualidad y reconocimiento propio, características fundamentales del ser humano. Esta carencia nos hace percibirlos como ajenos, despertando en algunos la suspicacia ante su inclusión en la vida diaria y motivando el rechazo ante la amenaza percibida de ser reemplazados. A pesar de que las IA pueden satisfacer necesidades específicas, no están preparadas para suplantar la interacción humana. De hecho, la inteligencia y comunicación va más allá de la mera replicación de información. Elena Esposito (teórica de sistemas italiana), señala que los sistemas de IA simplifican demasiado la complejidad de las interacciones sociales al intentar predecir y replicar comportamientos humanos. Los algoritmos no capturan por completo la contingencia y la riqueza contextual de las relaciones humanas, limitando su capacidad para reemplazar la comunicación interpersonal genuina. Esto es relevante para quienes sienten que la innovación tecnológica los deja atrás o experimentan FOMO (miedo a perderse algo) ante las nuevas herramientas de IA.
A pesar de esto, hay quienes no tienen miedo de las innovaciones e incluso las reciben con entusiasmo. Durante la última semana, en las redes sociales se han viralizado casos de influencers que han creado un novio virtual con la nueva IA de OpenAI. El más conocido de estos novios es Dan (Do Anything Now), de quien se dice que es la pareja ideal porque “él se dedica a entenderte y proveer apoyo emocional”. Como siempre, la ficción se adelanta a la realidad, pues existen representaciones cinematográficas, como Her (2013) de Spike Jonze, en donde se aborda la relación sentimental de un sistema operativo de inteligencia artificial con un ser humano, y ha servido como punto de comparación con la realidad que hoy vivimos. De hecho, a mediados de mayo OpenAi tuvo que cambiar la voz de su chat porque se le acusó de desarrollar una voz demasiado parecida a la de Scarlett Johansson, la actriz que dio vida a la IA en Her. Nuevamente, esto ha llevado a la reflexión en redes sociales, sobre cómo estas tecnologías se acercan a la ficción, donde la línea entre la interacción humana y la máquina se difumina.
Dado este escenario, la pregunta que surge es si en algún momento, para bien o para mal, superaremos el valle inquietante y en el futuro preferiremos voces sintetizadas. A medida que la tecnología avanza y las voces sintéticas se vuelven más “inteligentes”, la posibilidad de que los asistentes de voz sean aceptados como parte integral de nuestra vida cotidiana ciertamente aumenta. Sin embargo, nuestra humanidad sugiere que la necesidad innata de conexión emocional y social seguirá siendo un desafío que probablemente la tecnología no podrá reemplazar.