
Nota del editor: Cuatro meses después del lanzamiento de su chatbot ChatGPT, OpenAI presentó el martes su última tecnología de inteligencia artificial, GPT-4. Oren Etzioni, ex director ejecutivo del Instituto Allen para la IA, un director técnico en la Incubadora AI2, y profesor emérito de la Universidad de Washington, ofrece sus pensamientos.
GPT-4 ha llegado.
Es sustancialmente más completo y poderoso que ChatGPT, que ya ha conquistado al mundo. GPT-4 puede diagnosticar pacientes, escribir software, jugar al ajedrez, escribir artículos y mucho más.
El mes pasado, el director ejecutivo de OpenAI, Sam Altman tuiteó: “una nueva versión de la ley de Moore que podría comenzar pronto: la cantidad de inteligencia en el universo se duplica cada 18 meses”.
En los próximos años, veremos cómo GPT-4 y sus similares impactan nuestra economía de la información, los trabajos, la educación, la política e incluso nuestra comprensión de lo que significa ser inteligente y creativo. Referirse a un modelo GPT como un JPEG borroso de Internet subestima tanto sus capacidades actuales como su potencial futuro.
Sin embargo, es importante señalar que la tecnología tiene algunas limitaciones inherentes a su “ADN familiar”.
GPT-4 tiene algunos problemas de superficie.
- Está limitado por un extenso conjunto de «barandillas» hechas por humanos que buscan evitar que sea ofensivo o que se salga de la pared.
- No actualiza su conocimiento en tiempo real.
- Su dominio de idiomas distintos del inglés es limitado.
- No analiza audio ni video.
- Todavía comete errores aritméticos que una calculadora evitaría.
Sin embargo, ninguno de estos problemas es inherente al enfoque. A aquellos que se obsesionan con ellos, les diría: “no me muerdan el dedo, miren hacia dónde les estoy señalando”. Todos estos problemas se superarán en GPT-5 o en una versión posterior de OpenAI o de un competidor.
Más desafiante es el hecho de que GPT-4 todavía no es confiable. Al igual que ChatGPT, «alucina», inventando hechos e incluso respaldando esos hechos con fuentes inventadas. Peor aún, lo hace con la alegre confianza de un mentiroso habitual.
Al igual que ChatGPT, puede ser inconsistente en sus respuestas cuando se le pregunta con varias preguntas sobre el mismo asunto. Eso sucede porque no tiene un conjunto de creencias y valores subyacentes; en cambio, responde a los aportes humanos en función de una combinación oscura de sus datos de entrenamiento y su objetivo interno formulado matemáticamente.
Por estas razones, también exhibe sesgos generalizados: sería imprudente confiar en sus respuestas sin una verificación cuidadosa. Los programadores humanos que usan una herramienta de estilo GPT, llamada GitHub CoPilot, para producir fragmentos de código de software, revisan y prueban cuidadosamente el software antes de incorporarlo a sus programas escritos a mano. Sin embargo, cada generación de la tecnología comete menos errores y podemos esperar que esta tendencia continúe.
Debido a este rápido progreso y éxito sin precedentes, es importante destacar que GPT-4 y toda la gama de tecnologías de IA similares (a veces denominadas «modelos básicos» o «IA generativa») tienen limitaciones fundamentales que no se superarán en el futuro. futuro previsible.
A diferencia de los humanos, los modelos GPT no tienen cuerpo. Los modelos se basan en información de segunda mano en su entrada, que puede estar distorsionada o incompleta. A diferencia de los humanos, los modelos GPT pueden simular empatía pero no sentirla. Si bien la empatía simulada tiene sus usos (piense en un adolescente que necesita un hombro para llorar a las 2 am en la zona rural de Kansas), no es real.
Si bien los modelos GPT pueden parecer infinitamente creativos y sorprendentes en sus respuestas, no pueden diseñar artefactos complejos. Quizás la forma más fácil de ver esto es plantear la pregunta: ¿Qué componentes de GPT-4 fueron diseñados por un modelo generativo? El estado del arte en IA nos enseña que GPT-4 se construyó escalando y jugando con modelos y métodos diseñados por humanos que incluyen BERT de Google y ELMo de AI2. Steven Wolfram proporcionó una descripción general accesible de la tecnología aquí.
Independientemente de los detalles, está claro que la tecnología está a años luz de poder diseñarse a sí misma. Además, para diseñar un chatbot, debe comenzar formulando el objetivo, los datos de capacitación subyacentes, el enfoque técnico, los subobjetivos particulares y más. Estos son lugares donde se requiere experimentación e iteración.
También debe adquirir los recursos relevantes, contratar a las personas adecuadas y más. Por supuesto, todo esto fue hecho por humanos talentosos en OpenAI. Como argumenté en MIT Technology Review, formular y ejecutar con éxito tales esfuerzos sigue siendo una capacidad claramente humana.
Lo que es más importante, los modelos GPT son herramientas que funcionan a petición nuestra. Si bien son notablemente poderosos, no son autónomos. Responden a nuestras órdenes.
Considere la analogía con los autos sin conductor. En los próximos años, los autos sin conductor serán más versátiles y cada vez más seguros, pero los autos no determinarán el destino al que nos dirigimos, esa decisión pertenece al ser humano. Del mismo modo, depende de nosotros decidir cómo usar los modelos GPT, para edificación o para desinformación.
El gran Pablo Picasso dijo célebremente: “Las computadoras son inútiles. Solo te dan respuestas”.
Si bien los modelos GPT están lejos de ser inútiles, seguimos siendo nosotros los que formulamos las preguntas fundamentales y evaluamos las respuestas. Eso no cambiará en el corto plazo.

Deja una respuesta