secciones

Mini Curso: ChatGPT Prompt Engineering for Developers

Logo DeepLearning.AI

Recientemente DeepLearning.ai junto a OpenAI ha puesto en marcha el curso ChatGPT Prompt Engineering for Developers. Es gratuito “for a limited time” según indica en su página.

Lo cierto es que debido a su extensión no se le puede llamar curso, ni siquiera mini-curso. Los vídeos que conforman el curso tienen una duración de apenas una hora, que se puede ir a un par de horas con el tiempo que le dediques a hacer pruebas. Por eso pienso que lo de gratis por tiempo limitado no se si finalmente será para siempre ya que el curso no parece tener la entidad suficiente para poder cobrar por él.

Yo era escéptico sobre este curso y finalmente me apunté a él con reticencia. Pero… Este artículo es para convencerte de que merece la pena seguirlo.

Mi escepticismo era no sólo por su longitud, si no porque el tema (Prompt Engineering) me suena un poco a palabro de moda. Hoy en día todo el mundo te quiere vender la burra: “Gana dinero con el Prompt Engineering”, “El Prompt Engineering es la profesión del futuro”, “Los profesionales del Promp Engineering ganan $300.000”, …

Francamente a mi esto me parece el nuevo aceite de serpiente, la nueva bobada con la que los cryptobros se entretienen ahora que su juguete monetario se ha roto. Al fin y al cabo, aunque lo digan en inglés, es simplemente saber preguntarle a la IA. Todos sabemos preguntar, y cualquiera que se dedique a la programación puede aprender el famoso “Prompt Engineering” en unas horas. No me creo que una empresa con verdaderos profesionales necesite contratar a un externo para hacerle preguntitas a la IA porque sus programadores no son capaces de dar unas instrucciones detalladas. Es a lo que nos dedicamos: ¡A dar instrucciones detalladas al ordenador!

Y aun así, debo decir que el curso me ha gustado y me ha parecido muy útil. No está orientado para nada a venderte la moto. Trata la interacción con un LLM (en este caso el modelo GPT-3) accediendo al mismo desde python, dando buenas ideas sobre cómo sacarle partido a la IA desde el punto de vista de una empresa que puede resolver algunas tareas complejas (especialmente las relacionadas con el lenguaje, pero no solo) de modo más sencillo apoyándose en un LLM que haciéndolo por métodos tradicionales.

  • El curso empieza explicándote cómo acceder desde python al API de OpenAI para usar el modelo GPT3. En este sentido es una buena introducción que te pone desde el minuto cero las herramientas de trabajo encima de la mesa. Además lo hace utilizando unos notebooks de Jupyter en un entorno hospedado por ellos, por lo que no tienes que preocuparte de montar tu propio servidor, entorno python, ni nada parecido.
  • Después da algunos consejos generales sobre cómo formular las cuestiones a la IA para obtener el mejor resultado, evitando errores comunes y aportando soluciones interesantes.
  • A continuación analiza y práctica 4 tipos de tareas en las que se puede usar un LLM (Resumir, Inferir, Transformar y Expandir) dando ejemplos de uso de cada tipo.
  • Finalmente se construye un chatbot poniendo en práctica lo aprendido en los puntos anteriores.

Para desarrollo me ha parecido especialmente interesante la parte de Inferir, con algunos ejemplos e ideas muy buenas para que el LLM te de la respuesta en un formato interpretable fácilmente desde python/java/etc.

Al mismo tiempo se ven claramente los límites para algunas tareas de estos sistemas, como los problemas con las “alucinaciones” que son difíciles de solventar (el sistema en ocasiones se inventa datos o hechos) o problemas de seguridad como el “prompt injection” (el hecho de que si como parte del “prompt” se incluye un texto obtenido del usuario, este puede tratar de secuestrar al LLM para que haga una tarea distinta a la que inicialmente se pretende).

Aun así, haciendo uso de prompts adecuados, pidiendo que devuelva datos en un formato parseable (por ejemplo json), se puede intentar reducir estos problemas o al menos minimizar su aparación.

En definitiva, creo que este curso te puede servir para aterrizar el tema de GPT. Todos hemos leído y utilizado esta IA como usuarios. Pero este curso creo que te puede abrir los ojos a cómo se pueden usar como programadores para ayudarte con muchas tareas, dándote una idea real de cuales son sus fortalezas y, si ves los vídeos con un espíritu crítico y haces pruebas para explorar sus límites, también sus debilidades y las tareas para las cuales no es la mejor tecnología hoy día.

Comentarios cerrados para este artículo

Anterior: Pequeñas lecciones de diseño Siguiente: Ejemplo y análisis de uso de GPT-3: Extraer fechas de texto libre