Thumbnail for Deja de Crear Agentes de IA, Haz ESTO en su Lugar by Juan Gabriel Gomila

Deja de Crear Agentes de IA, Haz ESTO en su Lugar

Juan Gabriel Gomila

17m 37s2,736 words~14 min read
AI audio transcription
Transcript source

AI audio transcription

This transcript was generated from the video's audio because no usable YouTube caption track was available. The transcript below is server-rendered so it can be read, searched, cited, and shared without opening the original YouTube player.

Timestamped outline
Pull quotes
[0:00]Todo el mundo está obsesionado con crear agentes de inteligencia artificial en este momento.
[0:00]Cada startup, cada desarrollador, los hilos de Twitter, todo el mundo habla de agentes, agentes, agentes y agentes.
[0:00]Es la palabra de moda, y eso que para mis padres, lo más parecido a un agente es Bond.
[0:00]Nos están avisando de que el futuro no es crear agentes, es algo completamente distinto que ellos han denominado skills o habilidades.
Use this transcript
Related transcript hubs

[0:00]Todo el mundo está obsesionado con crear agentes de inteligencia artificial en este momento. Cada startup, cada desarrollador, los hilos de Twitter, todo el mundo habla de agentes, agentes, agentes y agentes. Es la palabra de moda, y eso que para mis padres, lo más parecido a un agente es Bond. James Bond. Y no, no, no lo digo yo. Lo dicen los creadores de una de las IAs más potentes del mundo. Nos están avisando de que el futuro no es crear agentes, es algo completamente distinto que ellos han denominado skills o habilidades. Soy Juan Gabriel Gomila y he enseñado programación e inteligencia artificial a más de 600.000 personas en todo el mundo. Y en este vídeo te voy a explicar exactamente qué son estas skills y por qué cambian las reglas del juego por completo. Y de hecho, cómo podrías utilizarlas para automatizar tu trabajo real sin necesidad de aprender a programar. Y ojo, ojo, no solo te voy a dar la teoría, no, no, al final del vídeo te mostraré un proyecto real funcionando que encima podría cobrar por ello. Empezamos. A ver, pongamos las cartas sobre la mesa. Los agentes de inteligencia artificial actuales son increíbles, son la leche. Pueden escribir código, pueden navegar por internet, pueden razonar e incluso componer música. Su nivel de inteligencia es brutal. Nadie discute eso y yo no voy a ser quien diga lo contrario. Pero aquí está el problema. Inteligencia no es lo mismo que experiencia. Piénsalo así, imagina que necesites a alguien que te haga la declaración de la renta. Los impuestos de tu empresa, los modelos 303 y los que sean. Tienes dos opciones. Opción número uno. Contratas a un genio superdotado con un cociente intelectual altísimo que pueda deducir cualquier cosa desde cero, pero que nunca en su vida ha rellenado un formulario y no va a hacer. Pero también podrías contratar a un contable experto. Quizás no sea superdotado ni la persona más lista del mundo, pero es que ha hecho miles de declaraciones de la renta anteriormente, se conoce cada ley, cada deducción, cada truco, cada paso. A quién contratarías? Al contable experto todos los días de la semana. No quieres a un genio adivinando las cosas desde cero. Quieres a alguien que ya sabe lo que hace. Pues esto es exactamente lo que hoy pasa con los agentes de inteligencia artificial. Son genios generalistas.

[2:37]No conocen los flujos de trabajo de tu empresa, no conocen tu industria, no conocen las leyes y no recuerdan lo que funcionó ayer y falla hoy. Y qué hace la gente para solucionarlo? Construyen un agente distinto para cada cosa que quieren hacer. Un agente para legal, un agente para marketing, un agente de contabilidad. Cada uno con su propia infraestructura compleja, sus pros y sobre todo sus contras. Es agotador y de hecho esto ni siquiera es escalable. Lo que Anthropic se ha dado cuenta es que el motor o el agente base ya es universal. No necesitas programar a un agente nuevo para cada cosa que quieres hacer. Lo único que necesitas es darle a ese agente universal experiencia de un dominio bajo demanda. Eso son precisamente las skills. Y qué es un skill exactamente? Pues es ridículamente sencillo y te vas a reír de mí. En su base es un archivo de texto, un archivo markdown. Una receta de cocina, es un documento de instrucciones que le enseña a tu inteligencia artificial, como Claude Code o Gemini, cómo hacer algo específico. Piensa que es como el manual de instrucciones que le darías al empleado el primer día de trabajo. Cuando escribas un post para nuestro blog, usa este tono, sigue esta estructura y añade siempre estas secciones. Cuando utilices un sistema de colores, este es el color de nuestra empresa y esta es la tipografía que utilizamos en comunicación. Lo guardas en una carpeta y listo. Acabas de crear tu primera skill en menos de 5 minutos. Claude ya sabe escribir como tú quieres. Además, te puedes imaginar que muchas veces ni siquiera la vas a tener que escribir tú, porque le puedes pedir a un LLM que te cree habilidades en base a tu conocimiento y a tu experiencia. La magia de todo esto es que no necesitas ser programador para nada. Si eres de recursos humanos, puedes crear una skill con tus criterios de contratación. Si eres un abogado, uno que revise contratos. Por cierto, si realmente quieres aprender a dominar estas herramientas, monetizar la inteligencia artificial y no quedarte atrás en este siglo XXI, en Frogames Formación tenemos las rutas de aprendizaje exactas que necesitas. Te voy a dejar el enlace en la descripción para unirte a nuestra comunidad y elegir entre las más de 17 rutas que ya tienes disponibles, cada una con su temática. Pero espérate, volvamos a las skills, porque es que hay una pieza clave en el puzle que te va a volar la cabeza. Anthropic llama a esto descubrimiento progresivo. Suena muy técnico, pero es simple. Claude no carga todos los cientos de skills en su memoria a la vez, lo cual ya te digo que colapsaría el sistema como pasa con los prompts gigantescos cuando no caben en la ventana de contexto. Claude solo lee el lomo del libro. Y es que cuando quieres leer un libro, simplemente vas ojeas el lomo hasta encontrar el que te interesa para luego abrirlo y leer. Pues Claude es lo suficientemente inteligente. Solo cuando encuentra el libro adecuado, solo cuando se da cuenta de que necesita una habilidad específica para la tarea que se le ha pedido y que viene en ese libro, saca el libro de la estantería y entonces lo lee a fondo.

[6:07]Eso significa que memoria puede tener cientos, miles de skills, miles de tomos, de libros y simplemente la IA elegirá el correcto automáticamente para abrirlo cuando realmente le haga falta. Y aquí viene el combo definitivo. Esto significa que, a pesar de que simplemente sean ficheros de texto en Markdown, entre bambalinas, se conectará con los servidores MCP que necesiten. Te recuerdo que un servidor MCP se refiere a Model Context Protocol, que si te interesa, ponlo en los comentarios y déjate un like para hacerte un vídeo específico donde lo hablemos más en detalle porque es otra de estas magias oscuras que en el caso de la IA generativa ha cambiado las reglas del juego. Los MCPs, dicho rápido, son las manos de la inteligencia artificial. Le permite conectarse a la base de datos, a las APIs, a herramientas externas, a scrapear una web o a generar un PDF. Y los skills son la experiencia, es decir, le dicen al LLM qué es lo que tiene que hacer exactamente con esas herramientas. Fíjate, acabas de montar un sistema completo donde el LLM en el centro es capaz de leer los manuales de instrucciones para aprender a realizar tareas y a conectarse con las herramientas necesarias para poder desempeñar esas habilidades. No te recuerda un poco a una película de final de los años 90 donde aprendían conectando un cable detrás de la cabeza y aprendían a pilotar helicópteros. Te prometía un ejemplo real, así que mira esto detenidamente. Estoy en mi editor de código favorito, que por el momento es Antigravity. Y tengo aquí una skill que básicamente no la he construido yo, sino que le he pedido a un LLM que me creara una skill precisamente para poder llevar a cabo una función. Esta skill realiza un análisis GEO, no, no, es SEO, es GEO, Generative Engine Optimization, es cuando el SEO viene potenciado por los motores de búsqueda generativa de estas inteligencias artificiales que son la leche.

[8:38]Entonces, esto de aquí básicamente es la versión bonita, fancy, de un archivo MD, el archivo MD se ve así. Y como puedes observar, en este caso, pues básicamente describe el comportamiento de qué es lo que va a hacer esta habilidad cuando un LLM la llame. Entre otras, y solo por echarle un vistazo, fíjate que aquí escribo el flujo de trabajo de la operación, que es una auditoría, cómo tiene que utilizar ciertas herramientas online para recuperar la página de inicio, cómo debe extraer información como el título, la metadescripción, sección de blog, recursos, el esquema y demás.

[9:17]Cómo debe rastrear el Sitemap, cómo debe recopilar datos a nivel de página. Y aquí viene la parte divertida. El skill tiene una instrucción muy concreta y muy potente que le dice a Claude o cualquier LLM que quieras utilizar que lance, ni más ni menos que cinco subagentes simultáneos. Un subagente para analizar la visibilidad de la IA, otro para la optimización de plataformas, otra para la infraestructura, la calidad de contenido, el esquema y datos estructurados.

[9:48]Son cinco subagentes que a su vez evidentemente los tengo por aquí en la sección lateral. En definitiva, es una arquitectura brutal porque es como construir una casa. Tienes al contratista principal, luego tienes el subcontrata de electricista, también un subcontrata de fontanero, el que pone los aires acondicionados, el que pone las ventanas con su climit.

[10:13]En definitiva, cada subagente analiza una cosa distinta al mismo tiempo, todo en automático porque se lo he dictado con un simple archivo de texto. Y en este caso, como te digo, las propias IAs, los propios LLMs son capaces de crearte habilidades como esta. Aquí tengo en local en mi Antigravity una carpetita oculta punto agent con una subcarpeta skills. Muchas de las cuales son habilidades que le he ido pidiendo porque es que me hacían falta, por ejemplo, analizar el contenido de un PDF, generar unas slides a partir de teoría. Eh, preparar contenido online de un curso. O, por ejemplo, visualizar un vídeo de YouTube y sacarme las ideas fundamentales para yo poderlas explicar en castellano. Como ves, todos son skills, todos son habilidades que en un momento dado o las creas tú, escrito en un lenguaje bastante sencillo de entender, porque esto es castellano puro y duro, solamente que está escrito en Markdown para tener las asteriscos, para las negritas, los hashtags para los títulos, los guiones para los ítems y las tablas bien redactadas. Pero por lo demás, esto es un fichero que, sin tener ni una sola línea de código, porque solo tiene instrucciones de cómo debe funcionar, se convierte en una habilidad clave para que el LLM sepa cómo utilizar otros ficheros de programación o utilizar otras herramientas disponibles para poder multiplicar su potencia por 10.000. Para que lo veamos en acción, tengo aquí ya preparado el repositorio GitHub donde he subido estas habilidades. Si te gustaría que este repositorio lo hiciera público para todos vosotros, déjate un comentario y un like para que así sepa que os interesa tener esta librería de habilidades. Como ves, es el mismo repo que tengo en local, simplemente que lo he subido online y tengo aquí pues unas 15, 20 habilidades listas y disponibles para ser utilizadas. Y si lo quieres utilizar, una de las formas favoritas es a través de Claude, de Claude.ai. De hecho, esto es el resultado de cómo se ve la llamada. Pero lo primero que te estarás preguntando, y cómo le doy yo una herramienta a Claude. Pues fíjate que desde el botón más, hay una sección llamada skills y hay un menú para gestionar las habilidades, gestionar las skills. En este caso, fíjate que le he añadido una de las skills que has visto, el GEO-audit, y simplemente para añadirla he hecho clic en el botón más, crear habilidad y la he cargado.

[12:43]Como te digo, es que no tienes ni por qué cargarla ni por qué descargarla de un repositorio GitHub. La puedes crear con Claude, le puedes decir, Claude, quiero que me crees una habilidad que realice estas instrucciones, estos pasos, que de este reporte con estos colores y que me incluya este logo. Simplemente se lo tienes que describir para que esa habilidad la utilice un LLM como Claude o como OpenAI o como Gemini, que es el que utilizo yo en el caso de Antigravity. Como te digo, la cargas o la subes y por el dentro la habilidad se verá pues así, más o menos como la que has visto en mi caso y podría ser que necesite de unos scripts, unos agentes, unos assets y más cosas en general. Por eso, en el caso de que, por ejemplo, te descargues el repositorio que nosotros tenemos llamado GEO SEO Claude, pues le puedes dar todo el repositorio, que aquí ya estará la parte del agente, la parte de la documentación, los ejemplos y mucho más. Vale. En definitiva, aquí yo ya le he dado el GEO audit. Ves aquí el mismo fichero, exactamente el mismo que te he enseñado en local en mi Antigravity. Y dónde viene la magia? Pues la magia viene que lo único que tienes que hacer para ejecutar una de estas instrucciones es precisamente llamar a barra y el nombre que le hayas dado al fichero. En mi caso le llamé barra, y ves que aquí aparece GEO audit. Simplemente, no tienes que hacer nada más. Y si en este caso le colocas barra GEO audit y el nombre de la página web que quieres analizar, en mi caso le he puesto Frogames Formación, puedes verlo aquí en la parte superior de la zona de chat. Empieza a realizarlo. Lo he lanzado antes del vídeo para que no estuviera esperando, ya que ha tardado bastante. Me ha dicho que me tengo que esforzar un poquito más porque aunque tengo una marca muy sólida, la infraestructura GEO para motores de búsqueda es un desastre. Entonces, me ha dicho aquí cosas críticas que tengo que mejorar, cosas que hacemos bien o cosas que están moderadas y me ha dicho que para esta semana, pues debería intentar mejorar estos cinco aspectos que ves aquí. De acuerdo, entonces, luego está la auditoría completa, y la auditoría completa, pues la puedo descargar porque incluso genera o un PDF o en este caso ha sido un documento Markdown. Entonces, puedes observar que aquí no nos hemos callado absolutamente nada y básicamente el informe final sería este que verías por aquí. Vale, entonces, esto que ves aquí, voy a darle a open preview para que lo veáis mejor. Esto sería la auditoría global la que ha generado el LLM. Lo otro que has visto es simplemente el dashboard, es la parte bonita, es el resumen, pero aquí, pues básicamente, me está diciendo instrucciones, problemas de alta prioridad, cómo resolverlos, de baja prioridad, agrupados por categorías, siguientes pasos y mucho más. Os repito que yo no tengo absolutamente ni idea, repito, ni idea de SEO, ni idea de este tipo de operaciones, porque el GEO es algo bastante nuevo. Y muchos de nosotros simplemente tenemos una página web y la hemos tenido que adaptar en base a directrices o conocimientos o vídeos que nos hemos tenido que chupar también de YouTube. Pero aquí puedes ver que desde el principio hasta el final, mi LLM ha creado una habilidad, la ha implementado y la ha usado para rastrear y hacerme sugerencias de cómo mejorar la web de Frogames Formación. Y fíjate que es una habilidad. Ahora puedo volver a poner barra, nombre de la habilidad y utilizarla para generar una empresa que realice auditoría SEO y que pueda vender estos informes por 15, 20, 100 dólares y tener mi primer negocio online de auditoría SEO, repito, sin que yo sea experto en SEO. El futuro no está en pelearse montando cientos de agentes frágiles y complejos. El futuro es tener una IA bien potente y darle una biblioteca inmensa de skills como Neo o Trinity en The Matrix. Es rápido, es escalable y, además, cualquiera puede hacerlo. Si te ha estallado la cabeza con todo esto y quieres que te haga un tutorial paso a paso de cómo crear tu primera skill, dímelo en los comentarios y lo tendremos en cuenta para un vídeo en el futuro. No olvides suscribirte al canal, dejarte tu like para apoyar este contenido y recuerda pasarte por Frogames Formación si quieres en serio seguir con tu carrera tecnológica. Un abrazo y te dejo un vídeo por aquí para que te entretengas un ratito más con cómo funcionan los agentes de inteligencia artificial. Nos vemos en el próximo vídeo.

Need another transcript?

Paste any YouTube URL to get a clean transcript in seconds.

Get a Transcript