TubeScript Get a Transcript

Thumbnail for Agentes IA en 18 minutos (lo que el 95% no entiende) by Benjamín Cordero

Agentes IA en 18 minutos (lo que el 95% no entiende)

Benjamín Cordero

18m 22s3,724 words~19 min read

AI audio transcription

Transcript source

AI audio transcription

This transcript was generated from the video's audio because no usable YouTube caption track was available. The transcript below is server-rendered so it can be read, searched, cited, and shared without opening the original YouTube player.

Timestamped outline

[0:00]Section 1

Open Claw has open sourced essentially the operating system of agentic computers.

[2:52]Section 2

Y no tuviste que iterar varias veces en el prompt entremedio, ya que vimos el resultado, vimos si es que se cumplió, se formó una especie...

[6:13]Section 3

Entonces, este va a ser un contexto que siempre va a estar presente y es super buena práctica tenerlo bajo las 200 líneas.

[9:34]Section 4

Es por eso que necesita herramientas. Y aquí es donde entran dos conceptos claves que son los MCP y los skills.

[12:16]Section 5

Primero, tenemos Claude Code. Claude Code es la herramienta de Anthropic para el desarrollo.

[15:08]Section 6

Claudio revisa mis mails, analiza mis datos de mi Whoop, que es la pulsera biométrica, escribe copy para mis campañas, me crea los anunci...

Pull quotes

[0:00]Open Claw has open sourced essentially the operating system of agentic computers.

[0:06]It is no different than how Windows made it possible for us to create personal computers.

[0:19]Ese es Jensen Huang, el CEO de la empresa más valiosa del planeta, Nvidia, comparando Open, una gente de IA no con una aplicación, no con una herramienta, sino con un sistema operativo, Windows.

[0:35]Esto es enorme y la mayoría de gente en Latinoamérica todavía no sabe cómo funciona un agente.

Use this transcript

Summarize a YouTube transcript Make study notes Find timestamped highlights Export to Markdown Download transcript files Browse related transcript hubs

Related transcript hubs

Transcript archive AI Transcribed hub English transcripts

Watch on YouTube

Share

[0:00]Open Claw has open sourced essentially the operating system of agentic computers.

[0:06]It is no different than how Windows made it possible for us to create personal computers. Now Open Claw has made it possible for us to create personal agents.

[0:19]The implication is incredible. Ese es Jensen Huang, el CEO de la empresa más valiosa del planeta, Nvidia, comparando Open, una gente de IA no con una aplicación, no con una herramienta, sino con un sistema operativo, Windows.

[0:35]Esto es enorme y la mayoría de gente en Latinoamérica todavía no sabe cómo funciona un agente. Es por eso que para el final de este video vas a aprender ¿Qué es un agente IA?

[0:43]¿Cómo funciona por dentro? ¿Cuáles son los cuatro elementos que lo componen? ¿Dónde se arman? y los tres pasos para conseguir y armar el tuyo.

[0:52]Todo esto va a ser explicado de una manera visual y directamente al grano, pero antes vamos al problema de fondo. Y la verdad es que la mayoría de la gente sigue usando la inteligencia artificial como un chat.

[1:00]Escribes una pregunta, te da una respuesta y luego tú haces el trabajo, pregunta, respuesta, pregunta, respuesta como un partido de ping pong.

[1:08]Pero existe otro modelo, un modelo donde la IA hace el trabajo por ti. Tú le das un objetivo, ella planifica, ejecuta y luego te entrega un resultado. Y esto sin que estés ahí supervisando cada uno de los pasos.

[1:19]Eso es un agente y hoy te voy a explicar exactamente cómo funcionan. De esta manera, te puedes armar un modelo mental y puedes empezar a armarlos tuyos.

[1:26]Parte 1 ¿Qué es un agente?

[1:31]Vamos a lo básico. Cuando usas Chat GPT o Claude o Gemini, la dinámica es simple: tú le haces una pregunta, te la responde, lo analizas, decides qué hacer y vuelves a preguntar.

[1:40]Eso es un chatbot. Un agente es diferente, un agente recibe un objetivo y entra en lo que se conoce como un agent loop o el ciclo del agente y ese ciclo es el corazón de todo.

[1:50]Funciona así, mira. Primero observa, revisa qué información tiene disponible, revisa qué archivos hay, revisa qué herramientas puede usar y después se pone a pensar. Analiza la situación y decide el próximo paso y luego actúa y ejecuta ese paso.

[2:04]Pero lo importante es que no se detiene después de un paso, sino que vuelve al principio, observa lo que acaba de hacer, piensa qué es lo que sigue y luego actúa de nuevo, y así sucesivamente hasta que el objetivo se cumple.

[2:14]Veamos cómo sería esto en un ejemplo concreto. Supongamos que le pedimos a un agente que nos arme una página web para nuestro negocio.

[2:19]Lo primero que va a hacer es investigar. Okay, ¿qué es lo que hace este negocio? Va a buscar toda la información que encuentre y va a decir, okay, ya tengo el contexto. ¿Cuál es el paso que sigue? Escribir un plan. Okay, ahora empieza a escribir el plan y vuelve al loop.

[2:33]Ya tengo el plan, ¿qué es lo que sigue? Okay, ahora tengo que escribir el código, va, escribe el código y vuelve al plan y dice, okay, ¿qué es lo que sigue? ¿Cumplí con la página web, sí o no?

[2:41]Si te dice no, pregunta qué falta, verifica, haz los cambios y cuando confirma que el objetivo se cumplió, que era crear una página web para el negocio, ahí recién te va a entregar el resultado.

[2:52]Y no tuviste que iterar varias veces en el prompt entremedio, ya que vimos el resultado, vimos si es que se cumplió, se formó una especie de loop constantemente hasta que te entregó la página web.

[3:03]Y ese loop, que es el de observar, pensar y actuar, es el que está separando un chatbot de un agente. Sin ese loop no existe un agente, solamente existe un chatbot.

[3:10]Ahora, este loop necesita correr en algún lugar y ahí es donde entran las distintas plataformas, Claude Code, Codex, no sé, OpenClaw, Manos, CoWor, todas. Y estos son los que se conocen como un Agent Harness o un arnés de agentes.

[3:24]Remy Gaskell, que es un referente en el tema, usa una analogía que me gusta mucho. Dice, lo que vamos a aprender hoy es a manejar. Cómo funcionan los pedales, el volante, los frenos. Y una vez que sabes manejar, puedes subirte a cualquier auto.

[3:36]Un Toyota viejo, un Range Rover, lo que sea. Las plataformas son los autos. Algunas tienen mejores features, como asientos con calefacción, piloto automático, pero el fundamento es el mismo, llegar de un punto A que te propusiste a un punto B.

[3:52]Entonces, primer concepto clave: un agente es un sistema que entra en un loop de observar, pensar y actuar. Y este loop se repite constantemente hasta lograr el objetivo.

[4:02]Y las plataformas que estás usando simplemente son distintas carrocerías para ese mismo motor. Es como en la Fórmula 1 que Haas, Cadillac, Ferrari, usan el mismo motor, Ferrari, pero son tres carrocerías distintas.

[4:13]La misma lógica se aplica en este caso. Parte 2: Los 4 elementos de un agente.

[4:20]Ahora que comprendes el loop, vamos a los cuatro elementos que componen a un agente completo y este es el corazón del video, así que presta mucha atención.

[4:28]El primer elemento es el loop, que ya lo vimos. Pero aquí es donde quiero reforzar algo. El loop es el elemento que le da la autonomía al agente. Sin loop, la IA responde una vez y luego se detiene.

[4:40]Con el loop, la IA persigue un objetivo hasta completarlo. Y la diferencia entre un buen agente y uno mediocre no está en el loop en sí, porque todos los agentes al final lo tienen, sino que está en otros tres elementos: qué tan buen contexto le das, qué tan bien maneja la memoria y cuáles son las herramientas que tiene conectadas.

[4:55]Lo que nos lleva al segundo elemento: el contexto. Y aquí es donde viene algo fundamental. Si es que el día de hoy tú le pides a Claude, a Gemini o a Chat GPT que escriba un e-mail en frío para tu negocio, probablemente te va a preguntar qué es lo que vendes, a quién le vendes, o te va a redactar un correo super poco personalizado.

[5:11]Y al final, tiene sentido, porque no sabe nada de ti. Cuando trabajas con agentes, existe un archivo que se llama agents.md o .markdown.

[5:19]Los archivos markdown simplemente es una manera de poder jerarquizar cierta información y las inteligencias artificiales lo leen muy bien.

[5:26]No es nada más que eso, pero existe al final este archivo que se llama agents.md o Claude.md si es que estás usando Claude Code o Gemini.md si es que estás usando Gemini.

[5:36]El nombre cambia según la plataforma que estés usando, pero el concepto es el mismo. Este archivo viene siendo como las instrucciones que le estás dando al agente cuando está ejecutando ciertas cosas.

[5:49]Es como las instrucciones que le das a un empleado cuando entra a trabajar contigo, le dices este es mi negocio, esto es lo que hacemos, este es tu rol. Es algo así parecido como los system prompts cuando nosotros creábamos los GPTs personalizados o las esquemas, pero no es exactamente igual y ya te digo por qué.

[6:01]El Claude.md o el Agent.md o el Gemini.md, lo que hace es que se carga al inicio de cada prompt. Entonces, cada vez que tú le escribes, este archivo se va a precargar arriba de todo.

[6:13]Entonces, este va a ser un contexto que siempre va a estar presente y es super buena práctica tenerlo bajo las 200 líneas.

[6:20]Yo siempre veo gente que tiene al final estos archivos con más de 500 líneas y lo único que estamos haciendo ahí es contaminar con más contexto que no necesitamos. Necesitamos tener al final esta especie de alma o el ethos al final que siempre va a estar presente y que siempre se va a regir en todos los prompts.

[6:35]Pero esto va mucho más allá, porque si tienes mucho contexto, es decir, información de tu empresa, perfiles de clientes, brand guidelines, documentos internos, puedes empezar a crear carpetas con distintos archivos.

[6:46]Y en tu archivo de Agents.md simplemente le dices, antes de hacer cualquier tarea, necesito que leas la carpeta de contexto o que verifiques esta información o este archivo, etcétera.

[6:57]Y esto es lo que está realmente cambiando un poco la conversación, porque antes se hablaba del prompt engineering, el arte de escribir buenos prompts, ¿verdad? Bueno, esto evolucionó ahora al context engineering, que es cómo estamos manejando el contexto, a qué le damos acceso, a qué no, cómo referencio el contexto entre distintos archivos.

[7:15]Esto es realmente brutal, porque si hacemos un buen trabajo, tus prompts pueden ser estúpidamente simples, pero como ya va a entender todo el contexto dónde buscar, qué hacer, va a ser incluso más eficiente que un prompt perfecto.

[7:26]Entonces, el enfoque está pasando de la ingeniería de prompts al contexto o la ingeniería de contexto.

[7:33]Entonces, pensémoslo así, si nuestro agente tiene cargado un contexto increíble, la próxima vez que escribamos, escribe un email en frío para mi empresa, va a entender a quién se lo vamos a dirigir, de qué es mi empresa, qué tono usamos, y bueno, mucho más, porque al final ya entiende todo tu contexto.

[7:49]Ahora, el contexto resuelve un problema que sabe o que sepa quién eres. Pero existe otro problema, porque si durante la sesión le dices, nunca firmes los correos con saludos, sino que usa mejor un abrazo, el agente lo va a hacer en esa sesión, pero mañana en una nueva sesión se va a olvidar.

[8:06]Y eso pasa porque cada nueva sesión empieza desde cero. El agente no recuerda qué es lo que pasó antes, a menos de que tú seas capaz de entregarle un mecanismo para recordar.

[8:15]Y ese mecanismo es el archivo memory.markdown. Este es un archivo donde el agente va escribiendo lo que va aprendiendo. Entonces, tú le vas a especificar en tu Agents.markdown, recordemos que esto al final es cómo cruzamos distintos archivos y cómo se referencian entre sí, no es nada más que eso.

[8:32]Le vamos a decir, cuando yo te corrija en algo o quiera que te acuerdes de algo, lo vas a guardar en tu memory.md y ahora cada vez que inicies una nueva sesión, quiero que lo primero que hagas es leas el memory.markdown.

[8:44]Y aquí es donde se pone interesante, porque al final pasa a ser un nuevo self-improving loop, es decir, un loop que va constantemente autoaprendiendo y autorreforzándose.

[8:53]Es brutal, es un ciclo de automejora. El agente trabaja, comete un error, tú lo corriges, él guarda esa corrección y la próxima vez lo hace mejor y eso se va constantemente acumulando.

[9:03]Los modelos de inteligencia artificial van avanzando, las ventanas de contexto van creciendo, lo que nos indica que esto solamente va a seguir mejorando.

[9:10]Un agente que lleva seis meses aprendiendo, va a ser exponencialmente mejor que un agente que está en el día 1, lógicamente.

[9:16]Esto es porque tiene 6 meses de correcciones, de contexto acumulado, que se va compactando, pero en fin, y tiene 6 meses de preferencias guardadas. Y eso al final no se replica, eso pasa a ser tu ventaja competitiva.

[9:27]Y aquí viene el cuarto y último elemento y probablemente el que es el más práctico, porque de nada sirve tener un agente brillante si no puede ejecutar acciones en el mundo real.

[9:34]Es por eso que necesita herramientas. Y aquí es donde entran dos conceptos claves que son los MCP y los skills.

[9:41]El MCP o el Model Context Protocol es un protocolo estándar que creó Anthropic para las inteligencias artificiales y la comunicación con distintas aplicaciones.

[9:50]En español es lo que se usa para conectar agentes con herramientas externas. La mejor analogía que escuché es esta: Antes del MCP, tu agente tenía que entender el idioma de cada una de las herramientas.

[10:01]Claude habla inglés, Notion habla español, Gmail habla francés, Slack habla alemán y todo teníamos que desarrollar una herramienta custom o un lenguaje custom para cada uno de ellos.

[10:12]Es decir, teníamos que conectarlos vía APIs y protocolos distintos, hasta que llegó MSP, que vendría siendo el traductor universal.

[10:20]Se sienta en el medio, habla todos los idiomas y traduce las llamadas del agente a la herramienta y de la herramienta de vuelta.

[10:26]En la práctica, esto significa que puedes conectar tu Gmail, tu Calendar, tu Slack, tu Notion, a la gente, es decir, que la gente puede crear eventos en el calendario, redactar y mandar correos, actualizar proyectos, etcétera.

[10:37]Y después vienen los skills, que esto es lo que me parece lo más potente de todo.

[10:40]Un skill es básicamente un SOP digital, un Standard Operating Procedure o un sistema de procedimiento estándar para tu agente. Creo que nunca lo había dicho en español.

[10:51]Al final son las instrucciones que tiene que seguir el agente para realizar una acción. Le explicas un proceso una vez y nunca más vas a tener que hacerlo.

[10:59]Por ejemplo, supongamos que le vas a crear una propuesta a un cliente por primera vez, le vas diciendo a la gente, oye, cámbiame este color, cambia esta tipografía, pon el precio abajo, usa este formato y tardas 30 minutos de estar ida y vuelta hablando con la gente.

[11:12]Después, cuando quieres volver a hacerlo, un tiempo después, ya se perdió el contexto de todo lo que hiciste.

[11:17]Ahora, si conviertes ese proceso de redactar la propuesta en un skill, la próxima vez simplemente le vas a decir, crea una propuesta para este cliente.

[11:25]Y el agente va a hacer el llamado al skill que ya creaste previamente de redacción de propuestas y va a saber exactamente qué pasos seguir como te gusta.

[11:33]Lo interesante es que los skills también se van acumulando. Si cada semana conviertes tres o cuatro procesos manuales en skills, en tres meses tu agente va a estar manejando prácticamente todo tu negocio.

[11:43]Greg Isenberg, de hecho, lo describe así: The highest margin startups of 2026 will be agent wrappers around vertical work, es decir, las startups más rentables van a ser las que empaquetan workflows específicos como agentes, lo que valida completamente lo que venimos hablando.

[11:58]Pero esto tiene que estar ocurriendo en alguna parte, lo que nos lleva a la siguiente pregunta: Parte 3, ¿Dónde viven los agentes?

[12:08]Dónde viven los agentes. Porque ahora que entiendes los cuatro elementos que componen a un agente, es necesario que entendamos dónde es que están habitando, cuál es su entorno.

[12:16]Primero, tenemos Claude Code. Claude Code es la herramienta de Anthropic para el desarrollo.

[12:20]Vive o habita en el terminal de tu computador o en un IDE, Integrated Development Environment, que vendrían siendo estas aplicaciones como VS Code o Google Anti Rabbit.

[12:29]Este es el lugar donde creas el código, pruebas los workflows, tienes acceso a los elementos y las carpetas de tu escritorio y construyes las bases de tus agentes. Esta es la capa más técnica, pero también la más flexible.

[12:40]Luego tenemos agentes como OpenClaw, un agente autónomo que vive en un entorno o en un computador. Tiene memoria persistente, skills, MSP y todo lo que vimos.

[12:53]Puede correr tareas programadas, responder mensajes por Telegram, acceder a distintos archivos y operar de una forma más independiente que Claude Code.

[12:56]Pensémoslo así, en Claude Code es mucho más fácil separar proyectos distintos y aislarlos, los contextos y las carpetas, mientras que en OpenClaw tenemos todo en un sistema centralizado.

[13:07]Cada uno tiene sus ventajas y sus desventajas, lógicamente. Esto es a grandes rasgos, si te interesa ver exactamente las diferencias, tengo un video que se llama OpenClaw versus Claude Code, ¿cuál es el mejor para ti?, que te lo voy a dejar abajo también en la descripción y probablemente aquí.

[13:21]Pero lo interesante es que está cambiando todo la manera en la que nos estamos relacionando con los agentes y en la que estamos trabajando hoy día.

[13:29]De hecho, lo que me llamó mucho la atención es que Jensen Huang, el CEO de Nvidia, lo dijo en el GTC del 2026: OpenClaw es el sistema operativo para la IA personal y crearon el nuevo estándar.

[13:40]Lo que nos lleva también a mencionar NemoClaw. NemoClaw es la capa de Enterprise o la capa de seguridad que le agregó Nvidia a OpenClaw.

[13:49]Esto al final es para darle una capa de seguridad extra a OpenClaw porque está directamente diseñada en Linux para empresas que quieren mantener al final esta confidencialidad o esta seguridad al implementar este tipo de agentes.

[14:02]Lo importante es que no necesariamente tienes que elegir una u otra. Las vas usando como distintas capas complementarias. Usas Claude Code para construir y desarrollar ideas, usas OpenClaw para operar en el día a día y usas NemoClaw para escalar con seguridad enterprise.

[14:15]Parte 4: El ángulo que nadie da.

[14:20]Y hasta aquí te he explicado la teoría. El loop, el contexto, las herramientas, las capas, la memoria. Y todo esto lo puedes encontrar en videos en inglés si es que lo buscas bien.

[14:28]Pero hay algo que casi nadie menciona y qué es lo que más me importa, y es que los agentes no son herramientas, son sistemas con feedback loop, porque una herramienta la usas y la dejas, mientras que un sistema está evolucionando y creciendo contigo constantemente.

[14:42]Y la diferencia entre alguien que probó agentes y no le funcionó, versus alguien que tiene agentes corriendo actualmente en su sistema, es exactamente eso: tuvo la paciencia de construir ese sistema.

[14:52]Te doy un ejemplo real. Mi agente se llama Claudio. Lo tengo instalado en el Mac Mini que está justamente atrás mío.

[14:58]Claudio tiene un archivo Soul Markdown que define su personalidad y su misión, vendría siendo como su ethos. Tiene Agents.md con todo el contexto de mi negocio, tiene el Memory.md con muchos meses de contexto acumulado.

[15:08]Claudio revisa mis mails, analiza mis datos de mi Whoop, que es la pulsera biométrica, escribe copy para mis campañas, me crea los anuncios de Meta Ads, los sube, los modifica, pero Claudio no nació así de bueno.

[15:17]El Claudio hace un par de meses era bastante básico, no solo porque corría en el modelo de Opus 4.5 y hoy día estamos más avanzado que eso, sino que cometía errores, no entendía mi tono, confundía prioridades, pero cada corrección se iba guardando, cada preferencia se iba acumulando y hoy, meses después, entiende cómo trabajo mi workflow de trabajo mejor que la mayoría de las personas con las que he trabajado.

[15:39]Y eso es lo que quiero que entiendas un poco, que el valor de un agente no está en el día 1, sino que está en el mes 6. Este es un activo que se va valorizando más con el tiempo, pero valorizándose, claramente, a un nivel personal, porque pasa a ser más imprescindible.

[15:53]Es un ciclo de automejora donde el agente se va volviendo mejor con el tiempo. Si llegaste hasta aquí ya sabes más que el 95% de las personas sobre agentes de inteligencia artificial.

[16:02]No es poco. Ahora te voy a dar tres pasos para pasar de entender a efectivamente hacer, porque sé que muchas de las personas que ven este video solamente lo ven y después no aplican.

[16:10]Lo primero, escribe tu agents.md. No necesitas que sea perfecto. Abre cualquier programa. Puedes, o sea, Claude Code, puedes haber instalado OpenClaw y dile, hazme preguntas estilo entrevista para empezar a construir mi contexto.

[16:21]Va a empezar a hacerte preguntas sobre tus formas, tus clientes, tu negocio y con esas respuestas después vas a construir tu agents.md.

[16:28]Segundo, vas a darle memoria. Este es el memory.md. Crea un memory.md vacío y en el Agents dile, cuando yo te corrija o vayas aprendiendo algo nuevo, anda actualizando y escribiendo sobre el memory.md.

[16:40]Con esto, cada vez tu sesión va a ser mejor que la anterior. Y tercero, conéctalo a alguna herramienta. Puede ser cualquiera, Gmail, Calendar, Notion, la que más uses.

[16:49]Conéctala vía MSP y dale una tarea real: resume mis correos de hoy día o dame un briefing del día que se me viene. Y no intentes de automatizar todo de una vez, empieza de a poco, anda creando skills a skill.

[17:00]En tres meses vas a tener cosas que ya ni te puedes imaginar. Ahora, si este video te sirvió, no sabes cuánto me sirve a mí, que le pongas un me gusta a este video. Y no solamente porque al final estás apoyando al canal, sino porque tú también le dices a YouTube que este tipo de contenido te interesa.

[17:14]Y si le pones el like o te suscribes al canal, te van a empezar a aparecer más videos de este estilo y en vez de que te empiecen a salir videos de tralalero tralalá, te vas a empezar a salir videos de contenido de valor, como las nuevas actualizaciones o los nuevos modelos de IA que van lanzando.

[17:29]También mencionarte que si te interesa aprender a instalar tu propio agente, todo esto lo estamos viviendo en el día a día dentro de la comunidad de school de Imperio Digital.

[17:37]Somos un grupo de aficionados al final que le encanta todo esto. Estamos conectando los archivos, buscando nuevas herramientas, nuevas conexiones, optimizando el uso de tokens y nos vamos compartiendo las cosas a medida que van avanzando.

[17:49]El link está abajo en la descripción y también decirte que si tienes una empresa y quieres que alguien te instale OpenClaw, más la capa de seguridad de NemoClaw, también puedes hablar con alguien de mi equipo para que te ayudemos a setearlo.

[17:59]Tengo un servicio de instalación para que veas si es que te hace sentido que te lo instalemos y te lo dejemos corriendo. El link también te lo dejo abajo en la descripción. Y por último, si es que llegaste hasta acá, sé que te interesa el tema y por lo mismo, te recomiendo que veas este video que aparece acá, donde vemos cómo está el panorama total de las automatizaciones al día de hoy y cómo funciona la creación de los workflows agénticos.

[18:20]Estoy segurísimo que te va a gustar. Te veo en ese video.

MORE TRANSCRIPTS

Thumbnail for TUTORIAL WORDTUNE AI by Yayan Saputra

TUTORIAL WORDTUNE AI

Yayan Saputra

Thumbnail for 5 Routine Legal Tasks Your Law Firm Can Automate with AI by Constellation Marketing

5 Routine Legal Tasks Your Law Firm Can Automate with AI

Constellation Marketing

Thumbnail for Assamese story/Assamese gk/Assamese motivational gk story/gk story Assamese/gk /Assamese g k/story by মই পাৰিম Motivational speech

Assamese story/Assamese gk/Assamese motivational gk story/gk story Assamese/gk /Assamese g k/story

মই পাৰিম Motivational speech

Need another transcript?

Paste any YouTube URL to get a clean transcript in seconds.

Get a Transcript