Documento de preparación para el examen AWS Certified Generative AI Developer – Professional (AIP)

～ Demuestra tus habilidades en AWS en la era de la IA generativa ～

Índice

Introducción: posicionamiento de esta certificación y estrategia de estudio
Resumen del examen y dominios evaluados
Organización de conocimientos clave por dominio
- 3.1 Uso y selección de modelos de base
- 3.2 Ingeniería de prompts
- 3.3 Arquitectura RAG (Generación Aumentada por Recuperación)
- 3.4 Fine-tuning y personalización de modelos
- 3.5 Desarrollo de agentes de IA
- 3.6 Seguridad e IA responsable
- 3.7 AgentCore (nuevo servicio)
¿Qué podrás hacer en la práctica?
Métodos de estudio y guía de materiales
Lista de verificación para antes del examen

1. Introducción: posicionamiento de esta certificación y estrategia de estudio

Este documento fue creado como guía de preparación para el examen AWS Certified Generative AI Developer – Professional (conocido como AIP).

Qué acredita esta certificación

Esta certificación demuestra las habilidades para desarrollar y optimizar aplicaciones de IA generativa sobre AWS. En 2026, la demanda de ingenieros con experiencia práctica en IA generativa crece a un ritmo acelerado; obtener esta certificación te permite posicionarte claramente en el mercado como un ingeniero capaz de trabajar con el stack de IA generativa de AWS a nivel profesional.

Enfoque general de estudio

Consejo: Este examen no evalúa la memorización, sino la comprensión. Estudia siempre teniendo presente «¿por qué existe este servicio?» y «¿qué problema resuelve?».

2. Resumen del examen y dominios evaluados

Ítem	Detalle
Nombre del examen	AWS Certified Generative AI Developer – Professional
Inicio oficial	Abril de 2026 en adelante (versión beta antes de esa fecha)
Formato	Opción múltiple (selección única y selección múltiple)
Duración	180 minutos
Puntaje mínimo	750/1000 (puntaje escalado)
Precio	44 000 JPY (impuestos incluidos)

Principales dominios evaluados

Dominio	Tema principal
Dominio 1	Selección y uso de modelos de base
Dominio 2	Ingeniería de prompts
Dominio 3	Diseño y construcción de arquitecturas RAG
Dominio 4	Fine-tuning y personalización
Dominio 5	Desarrollo de agentes de IA
Dominio 6	Seguridad, gobernanza e IA responsable

3. Organización de conocimientos clave por dominio

3.1 Uso y selección de modelos de base

★ Puntos evaluados en el examen

Se evalúa la comprensión de las características de los modelos de base (Foundation Models: FM) accesibles a través de Amazon Bedrock y la capacidad de seleccionar el modelo óptimo según el caso de uso.

Lista de modelos que debes conocer

Familia de modelos	Proveedor	Características principales y puntos fuertes
Claude	Anthropic	Comprensión de textos largos, razonamiento lógico, énfasis en seguridad
Titan	Amazon	Generación de texto, embeddings, generación de imágenes. Nativo de AWS
Llama	Meta	De código abierto, alta capacidad de personalización
Mistral	Mistral AI	Ligero y rápido, buena relación costo-rendimiento
Stable Diffusion	Stability AI	Especializado en generación de imágenes
Command/Embed	Cohere	Fuerte en generación de texto y embeddings

Criterios de selección (muy frecuentes en el examen)

Factores a considerar al seleccionar un modelo:

Tipo de tarea: generación de texto, resumen, generación de código, generación de imágenes, embeddings, etc.
Requisitos de precisión: ¿se necesita alta precisión o es suficiente un nivel aceptable?
Requisitos de latencia: ¿se requiere respuesta en tiempo real?
Costo: precio por token de entrada/salida, costo de inferencia
Ventana de contexto: límite máximo de tokens de entrada
Soporte multimodal: ¿se necesita procesar texto e imágenes?

Técnica para el examen: Aparecen muchas preguntas sobre el equilibrio entre «optimización de costos» y «precisión». Ante la pregunta «¿cuál es el método más rentable?», la respuesta correcta suele seguir el enfoque de comenzar con un modelo pequeño y escalar según sea necesario.

Funciones principales de Amazon Bedrock

Función	Descripción
Acceso a modelos	Acceso vía API a FM de múltiples proveedores
Playground	Entorno de prueba para probar modelos desde la interfaz gráfica
Knowledge Bases	Servicio administrado para construir RAG
Agents	Ejecución autónoma de tareas mediante integración con herramientas externas
Guardrails	Filtrado de contenido dañino
Evaluación de modelos	Función de comparación del rendimiento de modelos
Personalización	Fine-tuning y preentrenamiento continuo

3.2 Ingeniería de prompts

★ Puntos evaluados en el examen

Se evalúan el nombre, las características y el uso apropiado de cada técnica de prompting. Son muy frecuentes las preguntas del tipo «¿qué técnica de prompting es la más adecuada en esta situación?».

Principales técnicas de prompting

Prompting Zero-shot

Método en el que solo se da una instrucción sin ejemplos previos. Depende del conocimiento previo del modelo.

Resume el siguiente texto en 3 líneas:
[texto]

Cuándo usarlo: tareas simples en las que las capacidades generales del modelo son suficientes

Prompting Few-shot

Método en el que se muestran algunos pares de entrada y salida de ejemplo antes de plantear la tarea real.

Reseña: "¡Este producto es increíble!" → Sentimiento: Positivo
Reseña: "Llegó roto y no funciona" → Sentimiento: Negativo
Reseña: "Es normal, nada especial" → Sentimiento:

Cuándo usarlo: cuando se necesita que el modelo respete un formato específico o criterios de clasificación determinados

Prompting Chain-of-Thought (CoT)

Técnica que lleva al modelo a seguir un proceso de razonamiento paso a paso. Se agrega una instrucción como «piensa paso a paso».

Problema: en una tienda hay 12 manzanas, se venden 8 y luego llegan 5 más.
¿Cuántas manzanas hay? Piensa paso a paso.

Cuándo usarlo: tareas complejas que requieren razonamiento matemático o lógico

Prompt de sistema

Prompt que define el rol, las restricciones y el comportamiento del modelo. Es la parte que el usuario no ve.

Eres un ingeniero de soporte técnico de AWS.
Responde únicamente preguntas relacionadas con servicios de AWS.
Limita tus respuestas a 200 caracteres.

Cuándo usarlo: aplicaciones en general donde se desea mantener una calidad de respuesta consistente

Buenas prácticas para optimizar prompts

Práctica	Descripción
Ser específico en las instrucciones	Evitar instrucciones ambiguas; especificar formato, longitud y tono de la salida
Usar delimitadores	Separar las secciones de entrada con etiquetas XML o líneas divisorias
Mejorar de forma iterativa	No buscar la perfección de inmediato; repetir ciclos de prueba y corrección
Aprovechar instrucciones negativas	Las restricciones del tipo «no hagas X» también son efectivas
Ajustar el parámetro de temperatura	Temperatura baja = determinista; temperatura alta = creativo

Parámetros de inferencia (muy frecuentes en el examen)

Parámetro	Función	Efecto según el valor
Temperature	Controla la aleatoriedad de la salida	Bajo → salida precisa y consistente; alto → salida diversa y creativa
Top P	Limita los tokens candidatos por probabilidad acumulada	Bajo → conservador; alto → diverso
Top K	Selecciona entre los K tokens candidatos más probables	Pequeño → conservador; grande → diverso
Max Tokens	Número máximo de tokens en la salida	Afecta el costo y la longitud de la respuesta
Stop Sequences	Cadenas de texto que detienen la generación	Útil para controlar el formato de salida

Técnica para el examen: «Tareas donde la precisión es crítica (generación de código, respuestas basadas en hechos)» → Temperature baja «Tareas donde la creatividad es importante (brainstorming, creación de historias)» → Temperature alta Este criterio aparece con mucha frecuencia.

3.3 Arquitectura RAG (Generación Aumentada por Recuperación)

★ Puntos evaluados en el examen

Se hace especial hincapié en la composición de la arquitectura RAG, el rol de cada componente y la selección de la base de datos vectorial. En particular, el patrón de construcción con Amazon Bedrock Knowledge Bases es uno de los temas más importantes.

¿Qué es RAG?

RAG (Retrieval-Augmented Generation: Generación Aumentada por Recuperación) es una arquitectura que recupera información relevante de fuentes de datos externas y la pasa como contexto al LLM para generar una respuesta.

Reduce las alucinaciones (respuestas plausibles pero incorrectas) que son un problema de los LLM por sí solos, y permite obtener respuestas precisas basadas en datos internos actualizados.

Arquitectura RAG (flujo de procesamiento)

┌──────────────────────────────────────────────────────────────┐
│                    Flujo de procesamiento RAG                │
│                                                              │
│  Pregunta del usuario                                        │
│      ↓                                                       │
│  ① Vectorizar la pregunta con un modelo de embedding         │
│      ↓                                                       │
│  ② Búsqueda por similitud en la BD vectorial (búsqueda       │
│     semántica)                                               │
│      ↓                                                       │
│  ③ Recuperar documentos relevantes (chunks)                  │
│      ↓                                                       │
│  ④ Incorporar la información recuperada + la pregunta        │
│     original en el prompt                                    │
│      ↓                                                       │
│  ⑤ El LLM genera la respuesta                                │
│      ↓                                                       │
│  Respuesta al usuario                                        │
└──────────────────────────────────────────────────────────────┘

Pipeline de ingesta de datos

┌──────────────────────────────────────────────────────────────┐
│               Pipeline de ingesta de datos                   │
│                                                              │
│  Fuente de datos (S3, web crawler, etc.)                     │
│      ↓                                                       │
│  ① Carga y parseo de documentos                              │
│      ↓                                                       │
│  ② Chunking (división del documento en unidades pequeñas)    │
│      ↓                                                       │
│  ③ Vectorización con modelo de embedding                     │
│      ↓                                                       │
│  ④ Almacenamiento en la BD vectorial                         │
└──────────────────────────────────────────────────────────────┘

Estrategias de chunking (muy frecuentes en el examen)

Estrategia	Descripción	Casos de uso adecuados
Tamaño fijo	División mecánica por un número fijo de tokens	Simple, rápido y de uso general
Semántico	División por unidades de significado	Cuando la coherencia semántica es importante
Jerárquico	División en chunks padre e hijo	Cuando se necesita tanto amplitud de contexto como nivel de detalle
Con solapamiento	Se superponen los límites entre chunks	Cuando se quiere evitar la pérdida de información

Técnica para el examen: Chunks demasiado grandes → aumenta el ruido, baja la precisión y sube el costo Chunks demasiado pequeños → se pierde el contexto y no se pueden generar respuestas con sentido Aparecen preguntas sobre «la selección del tamaño de chunk adecuado».

Opciones de bases de datos vectoriales

Servicio	Características	Posición en el examen
Amazon OpenSearch Serverless	Serverless, búsqueda híbrida de texto completo + vectorial	El más frecuente. Aparece con mayor frecuencia en preguntas sobre RAG
Amazon Aurora PostgreSQL (pgvector)	Añade búsqueda vectorial a una BD relacional	Cuando se quiere aprovechar una BD relacional existente
Amazon Neptune	BD de grafos + búsqueda vectorial	Combinación con grafos de conocimiento
Pinecone	Tercero, especializado en búsqueda vectorial	Conectable desde Bedrock Knowledge Bases
Redis Enterprise Cloud	Alta velocidad en memoria + búsqueda vectorial	Requisitos de baja latencia

Configuración de Amazon Bedrock Knowledge Bases

Amazon Bedrock Knowledge Bases es un servicio que permite construir el pipeline RAG descrito anteriormente de forma administrada.

Fuentes de datos compatibles:

Amazon S3 (la más común)
Web crawler
Confluence
SharePoint
Salesforce

Elementos de configuración principales:

Selección del modelo de embedding (Titan Embedding, etc.)
Selección de la estrategia de chunking
Selección de la BD vectorial
Configuración del filtrado por metadatos

Técnica para el examen: «Quiero construir un chatbot que devuelva respuestas precisas usando documentos internos» → RAG (Bedrock Knowledge Bases) es la primera opción. Comprende por qué se elige RAG en lugar de fine-tuning (frescura de los datos, costo, facilidad de implementación).

RAG vs. Fine-tuning (comparación muy frecuente en el examen)

Aspecto	RAG	Fine-tuning
Objetivo	Mejorar la precisión de las respuestas mediante referencia a conocimiento externo	Cambiar el comportamiento o estilo del modelo
Frescura de los datos	Puede referenciar datos actualizados en tiempo real	Depende de los datos disponibles al momento del entrenamiento
Costo	Aumento de tokens en inferencia (por el contexto añadido)	Requiere costo de entrenamiento (tiempo de GPU)
Complejidad de implementación	Relativamente simple (al usar Bedrock Knowledge Bases)	Requiere preparación de datos, entrenamiento y evaluación
Casos de uso adecuados	FAQ interno, búsqueda de conocimiento, referencia a información actualizada	Tono o formato específico, adquisición de terminología especializada

3.4 Fine-tuning y personalización de modelos

★ Puntos evaluados en el examen

Se evalúan los tipos de fine-tuning, sus usos, los costos y compromisos, y cuándo usarlo en lugar de RAG.

Comparación de técnicas de personalización

Técnica	Costo	Efecto	Cuándo aplicarla
Ingeniería de prompts	El más bajo	Limitado	Primera técnica que se debe probar
RAG	Moderado	Alta efectividad para ampliar conocimiento	Cuando se necesita referenciar conocimiento externo
Fine-tuning	Alto	Alta efectividad para cambiar el comportamiento del modelo	Tareas especializadas en un dominio específico
Preentrenamiento continuo	El más alto	Adición fundamental de conocimiento de dominio	Incorporación de un nuevo idioma o campo especializado

Técnica para el examen: Si el enunciado dice «el más rentable» o «primero que se debe intentar», el patrón correcto es considerar en orden: ingeniería de prompts → RAG → fine-tuning.

Proceso de fine-tuning

Preparación de datos de entrenamiento: preparar pares entrada-salida en formato JSONL
Subir los datos a S3
Crear un trabajo de personalización en Bedrock
Entrenamiento del modelo (se requiere throughput provisionado)
Evaluación del modelo personalizado
Despliegue y uso

Cuándo elegir fine-tuning

Se quiere enseñar un estilo de respuesta o tono específico
Se necesita que el modelo comprenda terminología o siglas propias del sector
Se requiere una salida consistente en un formato determinado (JSON, XML, etc.)
La ingeniería de prompts y RAG no logran la precisión suficiente

3.5 Desarrollo de agentes de IA

★ Puntos evaluados en el examen

Se evalúan el funcionamiento de Amazon Bedrock Agents, la integración de acciones y Knowledge Bases, y la conexión con funciones Lambda.

¿Qué es Amazon Bedrock Agents?

Bedrock Agents es una función que permite al LLM interactuar con APIs externas y fuentes de datos para ejecutar tareas de múltiples pasos de forma autónoma.

Componentes de un agente

Componente	Descripción
Modelo de base	El LLM que actúa como «cerebro» del agente
Instrucciones (Instructions)	Prompt que define el rol y las restricciones del agente
Grupos de acciones	Operaciones externas que el agente puede ejecutar (implementadas con funciones Lambda)
Knowledge Bases	Datos internos que el agente puede consultar (RAG)

Flujo de operación del agente

Pregunta del usuario
    ↓
El agente analiza la pregunta (orquestación)
    ↓
Selecciona una acción según sea necesario
    ├→ Búsqueda en Knowledge Base → Recupera información relevante
    ├→ Invoca función Lambda → Operación en API/BD externa
    └→ Se necesita razonamiento adicional → Consulta nuevamente al modelo
    ↓
Genera la respuesta final y la devuelve al usuario

Definición de grupos de acciones

Los grupos de acciones se definen mediante un esquema OpenAPI y se vinculan a funciones Lambda en el backend.


    Publicaciones relacionadas
    
  
  ← La teoría del talento tipo Nobita
      Las condiciones del ser humano más escasoEnfoque y limitaciones del análisis de mapas meteorológicos con IA generativa [Parte 1] — Las "mentiras convincentes" contadas con total seguridad →