GPT-5.2 marca un giro práctico: ya no se trata solo de “responder”, sino de producir entregables y coordinar flujos de trabajo complejos. En legal, eso impacta directamente en investigación, borradores, matrices de riesgos, due diligence y atención al cliente.
OpenAI presentó GDPval como una evaluación de desempeño en tareas reales y económicamente relevantes. Cita textual (OpenAI, “Medición del rendimiento…”):
“Presentamos GDPval: una nueva evaluación que mide el rendimiento de los modelos en tareas de valor económico en el mundo real de 44 ocupaciones.”
En ese conjunto, el derecho aparece explícitamente. Cita textual (OpenAI, lista de ocupaciones):
“Servicios profesionales, científicos y técnicos (…) Desarrolladores de software, Abogados, Contadores y auditores…”
La lógica de GDPval es distinta a “preguntas tipo examen”: usa tareas basadas en productos reales con contexto y archivos. Cita textual (OpenAI, “Lo que GDPval mide”):
“Cada tarea se basa en productos del mundo real, como un escrito legal…”
OpenAI reporta un 70,9% en GDPval para GPT-5.2 Thinking bajo el criterio “wins or ties” (ganar o empatar). Esto no significa “70,9% mejor que abogados”; significa que, en tareas bien especificadas evaluadas por comparación con entregables humanos, el modelo logra igualar o superar con frecuencia.
La propia OpenAI advierte una limitación especialmente relevante para la práctica jurídica (OpenAI, “Limitaciones”):
“La versión actual de la evaluación también es de un solo intento… no captura casos en los que el modelo tendría que… mejorar a través de varios Evolución
La gráfica “GDPval: OpenAI frontier model performance over time” muestra una tendencia: el rendimiento en tareas profesionales mejora rápidamente entre generaciones (GPT-4o → o3-high → GPT-5-high). Para despachos, esto respalda una conclusión práctica: lo delegable (borradores, organización, checklists) se acelera; lo indelegable (juicio, estrategia, responsabilidad) se revaloriza.
GDPval: evolución del rendimiento en tareas profesionales (inserta aquí tu imagen; reemplaza el atributo src).
Prompt (cliente):
Recibí una carta de intimación con un plazo de 10 días por presunta infracción de marca y competencia desleal.
Tengo una tienda de comercio electrónico y mi nombre comercial se parece al de la parte reclamante.
Además, tengo un contrato con un proveedor con cláusula de exclusividad, y mi agencia de marketing podría haber usado imágenes de terceros sin licencia.
Necesito una estrategia de respuesta en 72 horas y quiero preservar evidencia sin borrar nada.
¿Puedes ayudarme a mapear opciones, riesgos y un plan de acción?