El gobierno estadounidense ordenó a Anthropic que retirara sus dos modelos más recientes, Fable 5 y Mythos 5, argumentando preocupaciones de seguridad nacional. El detonante: investigadores de Amazon identificaron aparentemente un método para eludir los sistemas de protección de Fable 5. Los modelos fueron retirados abruptamente, con pocas explicaciones públicas de los reguladores.
La comunidad de seguridad no se quedó callada. Un grupo de investigadores de ciberseguridad publicó una carta abierta argumentando que la prohibición es contraproducente — y potencialmente peligrosa en sí misma. Su punto central: las mismas clases de ataques de jailbreak encontrados en Fable 5 existen en prácticamente todos los modelos de IA principales disponibles actualmente. Señalar específicamente a Anthropic, argumentan, no resuelve el problema subyacente.

Anthropic respaldó esa posición directamente, señalando públicamente que sus modelos no son únicamente vulnerables. Ese encuadre es importante — posiciona a Anthropic como una empresa siendo sometida a un estándar más estricto que sus competidores, lo cual es sorprendentemente una posición sólida en un mercado donde la credibilidad en seguridad es un diferenciador genuino.
La ironía práctica aquí es real: una acción gubernamental destinada a limitar el alcance de un modelo ha generado exactamente el tipo de cobertura mediática que el dinero no puede comprar. Los desarrolladores que evalúan modelos de frontera ahora asociarán a Anthropic con un escrutinio riguroso de seguridad — incluso si la prohibición en sí fue cuestionablemente inconsistente.
Para los equipos que actualmente usan o evalúan sistemas basados en Claude, la preocupación inmediata es la continuidad. Si dependes de las capacidades más nuevas de Anthropic, revisa tus opciones de respaldo ahora. A largo plazo, observa cómo este episodio moldea el apetito regulatorio por intervenciones específicas de modelos — es probable que se convierta en un caso de referencia en debates de gobernanza de IA durante los próximos meses.
