Verificación formal: la única forma de satisfacer a los reguladores de IA

El abogado y el ingeniero: un diálogo de sordos

Existe una desconexión fundamental en la conversación actual entre los ingenieros de IA y los reguladores gubernamentales. Es una barrera lingüística, pero no de nacionalidad. Es una barrera epistemológica: un desacuerdo sobre cómo sabemos lo que sabemos y qué constituye la "verdad".

El ingeniero de IA se levanta y dice: "Este sistema es seguro. Lo hemos sometido a 10 millones de escenarios de prueba simulados. Lo hemos evaluado con conjuntos de datos estándar. Funcionó correctamente el 99,99% de las veces. Es lo último en tecnología".

El regulador (y el juez, y el actuario de seguros) escucha algo muy diferente. Escucha: "Hay una probabilidad del 0,01% de que este sistema falle catastróficamente. No sabemos cuándo ocurrirá. No sabemos por qué ocurrirá. Y no podemos garantizar que no ocurra mañana cuando se despliegue en un hospital".

En el mundo de las aplicaciones de consumo (motores de recomendación, chatbots, filtros de fotos), este enfoque probabilístico es aceptable. Si Spotify te recomienda una canción que odias, nadie muere. Pero a medida que la IA entra en el mundo físico y en la toma de decisiones de alto riesgo (conducción autónoma, diagnóstico médico, gestión de redes eléctricas, aprobación de créditos), la tolerancia a la "seguridad probabilística" se evapora.

No puedes explicarle a un juez que tu coche autónomo mató a un peatón porque fue un "caso extremo estadístico". No puedes consolar a un paciente diciéndole que la sobredosis de radiación fue una "anomalía del 0,01%". En el mundo de la responsabilidad civil, "bastante seguro" no es una defensa.

El fracaso de las pruebas probabilísticas

El paradigma dominante en la evaluación de la IA hoy en día son las pruebas empíricas con un conjunto de datos reservado. Entrenas con los datos A y pruebas con los datos B. Si el modelo obtiene una puntuación alta en B, asumes que ha "aprendido" la tarea y que generalizará al mundo real.

Pero las redes neuronales profundas son funciones no lineales de alta dimensión. Son notoriamente frágiles. Sufren de un fenómeno conocido como "vulnerabilidad adversaria". Un modelo puede clasificar una señal de stop perfectamente el 99% de las veces, pero si giras la imagen 3 grados y añades un patrón específico e imperceptible de ruido, el modelo podría clasificarla con confianza como una tostadora. O como una señal de límite de velocidad de 80 km/h.

Esto sucede porque el modelo no ha aprendido realmente el concepto de "Señal de Stop" (una forma octogonal roja con texto blanco destinada a detener el tráfico). Ha aprendido una correlación estadística de texturas de píxeles. Funciona en el caso promedio, pero falla en el peor de los casos.

Las pruebas (por muy extensas que sean) solo pueden mostrar la presencia de errores, no su ausencia. Puedes ejecutar mil millones de kilómetros de simulación, pero no puedes cubrir el espacio de entrada infinito del mundo real. Probar es buscar una aguja en un pajar recogiendo trozos de paja al azar. Si no encuentras la aguja, no significa que no esté ahí; solo significa que aún no la has tocado.

Cuando la Ley de IA de la UE exige que los sistemas de IA de alto riesgo sean "robustos, precisos y ciberseguros", están pidiendo implícitamente una garantía que las pruebas probabilísticas simplemente no pueden ofrecer.

Entra la verificación formal: las matemáticas de la certeza

La verificación formal es el antídoto contra la incertidumbre. Es una técnica tomada del diseño de hardware y la ingeniería de sistemas críticos (como la aviónica y el control de reactores nucleares). En lugar de probar muestras, utiliza la lógica matemática para probar propiedades del sistema para todas las entradas posibles.

Imagina una red neuronal simple que controla un brazo robótico. Queremos asegurar una propiedad de seguridad: "El brazo nunca debe moverse a más de 2 metros por segundo cuando se detecta a un humano a menos de 1 metro".

El enfoque de pruebas: Ejecutar el brazo 1.000 veces con entradas aleatorias (posiciones humanas, velocidades). Medir la velocidad del brazo. Si nunca supera los 2 m/s, calificarlo como seguro. (Riesgo: la entrada n.º 1.001 podría provocar un pico).
El enfoque de verificación formal: No ejecutamos el sistema. Modelamos el sistema. Tratamos la red neuronal como un conjunto masivo de ecuaciones matemáticas. Definimos las restricciones de entrada (Distancia Humana < 1m) y las restricciones de salida (Velocidad Brazo < 2m/s). Luego utilizamos un algoritmo especializado llamado solucionador SMT (Satisfiability Modulo Theories).

Le preguntamos al solucionador: "¿Existe ALGUNA configuración de entrada X, dentro del rango válido, tal que la velocidad de salida(X) > 2?"

El solucionador explora la estructura matemática de la red. No se limita a probar puntos aleatorios; analiza la geometría de la función. Si devuelve "UNSAT" (Insatisfactorio), tenemos una prueba matemática de que el límite de velocidad nunca se puede romper. Es físicamente imposible que el software genere ese comando.

Esto no es una estimación estadística. Es una garantía. Es la diferencia entre "estoy bastante seguro de que el puente no se derrumbará" y "la física de los materiales dicta que el puente no puede derrumbarse bajo esta carga".

Por qué el Deep Learning odia la verificación formal

Si la verificación formal es tan buena, ¿por qué no la utilizan todos? ¿Por qué OpenAI y Google confían en el "Red Teaming" (probadores humanos que intentan romper el modelo) en lugar de en pruebas matemáticas?

La respuesta es la complejidad computacional. Los modelos estándar de aprendizaje profundo son una pesadilla para verificar.

Un modelo Transformer típico (como GPT-4) tiene miles de millones o billones de parámetros. Utiliza funciones de activación complejas y no lineales como GeLU o Swish. La complejidad matemática de verificar un sistema de este tipo escala exponencialmente con el número de neuronas. Probar una propiedad en un Transformer grande es computacionalmente imposible; el universo sufriría una muerte térmica antes de que el solucionador terminara de comprobar todas las ramas.

La industria ha optimizado la "Expresividad" (la capacidad de generar poemas y código geniales) a expensas de la "Verificabilidad" (la capacidad de probar que funciona). Han construido un cerebro tan complejo que ni siquiera sus creadores pueden analizarlo.

El enfoque de Dweve: verificado por construcción

En Dweve tomamos un camino diferente. Decidimos que para aplicaciones industriales y empresariales de alto riesgo, la verificabilidad es más importante que escribir haikus. Así que co-diseñamos nuestra arquitectura teniendo en cuenta la verificación.

Utilizamos dos estrategias principales para hacer que la IA sea verificable:

1. Simplificación: Redes binarias y lineales por tramos

Utilizamos Redes Neuronales Binarias (BNN) y redes con funciones de activación simples y lineales por tramos (como ReLU). Evitamos las curvas complejas de GeLU/Swish.

Al restringir las matemáticas a relaciones lineales simples y lógica booleana (0 y 1), reducimos drásticamente el espacio de búsqueda para el solucionador. El problema de verificación se transforma de un problema de optimización no lineal imposible en un problema de Programación Lineal Entera Mixta (MILP) solucionable o un problema SAT. Estos siguen siendo problemas "NP-hard", pero para el tamaño de las redes que utilizamos en los sistemas de control, los solucionadores modernos pueden manejarlos en segundos o minutos.

2. El "Safety Shell" neuro-simbólico

No intentamos verificar todo el "cerebro". Aceptamos que la parte perceptiva de la IA (la parte que mira la señal de una cámara y dice "Eso es un humano") es intrínsecamente probabilística. No se puede probar formalmente que una cuadrícula de píxeles es un humano; "humano" es un concepto difuso.

En su lugar, envolvemos la red neuronal en un "Safety Shell": una capa lógica simbólica que hace cumplir las restricciones. La arquitectura es la siguiente:

Capa neuronal (Percepción): Analiza las entradas y sugiere una acción. "Veo a un humano. Sugiero mover el brazo a una velocidad de 2,5 m/s".
Safety Shell (Lógica): Intercepta la sugerencia. La comprueba con un conjunto de invariantes formalmente verificados (reglas que nunca deben romperse).
Comprobación de reglas: "Regla n.º 1: SI Humano_Detectado ENTONCES Velocidad_Max = 2,0 m/s".
Intervención: El Safety Shell ve que 2,5 > 2,0. Rechaza la sugerencia de la red neuronal y limita el valor a 2,0 m/s.

En esta arquitectura, solo necesitamos verificar formalmente el Safety Shell (que es pequeño, lógico y determinista). No necesitamos verificar la enorme red neuronal. Incluso si la red neuronal alucina e intenta matar al operador, el Safety Shell garantiza matemáticamente que el comando nunca llegará a los motores.

La ventaja competitiva regulatoria

Para nuestros clientes, esto no es solo un ejercicio académico. Es un facilitador de negocios masivo. Es la diferencia entre obtener una licencia para operar y ser clausurado.

Cuando un fabricante de dispositivos médicos se acerca a la FDA (EE. UU.) o a la EMA (Europa) para la aprobación de una bomba de insulina impulsada por IA, los reguladores están aterrorizados. Saben que la IA puede ser impredecible. Exigirán años de ensayos clínicos para demostrar estadísticamente la seguridad.

Pero si ese fabricante utiliza un modelo Dweve formalmente verificado, la conversación cambia. Pueden entregar al regulador una prueba matemática de las propiedades críticas de seguridad. "No solo pensamos que no sobredosificará al paciente. Aquí está la prueba formal de que el comando de dosificación de salida está matemáticamente limitado por las restricciones de peso y nivel de glucosa del paciente".

Esto permite una aprobación por la "vía rápida". Reduce las primas del seguro de responsabilidad civil. Crea confianza.

De "moverse rápido y romper cosas" a "moverse rápido y probar cosas"

La era de "moverse rápido y romper cosas" funciona para las redes sociales. No funciona para los coches autónomos, las redes eléctricas o los robots médicos. Cuando rompes cosas en el mundo físico, rompes personas.

A medida que la Ley de IA de la UE entre en vigor y las leyes de responsabilidad civil se pongan al día con la tecnología, los días del salvaje oeste de la IA están terminando. El futuro pertenece a los sistemas que son robustos, explicables y verificables.

Estamos entrando en la era de "moverse rápido y probar cosas". Y la única forma de probar cosas en el ámbito digital es con matemáticas. En Dweve, estamos construyendo los compiladores y las arquitecturas para hacer que esas matemáticas sean accesibles para todos los desarrolladores.

¿Necesita una IA que pueda soportar el escrutinio regulatorio? Las arquitecturas formalmente verificadas de Dweve proporcionan las garantías matemáticas que exigen los reguladores. Contáctenos para descubrir cómo nuestra tecnología Safety Shell puede acelerar su proceso de aprobación de IA y reducir su exposición a la responsabilidad.

Verificación formal: la única forma de satisfacer a los reguladores de IA

El abogado y el ingeniero: un diálogo de sordos

El fracaso de las pruebas probabilísticas

Entra la verificación formal: las matemáticas de la certeza

Por qué el Deep Learning odia la verificación formal

El enfoque de Dweve: verificado por construcción

1. Simplificación: Redes binarias y lineales por tramos

2. El "Safety Shell" neuro-simbólico

La ventaja competitiva regulatoria

De "moverse rápido y romper cosas" a "moverse rápido y probar cosas"

Etiquetas

Sobre el autor

Harm Geerlings

Artículos relacionados

La paradoja europea de la IA: por qué la próxima generación de expertos en IA ya está entre nosotros

La "Tercera Vía" europea: Ni el salvaje oeste ni control estatal

La ilusión de la soberanía de datos: por qué las "zonas locales" no son suficientes

Recibe novedades de Dweve