Machine learning explicado: cómo aprende realmente la IA (sin rodeos)

El libro de recetas de tu madre

Déjame contarte sobre mi madre. Hace la mejor tarta de manzana que he probado en mi vida. Absolutamente perfecta. Siempre.

La cuestión es que nunca usó una receta. Ni una sola vez. Lleva 40 años haciendo esa tarta. Simplemente sabe lo que funciona.

¿Cómo aprendió?

Empezó con la receta de su madre. ¿La primera tarta? Aceptable. ¿La segunda? Añadió un poco más de canela porque la primera quedó sosa. ¿La tercera? Menos azúcar porque la segunda era demasiado dulce. ¿La cuarta? Más mantequilla en la masa porque estaba demasiado seca.

Año tras año, tarta tras tarta, fue ajustando. Notó patrones. "Cuando las manzanas están muy ácidas, añade más azúcar. Cuando están dulces, añade menos. Si hay humedad, usa menos agua en la masa. Si el ambiente es seco, usa más".

Aprendió de la experiencia. De la retroalimentación. De hacer cientos de tartas y darse cuenta de lo que funcionaba y lo que no.

Así es exactamente como funciona el machine learning. Solo que en lugar de hacer tartas, los ordenadores hacen predicciones. Y en lugar de 40 años, lo hacen en unas pocas horas.

Déjame mostrarte cómo.

Qué significa realmente "aprender" (para las máquinas)

Cuando la gente dice que un ordenador "aprendió" algo, no significa que lo haya entendido. Significa que mejoró en una tarea a base de práctica.

Mi madre no entendía la química de por qué la mantequilla hace que la masa sea hojaldrada. Simplemente sabía que lo hacía. Encontró un patrón: más mantequilla equivale a una masa más hojaldrada. Eso es aprender.

Los ordenadores hacen lo mismo, pero con datos en lugar de tartas.

Déjame darte un ejemplo real con el que lidias todos los días: el filtro de spam de tu correo electrónico.

El método antiguo (antes del aprendizaje)

Reglas manuales que se rompían constantemente

Alguien tenía que escribir reglas: "Si el correo dice 'príncipe nigeriano', es spam. Si dice 'Has ganado la lotería', es spam. Si tiene más de 10 signos de exclamación, es spam".

¿El problema? Los spammers se adaptaron. Empezaron a escribir "pr1nc1pe n1ger1ano" o "L0ter1a". Las reglas se rompieron. Alguien tenía que escribir nuevas reglas manualmente. Una y otra vez. Para siempre.

El método nuevo (con aprendizaje)

El ordenador encuentra sus propios patrones

Le muestras al ordenador 10.000 correos. "Estos 5.000 son spam. Estos 5.000 son reales". El ordenador los analiza y encuentra patrones que nunca le dijiste que buscara:

→ Los correos de spam suelen tener ciertas palabras juntas
→ Provienen de tipos específicos de direcciones de correo
→ Tienen patrones de puntuación inusuales
→ Los enlaces que contienen parecen sospechosos de formas específicas

Ahora, cuando los spammers cambian de táctica, solo tienes que mostrarle al ordenador nuevos ejemplos de spam. Encuentra nuevos patrones. No es necesario escribir nuevas reglas manualmente.

Eso es el machine learning: ordenadores que mejoran en tareas encontrando patrones en ejemplos, no siguiendo reglas que alguien escribió.

Las tres formas en que las máquinas practican

Así como las personas aprenden de diferentes maneras, las máquinas tienen diferentes métodos de aprendizaje para distintas situaciones. Déjame contarte sobre los tres principales usando ejemplos con los que realmente te identificarás.

Aprendizaje con un profesor (Aprendizaje supervisado)

¿Recuerdas cuando aprendías las tablas de multiplicar en la escuela? Tu profesor te daba los problemas Y las respuestas. "¿Cuánto es 7 por 8?" "56". Practicabas hasta que podías responder sin mirar.

Eso es el aprendizaje supervisado. El ordenador recibe preguntas y respuestas juntas.

Ejemplo: Enseñar a un ordenador a reconocer fotos

Le muestras 1.000 fotos. Para cada una, le dices lo que contiene:

📷 Esta foto: Gato
📷 Esta foto: Perro
📷 Esta foto: Coche

El ordenador empieza a adivinar al azar. Al principio, sus conjeturas son terribles. Luego, nota patrones: "Las fotos con orejas puntiagudas y bigotes suelen ser gatos. Las fotos con orejas caídas y narices húmedas suelen ser perros. Las fotos con ruedas y ventanas suelen ser coches".

Practica con esas 1.000 fotos hasta que se vuelve muy bueno. Luego, lo pruebas con fotos nuevas que nunca ha visto. Si aprendió bien los patrones, las reconoce correctamente.

Así es como tu teléfono reconoce caras, como los médicos usan la IA para detectar enfermedades en radiografías y como los asistentes de voz entienden lo que dices.

Aprendizaje sin profesor (Aprendizaje no supervisado)

Ahora imagina que estás clasificando la colección de botones de tu difunta tía. Tenía cientos de botones, todos mezclados. No tienes una guía. Simplemente empiezas a separarlos en montones que tengan sentido para ti.

Encontrar patrones por tu cuenta

→ Botones grandes aquí. Botones pequeños allá.
→ Los de metal en este montón. Los de plástico en ese otro.

Estás encontrando patrones sin que nadie te diga qué buscar.

Eso es el aprendizaje no supervisado. El ordenador busca patrones sin que le digan cuál debería ser la respuesta.

Ejemplo: Encontrar grupos de clientes

Una tienda tiene datos de 10.000 clientes: qué compran, cuándo compran, cuánto gastan. Nadie le dice al ordenador qué grupos existen. Simplemente observa y encuentra patrones:

Grupo 1: Jóvenes que compran tarde en la noche, compran pequeñas cantidades, vienen a menudo

Grupo 2: Familias que compran los fines de semana, compran al por mayor, vienen semanalmente

Grupo 3: Jubilados que compran a mediodía entre semana, compran artículos específicos, muy regulares

Nadie le dijo que estos grupos existían. Los encontró al notar qué clientes se comportan de manera similar.

Así es como Netflix agrupa las series que podrían gustarte, como la detección de fraudes encuentra transacciones inusuales y como los científicos descubren patrones en el ADN.

Aprendizaje por ensayo y error (Aprendizaje por refuerzo)

¿Recuerdas cuando enseñabas a un perro a sentarse? No le explicas qué es sentarse. Solo dices "siéntate", y cuando el perro se sienta, le das un premio. Cuando no se sienta, no hay premio. El perro deduce: sentarse equivale a premios. No sentarse equivale a no tener premios.

Eso es el aprendizaje por refuerzo. Probar cosas. Ver qué funciona. Hacer más de lo que funciona.

Ejemplo: Enseñar a un ordenador a jugar al ajedrez

El ordenador no conoce las reglas al principio. Simplemente prueba movimientos. Al azar. La mayoría son terribles.

Pero aquí está la clave: cuando gana una partida, le dices "buen trabajo". Cuando pierde, le dices "eso no funcionó". Empieza a notar:

✓ Mover la reina aquí a menudo lleva a la victoria
✗ Dejar al rey expuesto normalmente lleva a la derrota
✓ Controlar el centro del tablero es útil

Después de jugar millones de partidas contra sí mismo, se vuelve muy, muy bueno. No porque alguien le enseñara estrategia. Sino porque lo intentó todo y aprendió lo que funciona.

Así es como la IA aprendió a vencer a campeones mundiales de ajedrez y Go, como los robots aprenden a caminar y como los coches autónomos aprenden a conducir.

Los tres estilos de aprendizaje

Cómo ocurre realmente la práctica (El proceso secreto)

Vale, el ordenador practica mirando ejemplos. Pero, ¿qué está pasando realmente por dentro? Déjame guiarte como si estuvieras mirando por encima del hombro del ordenador.

Paso 1: Empezar con conjeturas al azar

Como adivinar el peso de una calabaza

Imagina que intentas adivinar el peso de una calabaza solo con mirarla. Nunca lo has hecho antes, así que lanzas un número al azar. "¿Uhm... 7 kilos?"

Eso es exactamente lo que hace el ordenador. Empieza con conjeturas aleatorias. Completamente al azar. Es como pedirle a un recién nacido que identifique colores. Las conjeturas son terribles. No pasa nada. Ese es el punto de partida.

Paso 2: Comprobar cuán equivocado estás

Medir el error

Ahora pones la calabaza en una báscula. En realidad pesa 10 kilos. Te equivocaste por 3 kilos. Ese es tu error.

El ordenador hace lo mismo. Hace una conjetura, comprueba la respuesta real y calcula cuánto se equivocó. "Dije que esta foto era un perro. En realidad es un gato. Estaba muy equivocado".

Paso 3: Ajustar tu siguiente conjetura

Aprender de los errores

La siguiente calabaza se parece a la primera. No vuelves a adivinar 7 kilos. Aprendiste que las calabazas como esta son más pesadas de lo que pensabas. Así que adivinas 10 kilos. ¡Más cerca!

El ordenador hace exactamente esto. Ajusta su método de adivinanza basándose en sus errores. "Seguía adivinando 'perro' cuando veía orejas caídas, pero me equivocaba. Prestaré más atención a otras características también".

Paso 4: Repetir miles de veces

La práctica hace al maestro

Después de adivinar el peso de 1.000 calabazas y comprobar la báscula cada vez, te volverías bastante bueno. Notarías patrones: "Las calabazas grandes y redondas con tallos gruesos suelen ser pesadas. Las altas y delgadas suelen ser más ligeras".

El ordenador hace esto miles o millones de veces. Cada vez, mejora un poquito. Al final, es realmente bueno en cualquier tarea que esté practicando.

Ese es todo el proceso. Haz una conjetura. Comprueba cuán equivocado estás. Ajusta. Repite hasta que seas lo suficientemente bueno. Una idea simple. Pero si la haces millones de veces muy rápido, obtienes resultados potentes.

Por qué funciona tan bien (y por qué no es magia)

Esto es lo asombroso: este proceso increíblemente simple funciona para una increíble variedad de tareas.

La misma idea básica (práctica con retroalimentación) puede:

✓ Aprender a reconocer tu cara para desbloquear tu teléfono
✓ Aprender a traducir entre idiomas
✓ Aprender a detectar tumores en escáneres médicos
✓ Aprender a predecir si va a llover mañana
✓ Aprender a recomendar películas que probablemente te gustarán

¿Por qué funciona para todas estas cosas diferentes?

Porque en el fondo, todos son problemas de reconocimiento de patrones. Tu cara tiene patrones. Los idiomas tienen patrones. Los tumores tienen patrones. El clima tiene patrones. Tus preferencias de películas tienen patrones.

El ordenador encuentra esos patrones practicando con ejemplos. No "entiende" de caras, idiomas o medicina. Simplemente encuentra que: cuando veo este patrón, la respuesta suele ser esa.

Eso es potente. Pero no es magia. Es reconocimiento de patrones, practicado a una escala que los humanos no pueden igualar.

Lo que el ordenador aprende realmente (La verdad podría sorprenderte)

Aquí hay algo en lo que la mayoría de la gente se equivoca: el ordenador no aprende a comprender. Aprende atajos.

Déjame mostrarte a qué me refiero con una historia real.

La IA de cáncer de piel que hizo trampa

Unos científicos entrenaron una IA para reconocer el cáncer de piel a partir de fotos. Se volvió muy buena. Mejor que algunos médicos. Asombroso, ¿verdad?

Luego notaron algo extraño. La IA se fijaba en las reglas. Muchas de las fotos de cáncer tenían reglas (para mostrar la escala). Muchas de las fotos sin cáncer no las tenían.

La IA aprendió: "Si veo una regla, probablemente es cáncer". Técnicamente, es un patrón que funcionó en los datos de entrenamiento. Pero no es comprender el cáncer. Es tomar un atajo.

Esto sucede todo el tiempo:

Ejemplos de sesgos y atajos aprendidos por la IA

⚠️ Una IA de contratación aprendió que los currículums con el nombre "Jared" tenían más probabilidades de ser contratados (porque los datos de entrenamiento contenían decisiones humanas sesgadas)
⚠️ Un sistema de reconocimiento facial funcionaba mejor con hombres blancos (porque eran quienes estaban sobrerrepresentados en las fotos de entrenamiento)
⚠️ Un sistema de aprobación de préstamos discriminaba a ciertos barrios (porque aprendió de datos de préstamos históricamente sesgados)

El ordenador encuentra patrones en los datos que le das. Si los datos tienen sesgos, aprende los sesgos. Si los datos tienen atajos, aprende los atajos. No tiene mejor criterio. Simplemente encuentra lo que funciona en los ejemplos que vio. Por eso el machine learning necesita una atención cuidadosa. Es potente, pero no es sabio.

Las dos formas de practicar (Tradicional vs. Diferente)

¿Recuerdas que dije que los ordenadores aprenden ajustando sus conjeturas basándose en los errores? Hay dos formas principales de hacer ese ajuste.

La forma tradicional: Pequeños ajustes a números

Cómo funciona la mayoría de la IA hoy en día

El ordenador tiene millones de pequeños diales (llamados pesos). Cada dial está ajustado a un número específico.

Cuando el ordenador comete un error, determina qué diales girar y en qué dirección. Los gira solo un poquito. Luego hace otra conjetura, comete otro error, y vuelve a girar los diales. Una y otra vez. Después de hacer esto millones de veces, todos esos diales quedan ajustados a números que producen buenas conjeturas.

Lo bueno

Funciona muy bien. Puede encontrar patrones increíblemente complejos. Está probado y es fiable.

Lo malo

Consume una enorme cantidad de potencia computacional. Entrenar estos sistemas cuesta millones de dólares en electricidad. Y cuando termina, tienes millones de ajustes de diales, pero no puedes explicar realmente por qué están ajustados a esos números específicos. Es una caja negra.

Una forma diferente: Encontrar reglas en lugar de números

Cómo funcionan algunos sistemas más nuevos

Algunos sistemas (como los que construyen empresas como Dweve) funcionan de manera diferente. En lugar de ajustar millones de diales numéricos, buscan reglas lógicas.

En lugar de aprender "el peso 47 debería ser 0.8234", aprenden "si el correo tiene palabras urgentes Y proviene de un remitente desconocido Y tiene enlaces extraños, entonces probablemente es spam".

Se parece más a cómo aprenden los humanos

No tienes números en la cabeza. Tienes reglas prácticas: "Si el pan huele agrio, probablemente esté malo. Si el cielo está oscuro y cargado, podría llover".

Lo bueno

Puedes explicar realmente las decisiones. "El correo se marcó como spam porque coincidía con estos tres patrones". También es mucho más eficiente. Consume mucha menos energía.

Lo malo

No todos los problemas funcionan bien con reglas. Algunas cosas realmente necesitan esos millones de pequeños ajustes numéricos.

Ninguna forma es siempre mejor. Son herramientas. Usas la adecuada para cada trabajo.

Cómo se ve realmente el proceso de aprendizaje

Dónde funciona esto realmente en tu vida

Déjame mostrarte dónde ya estás usando el machine learning todos los días, probablemente sin darte cuenta.

⏰ Tu alarma matutina

La alarma de tu teléfono probablemente tiene una función que aumenta el volumen lentamente. Eso es simple. Pero algunos teléfonos también aprenden cuándo tiendes a despertarte de forma natural y sugieren mejores horas para la alarma. El machine learning notó: "Siempre pospones la alarma de las 6:00 AM pero te despiertas de forma natural a las 6:30. Déjame sugerirte las 6:30 en su lugar".

🚗 Tu trayecto al trabajo

Las aplicaciones de mapas predicen el tráfico. ¿Cómo? Aprendieron de millones de viajes: "Los martes por la mañana, esta autopista se congestiona sobre las 7:45. Cuando llueve, esta ruta se ralentiza 15 minutos". Patrones encontrados a partir de datos.

📧 Tu correo electrónico

¿Cada correo de spam que no llega a tu bandeja de entrada? Machine learning. ¿Cada correo clasificado automáticamente en carpetas? Machine learning. Tu aplicación de correo aprendió de millones de ejemplos cómo es el spam y qué es importante para ti específicamente.

🎬 Tu entretenimiento

Netflix sugiriendo series. Spotify creando listas de reproducción para ti. YouTube recomendando vídeos. Todo es machine learning. Aprendieron: "A la gente que vio estas tres series normalmente también le gusta esta cuarta. A la gente que escucha a este artista normalmente le gustan estos otros artistas".

🛒 Tus compras

"Los clientes que compraron esto también compraron..." Machine learning. "También podría gustarte..." Machine learning. Incluso los precios que ves podrían ser ajustados por machine learning basándose en patrones de demanda.

🔒 Tu seguridad

¿La compañía de tu tarjeta de crédito bloqueando una transacción sospechosa? El machine learning detectó un patrón: "Este cargo no coincide con el comportamiento de gasto normal de esta persona. Podría ser un fraude".

Todos estos sistemas aprendieron de ejemplos. Encontraron patrones. Mejoraron con la práctica. Eso es el machine learning, presente en tu vida docenas de veces al día.

Los límites honestos (Lo que no puede hacer)

El machine learning es potente, pero no es magia. Déjame ser muy honesto sobre lo que no puede hacer.

No puede aprender sin ejemplos

Necesitas datos. Muchos. ¿Quieres enseñar a un ordenador a reconocer una enfermedad rara? Necesitas miles de ejemplos de esa enfermedad. ¿No los tienes? No puedes entrenar el sistema. Es así de simple.

No puede entender el contexto como los humanos

Un humano ve una señal de "STOP" cubierta de nieve y sabe que sigue siendo una señal de stop. Un ordenador podría no reconocerla porque todos sus ejemplos de entrenamiento mostraban señales de stop limpias y visibles. Aprendió el patrón de las señales de stop perfectas, no el concepto de "detenerse".

No puede explicar su razonamiento (normalmente)

Pregúntale a un médico por qué cree que tienes la gripe: "Tienes fiebre, dolores corporales y es temporada de gripe". Un razonamiento claro.

Pregúntale a la mayoría de los sistemas de IA por qué tomaron una decisión: "Porque estos 47 millones de números están ajustados a estos valores específicos". No es útil.

Aprenderá tus sesgos

Si lo entrenas con datos sesgados, aprende el sesgo. Si los datos históricos de contratación muestran sesgos contra ciertos grupos, la IA también aprende a ser sesgada. No tiene mejor criterio. Simplemente aprende lo que hay en los datos.

No puede adaptarse a situaciones completamente nuevas

Los humanos son geniales en esto. Nunca has visto una jirafa morada, pero si vieras una, la reconocerías como una jirafa que resulta ser morada.

Un ordenador entrenado con jirafas normales podría confundirse por completo con una morada. No estaba en los datos de entrenamiento. El sistema no sabe cómo generalizar de esa manera.

Estos no son problemas menores. Son fundamentales para cómo funciona el machine learning. Entender estos límites es tan importante como entender sus capacidades.

Lo que necesitas recordar

Si todo esto te parece mucho, esto es lo que realmente importa:

1 El machine learning es práctica con retroalimentación. El ordenador hace conjeturas, comprueba si son correctas, ajusta y repite. Igual que aprenderías cualquier cosa a base de práctica.
2 Existen tres tipos principales. Supervisado (con las respuestas), no supervisado (encontrando patrones por tu cuenta) y por refuerzo (aprendiendo por ensayo y error). Cada uno funciona para problemas diferentes.
3 Encuentra patrones, no comprensión. El ordenador no lo "pilla". Simplemente nota que: cuando veo este patrón, la respuesta suele ser esa. Potente, pero no es lo mismo que la comprensión humana.
4 Lo usas constantemente. Tu correo, tus mapas, tu entretenimiento, tus compras. El machine learning está presente en tu vida docenas de veces al día.
5 Tiene límites reales. Necesita muchos datos. Aprende sesgos. No puede explicarse fácilmente. No generaliza como los humanos. Entender los límites importa tanto como entender las capacidades.
6 Existen diferentes enfoques. La mayoría de la IA ajusta millones de diales numéricos. Algunos sistemas aprenden reglas lógicas en su lugar. Diferentes herramientas para diferentes trabajos.

En resumen

El machine learning no es misterioso. Es solo un ordenador que mejora en algo a base de práctica.

Muéstrale ejemplos. Deja que haga conjeturas. Dile cuándo se equivoca. Observa cómo se ajusta y mejora. Repite miles de veces. Al final, es realmente bueno en la tarea.

No está aprendiendo de la forma en que tú aprendiste a montar en bici, a leer o a hacer amigos. No está desarrollando comprensión, sabiduría o sentido común.

Está encontrando patrones estadísticos en los datos mediante la práctica y el ajuste repetidos. Eso es todo. Pero hecho a una escala que los humanos no pueden igualar, con millones de ejemplos, produce resultados genuinamente útiles.

Tu filtro de spam funciona. Tu asistente de voz te entiende. Tus mapas te guían para evitar el tráfico. Todo porque los ordenadores practicaron con millones de ejemplos hasta que encontraron patrones que funcionan.

La palabra "aprendizaje" hace que suene mágico. La realidad es matemática. Pero esa matemática, practicada a escala, cambia cómo vives tu vida cada día.

Ahora ya sabes cómo funciona. El misterio ha desaparecido. El machine learning es el descubrimiento de patrones a través de la práctica. Un concepto simple. Una ejecución potente. Y lo estás usando ahora mismo, leyendo estas palabras en un dispositivo lleno de sistemas que aprendieron para hacerte la vida más fácil.

Algunas empresas, como Dweve, están explorando diferentes formas de "practicar" más allá de simplemente ajustar diales numéricos. Aprendiendo reglas lógicas en lugar de pesos numéricos. Encontrando restricciones en lugar de parámetros de entrenamiento. Diferentes enfoques para diferentes problemas. Porque el machine learning no tiene por qué ser una solución única para todo.