Lee la demostración(se abre en una ventana nueva)Lee las observaciones complementarias(se abre en una ventana nueva)
00:0002:38
Escuchar el artículo
9:23
Compartir
Durante casi 80 años, los matemáticos han estudiado una cuestión engañosamente simple: si se pone n puntos en el plano, cuántos pares de puntos pueden ser exactamente distancia 1 ¿separados?
Este es el problema de la distancia planar unitaria, planteado por primera vez por Paul Erdős en 1946. Es una de las preguntas más conocidas en geometría combinatoria, fácil de formular y notablemente difícil de resolver. El libro de 2005 Research Problems in Discrete Geometry, de Brass, Moser y Pach, lo califica como «posiblemente el problema más conocido (y más sencillo de explicar) en geometría combinatoria.» Noga Alon, un destacado combinatorialista de Princeton, lo describe como «uno de los problemas favoritos de Erdős.» Erdős incluso ofreció un premio monetario por resolver este problema.
Hoy compartimos un avance sobre el problema de la distancia unitaria. Desde el trabajo original de Erdős, la creencia predominante ha sido que las construcciones de «cuadrícula» representadas más abajo eran esencialmente óptimas para maximizar el número de pares de distancia unitaria. Un modelo interno de OpenAI ha refutado esta conjetura de larga data, proporcionando una familia infinita de ejemplos que producen una mejora polinómica. La demostración ha sido comprobada por un grupo de matemáticos externos. También han escrito un artículo complementario explicando el argumento y proporcionando más contexto y contexto sobre la importancia del resultado.
El resultado también es notable por cómo se encontró. La demostración provino de un nuevo modelo de razonamiento de propósito general, en lugar de un sistema entrenado específicamente para matemáticas, estructurado para buscar estrategias de demostración o dirigido específicamente al problema de la distancia unitaria. Como parte de un esfuerzo más amplio para probar si los modelos avanzados pueden contribuir a la investigación de vanguardia, lo evaluamos en una colección de problemas de Erdős. En este caso, produjo una demostración que resolvía el problema abierto.
Esta demostración es un hito importante para las comunidades de matemáticas e IA. Marca la primera vez que un problema abierto destacado, central en un subcampo de las matemáticas, se resuelve de forma autónoma por la IA. También demuestra la profundidad del razonamiento que estos sistemas ahora soportan. Las matemáticas proporcionan un banco de pruebas especialmente claro para el razonamiento: los problemas son precisos, se pueden comprobar las demostraciones potenciales, y un argumento largo solo funciona si el razonamiento se mantiene de principio a fin. El método con el que se resolvió el problema también es notable. La demostración aporta ideas inesperadas y sofisticadas de la teoría algebraica de números para aplicar una cuestión geométrica elemental.
El medallista Fields Tim Gowers, escribiendo en el artículo complementario, califica el resultado como «un hito en las matemáticas de IA.» Según el destacado teórico de números Arul Shankar, «En mi opinión, este artículo demuestra que los modelos actuales de IA van más allá de simples ayudantes de los matemáticos humanos: son capaces de tener ideas originales e ingeniosas, y luego llevarlas a cabo hasta hacerlas realidad».
Matemáticos sobre el resultado
1 de 4
“Este ha sido uno de los problemas favoritos de Erdős, le he oído mencionar el problema varias veces en sus clases. Creo que sería justo decir que todos los matemáticos que trabajaron en Geometría Combinatoria pensaron en este problema, y muchos matemáticos de otras áreas dedicaron al menos algo de tiempo a reflexionar sobre ello… La solución del problema mediante el modelo interno de la IA Abierta es, en mi opinión, un logro sobresaliente, resolver un problema abierto de larga data. El hecho de que la respuesta correcta no lo sea n1+o(1) es sorprendente, y la construcción y su análisis aplican herramientas bastante sofisticadas de la teoría algebraica de números de una manera elegante e ingeniosa.»
- Noga Alon
- Tim Gowers
- Arul Shankar
- Jacob Tsimerman
- Noga Alon
- Tim Gowers
- Arul Shankar
- Jacob Tsimerman
La demostración está disponible Aquí(se abre en una ventana nueva). El artículo complementario de matemáticos externos destacados está disponible Aquí(se abre en una ventana nueva). Puedes encontrar una versión abreviada de la cadena de pensamiento del modelo Aquí(se abre en una ventana nueva).
Construcción previamente conocida de muchas distancias unitarias desde una cuadrícula cuadrada reescalada.
El problema de la distancia unitaria
Sea u(n) ser el mayor número posible de pares de distancia unitaria entre n puntos en el avión. Ejemplos que alcanzan una tasa de crecimiento lineal son fáciles de construir: colocación n los puntos en una recta dan n−1 pares, mientras que una cuadrícula cuadrada da aproximadamente 2n pares. La construcción más conocida hasta entonces, procedente de una cuadrícula cuadrada reescalada, resulta ofrecer aún más: n1+C/lo glog(n) para una constante C. Ya que loglog(n) tiende a infinito con n, el término adicional en el exponente tiende a 0, lo que significa que estas construcciones logran un crecimiento solo ligeramente más rápido que las lineales. Durante décadas, se creyó ampliamente que esta tasa era esencialmente la mejor posible, y que ninguna construcción podía mejorar significativamente sobre la cuadrícula cuadrada. En términos técnicos, Erdős conjeturó una cota superior de n1+o(1) en el que el adicional o(1) indica un término que tiende a 0 con n.
Nuestro nuevo resultado refuta esta conjetura. Más precisamente, para infinitos valores de n, la demostración construye configuraciones de n puntos con al menos n1+δ pares de distancia unitaria, para algún exponente fijo δ>0. (La demostración original de IA no da una respuesta explícita δ, pero un próximo refinamiento debido al profesor de matemáticas de Princeton Will Sawin ha demostrado que se puede tomar δ=0.014.)
La historia del problema ayuda a entender por qué el resultado es sorprendente. El límite inferior más conocido había permanecido prácticamente sin cambios desde la construcción original de Erdős en 1946. El mejor límite superior, O(n4/3), data de trabajos de Spencer, Szemerédi y Trotter en 1984, y a pesar de los refinamientos posteriores y trabajos estructurales relacionados de Székely, Katz y Silier, Pach, Raz, Solymosi y otros, el límite superior se ha mantenido esencialmente sin cambios. Como prueba a favor de la conjetura, Matoušek y Alon-Bucić-Sauermann estudiaron el problema de las distancias no euclidianas en el plano y demostraron que «la mayoría» de estas distancias no euclidianas obedecen la conjetura en cierto sentido.
Sorprendentemente, los ingredientes clave de la construcción provienen de una parte muy diferente de las matemáticas conocida como teoría algebraica de números, que estudia conceptos como la factorización en extensiones de los enteros conocidos como cuerpos numéricos algebraicos.
Precisión del problema de distancia unitaria de Erdős en tiempo de pruebaLOG (tiempo de prueba-cálculo)00.10.20.30.40.5pass@1 precisión
Tras verificar la demostración inicial, investigamos la tasa de éxito de nuestros modelos en este problema con diferentes cantidades de cálculo en tiempo de prueba. Aquí se muestran los resultados.
Nuevas técnicas de la teoría algebraica de números
A un nivel general, la demostración comienza con una idea geométrica familiar y la lleva en una dirección inesperada.
La cota inferior original de Erdős puede entenderse a través de los enteros gaussianos: números de la forma a+bi, donde a y b son enteros y i es la raíz cuadrada de −1. Los enteros gaussiano extienden los enteros ordinarios y, como ellos, disfrutan de propiedades de una factorización única en primos. Tales extensiones de los enteros ordinarios o racionales se conocen como cuerpos numéricos algebraicos. El nuevo argumento reemplaza los enteros gaussianos por generalizaciones más complejas de la teoría algebraica de números con simetrías más ricas que pueden crear muchas más diferencias de longitud unitaria.
El argumento preciso utiliza herramientas como torres de campos de clase infinitas y la teoría de Golod–Shafarevich para demostrar que los cuerpos numéricos requeridos para el argumento existen realmente. Estas ideas eran bien conocidas por los teóricos algebraicos de números, pero fue una gran sorpresa que estos conceptos tuvieran implicaciones para cuestiones geométricas en el plano euclidiano.
Qué significa esto para las matemáticas
Este resultado marca un momento importante en la interacción entre IA y matemáticas: un sistema de IA ha resuelto de forma autónoma un problema abierto de larga data en el centro de un campo activo. También ofrece una primera visión de un nuevo tipo de colaboración entre IA y matemáticos humanos. En este caso, el trabajo complementario de matemáticos externos ofrece un panorama sustancialmente más rico que la solución original por sí sola.
Como escribe Thomas Bloom en la nota complementaria:
«Al evaluar la importancia e influencia de una demostración generada por IA, una pregunta que me hago es: ¿nos ha enseñado esto algo nuevo sobre el problema? ¿Entendemos mejor la geometría discreta ahora? Creo que la respuesta es un sí moderado: esto muestra que hay mucho más que decir las construcciones de la teoría numérica sobre este tipo de preguntas de lo que sospechábamos; Además, la teoría de números requerida puede ser muy profunda. Sin duda, muchos teóricos de números algebraicos examinarán detenidamente otros problemas abiertos en geometría discreta en los próximos meses.«
La conexión inesperada entre la teoría algebraica de números y la geometría discreta revelada por la solución es parte de lo que hace que el resultado sea notable. No se limita a resolver una conjetura específica, sino que puede proporcionar a los matemáticos un puente para comenzar a explorar más problemas relacionados.
Bloom también apunta a una posibilidad más amplia:
«Las fronteras del conocimiento son muy agudas, y sin duda los próximos meses y años verán éxitos similares en muchas otras áreas de las matemáticas, donde problemas abiertos de larga duración se resuelven mediante una IA que revela conexiones inesperadas y lleva la maquinaria técnica existente al límite. La IA nos está ayudando a explorar más a fondo la catedral de las matemáticas que hemos construido a lo largo de los siglos; ¿Qué otras maravillas invisibles esperan entre bambalinas?«
Este resultado ofrece un ejemplo prometedor: la IA aporta no solo una solución, sino un descubrimiento matemático cuya importancia se vuelve más clara y rica a través de la comprensión humana posterior.
Por qué esto importa
La conclusión es más grande que este resultado en particular. Un mejor razonamiento matemático puede hacer de la IA un socio de investigación más fuerte: algo que pueda mantener unidas líneas de pensamiento difíciles, conectar ideas entre áreas de conocimiento lejanas, abrir caminos prometedores que los expertos quizá no hubieran priorizado y ayudar a los investigadores a avanzar en problemas que de otro modo serían demasiado complejos o consumirían demasiado tiempo para abordar.
Esas capacidades importan más allá de las matemáticas. Si un modelo puede mantener coherente un argumento complejo, conectar ideas entre áreas de conocimiento distantes y producir trabajos que sobrevivan al escrutinio experto, esas también son habilidades útiles en biología, física, ciencia de materiales, ingeniería y medicina, y forman parte de nuestro camino a largo plazo hacia una investigación más automatizada: sistemas que pueden ayudar a científicos e ingenieros a explorar más ideas y abordar cuestiones técnicas más difíciles.
La IA está a punto de empezar a asumir un papel muy serio en las partes creativas de la investigación y, lo más importante, en la investigación en IA en sí. Aunque este avance no es inesperado, refuerza la urgencia que sentimos por comprender esta próxima fase del desarrollo de la IA, los retos de alinear sistemas muy inteligentes y el futuro de la colaboración humano-IA.
Ese futuro sigue dependiendo del juicio humano. La experiencia se vuelve más valiosa, no menos. La IA puede ayudar a buscar, sugerir y verificar. La gente elige los problemas que importan, interpreta los resultados y decide qué preguntas abordar a continuación.




Deja un comentario