Вражаюче рішення штучного інтелекту для 80-річної проблеми шокує математиків

Минулого тижня OpenAI вразила математичну спільноту, розкривши, що один з її моделей штучного інтелекту (ШІ) знайшов контрприклад до відомої гіпотези, висунутої легендарним угорським математиком Полем Ердішем у 1946 році.

Проблема планарної одиничної відстані, або гіпотеза Ердіша 90, зацікавила математиків протягом десятиліть.

Новий результат не є простою цікавинкою. Канадський математик Даніель Літ описав його як "перше цікаве рішення, отримане автономно ШІ".

Цей прорив, отриманий за допомогою загального ШІ, а не спеціалізованої моделі для математики, також підкреслює, як ШІ змінює математичні дослідження.

Днями після публікації статті OpenAI, американський математик Вілл Сауїн слідував тим же шляхом, щоб досягти покращеного результату. Також минулого тижня команда з Google DeepMind використала одну зі своїх моделей для вирішення дев'яти менших відкритих проблем, залишених Ердішем.

Представлення одного з варіантів нового найкращого розташування точок на площині з парами, відстань між якими становить одиницю. (Álvaro Lozano-Robledo)

Водночас результати, подібні до цього, показують, в якій математиці сучасні моделі ШІ добрі, а де їхні можливості все ще невизначені.

Точки та лінії

Пол Ердіш був одним з найплідніших математиків двадцятого століття. Він славився тим, що ставив оманливо прості запитання, рішення яких часто вимагали десятиліть зусиль.

На перший погляд, основна проблема здається відносно простою.

Припустимо, у вас є певна кількість точок – назвемо цю кількість n – намальованих на безмежному аркуші паперу. Якщо ви можете розташувати точки будь-яким чином, скільки пар точок можна розмістити на відстані точно в одиницю одна від одної?

Якщо ви спробуєте цю задачу самостійно (на, ймовірно, скінченному аркуші паперу), ви, можливо, швидко схилитеся до квадратної сітки як обіцяючого кандидата на найкраще розташування. Проміжки сітки природно створюють багато пар на регулярній відстані один від одного.

Квадратна сітка інтуїтивно виглядає як хороше рішення для проблеми планарної одиничної відстані. (OpenAI)

Ця інтуїція вплинула на багато ранніх думок про проблему. Як кількість точок зростає, подібні до сітки розташування продовжують здаватися надзвичайно ефективними.

Протягом десятиліть вважалося, що ці дуже регулярні структури є найкращими.

Сам Ердіш припустив, що жодна конструкція не може суттєво покращити ці інтуїтивні розташування, навіть для надзвичайно великої кількості точок.

(Новий найкращий результат, отриманий Сауїном, повідомляється, що починає давати покращення лише для близько 10^2000000 точок – це один, за яким слідують два мільйони нулів.)

Протягом 80 років математики намагалися довести Ердіша або правим, або помилковим. Їхні зусилля пов'язали цю проблему з іншими областями математики, такими як геометрія інцидентів, теорія графів і екстремальна комбинаторика.

Хоча повне доведення залишалося недосяжним, існувало загальне відчуття, що гіпотеза Ердіша, ймовірно, є правдою.

Однак нещодавній прорив OpenAI довів інтуїцію Ердіша неправильною. Новий результат використовує інструменти з області математики, званої алгебраїчною теорією чисел, щоб показати, що існують шаблони точок, які включають набагато більше пар одиничної відстані, ніж квадратна сітка, для безмежної кількості значень n.

Без вагань

У статті, опублікованій OpenAI разом з новою статтею, кілька провідних математиків прокоментували результат.

Лауреат медалі Філдса Тімоті Гоувз зазначив, що якби людський дослідник подав цю статтю з цим результатом до престижного журналу Annals of Mathematics, він би рекомендував публікацію "без жодних вагань".

Він також додав, що жодне попереднє доведення, отримане ШІ, не наближалося до цього рівня складності.

Цей прорив також представляє першу велику математичну відкриту проблему, вирішену за допомогою ШІ з мінімальним людським втручанням, окрім початкового запиту. Супутня стаття показує запит, наданий моделі, а також опис "ланцюга думок", проведеного моделлю.

Це відновило ширші питання про можливості ШІ допомагати в математичних дослідженнях.

Три ключі до математичних досліджень

Дослідники-математики вже давно використовують комп'ютери, але їхня робота рідко керується лише обчисленнями.

Більшість великих проривів виникають з делікатного поєднання трьох речей: експертизи, розвинутої протягом років, тривалих зусиль, щоб творчо застосувати цю експертизу для дослідження ідей (багато з яких виявляються мертвими кінцями), і випадкових концептуальних стрибків, які раптово реорганізують розуміння проблеми.

Перші два – це сфери, в яких моделі ШІ досягають успіху: як зазначив Гоувз, великі мовні моделі, такі як ChatGPT, мають "енциклопедичні знання з математики".

Більше того, вони можуть слідувати величезній кількості спекулятивних ліній розслідування, навіть тих, які навряд чи приведуть до чогось, без людських часових обмежень.

Останнє, здається, стало ключем до успіху тут. У ретроспективі, експерт, якому дано невелику кількість підказок, ймовірно, зміг би досягти того ж доведення.

Багато ідей, необхідних для доведення, вже були присутні в літературі, і для таких ідей або не потрібна підказка, оскільки експерт знає про цю частину літератури, або достатньо буде дуже загальної підказки "погляньте на це".

Моменти осяяння

Складніше питання полягає в тому, наскільки багато ШІ може сприяти справжнім концептуальним стрибкам. Ці гострі моменти інсайту, коли момент осяяння переосмислює проблему зовсім новим способом, часто вважаються найлюдською частиною математики.

Ці стрибки важко формалізувати і ще важче передбачити. Залишається незрозумілим, чи можуть моделі ШІ їх відтворити, навіть з нещодавніми досягненнями.

Те, що очевидно, це те, що моделі ШІ викликають значні зміни в способі відкриття математики.

Протягом століть прогрес у математиці залежав майже виключно від людської творчості та наполегливості.

Тепер, вперше, дослідники працюють поряд із системами, здатними автономно досліджувати величезні простори ідей і вносити свій внесок у проблеми, які колись вважалися доступними лише людському інсайту.

Цікавий факт

Гіпотеза Ердіша 90 є однією з найвідоміших відкритих проблем у математиці, і її розв'язання може мати значний вплив на різні галузі, включаючи теорію графів і комбінаторику.

Новини України