Новини України
Підбірка новин з українських джерел

Вчені створили ШІ за зразком людського мозку
Вчені розробили новий тип штучного інтелекту, який здатен мислити інакше, ніж більшість великих мовних моделей (LLM), таких як ChatGPT, і показує значно кращі результати у ключових тестах на логічне мислення.
Нова модель, названа ієрархічною моделлю мислення (HRM), створена за прикладом роботи людського мозку, де різні області обробляють інформацію на різних часових масштабах – від мілісекунд до хвилин. Такий підхід дозволяє моделі ефективно інтегрувати дані та приймати рішення більш гнучко та точно.
HRM від компанії Sapient із Сінгапуру має всього 27 мільйонів параметрів і потребує лише 1000 навчальних прикладів, тоді як сучасні LLM використовують мільярди або навіть трильйони параметрів. Для порівняння, новий GPT-5, за оцінками, має від 3 до 5 трильйонів параметрів. Завдяки компактності HRM може працювати швидше та ефективніше.
Під час тестування на відомому бенчмарку ARC-AGI, який оцінює здатність моделей до штучного загального інтелекту (AGI), HRM показала вражаючі результати. У тесті ARC-AGI-1 модель набрала 40,3% порівняно з 34,5% у OpenAI o3-mini-high, 21,2% у Anthropic Claude 3.7 і 15,8% у Deepseek R1. У складнішому ARC-AGI-2 HRM досягла 5%, тоді як o3-mini-high показала 3%, Deepseek R1 – 1,3%, а Claude 3.7 – 0,9%.
Більшість сучасних LLM використовують метод ланцюгового мислення (Chain-of-Thought, CoT), розбиваючи складні задачі на прості проміжні кроки у природній мові. Це емулює людський підхід до рішення проблем, проте має обмеження – високу потребу у даних, повільність та крихкість розбиття задач. HRM працює інакше: вона виконує послідовне мислення за один прохід без явного контролю проміжних кроків, використовуючи два модулі. Високорівневий модуль відповідає за повільне абстрактне планування, а низькорівневий – за швидкі та детальні обчислення.
Модель застосовує метод ітеративного уточнення, коли рішення поступово покращується за кілька коротких циклів мислення. Кожен цикл визначає, чи потрібно продовжувати розв’язання задачі або надати фінальну відповідь. HRM досягла майже ідеальних результатів у складних завданнях, таких як судоку високої складності, та демонструвала відмінні результати у пошуку оптимальних шляхів у лабіринтах, з якими звичайні LLM не справлялися.
Хоча стаття ще не пройшла рецензування, організатори ARC-AGI спробували відтворити результати після того, як автори відкрили модель на GitHub. Вони підтвердили показники HRM, проте виявили, що ключовий приріст продуктивності забезпечив не ієрархічний дизайн, а процес уточнення під час тренування, який раніше був недостатньо задокументований.
Нова ієрархічна модель мислення відкриває перспективи для розвитку ШІ, здатного вирішувати складні завдання швидше та ефективніше, наближаючись до справжнього штучного загального інтелекту.