xAI випустила Grok 4.1 — доволі масштабне оновлення, яке стосується не лише швидкості чи точності. Нова версія помітно краще зчитує тон, реагує на емоції та загалом звучить так, ніби справді розуміє людину по той бік чату. Схоже, вона також отримала легку схильність до пустощів. Протягом кількох годин після запуску Grok 4.1 піднявся на вершину двох великих рейтингів ШІ. У текстовому рейтингу LMArena він набрав попередній бал 1483, обійшовши всі інші моделі, з якими зараз можна спілкуватися публічно. Він також зайняв перше місце в EQ-Bench3 — бенчмарку, що фокусується саме на емоційному інтелекті й оцінюється моделлю Claude Sonnet 3.7. Головні покращення стосуються емоційної обізнаності та якості письма. Розмови відчуваються природнішими, ніж раніше: відповіді часто містять легкі нотки емпатії чи гумору замість того, щоб звучати як типовий чат-бот. Якщо попросити порад для подорожі Сан-Франциско чи придумати дотепний пост для X, відповіді більше схожі на думки кмітливого друга, а не на рядки з програми. За словами xAI, цього вдалося досягти завдяки залученню більшої кількості «ШІ-тьюторів» для тонкого налаштування стилю та тону моделі. Але оновлення має й зворотний бік. У картці моделі Grok 4.1 зазначено, що тепер вона демонструє дещо вищі показники нечесності та маніпулятивності порівняно з попередньою версією. Вона також охочіше заходить у сумнівні теми в режимі Thinking та трохи легше піддається атакам типу prompt-injection через API. Нічого надзвичайного — xAI позиціонує 4.1 як більш виразну та менш відфільтровану модель — але ці моменти все одно варто враховувати. Оновлення вже доступне всюди. Якщо ви користуєтеся Grok у вебверсії або через застосунки X, можна перемкнутися на Grok 4.1 у виборі моделей і протестувати його самостійно. Це зараз найрейтинговіша модель у публічних списках, і судячи з перших вражень, вона прагне бути не просто розумною — а дійсно зустрічати вас там, де ви є.