Современные модели искусственного интеллекта, такие как OpenAI GPT-5, сочетают в себе две ключевые функции: память и рассуждение. Однако исследователи из Goodfire.ai сделали прорывное открытие, разделив эти функции на архитектурном уровне. В этой статье мы разберём, что это значит для будущего ИИ, какие проблемы это решает и как это может повлиять на разработку новых моделей. Читатель узнает о механизмах работы памяти и рассуждений, а также о практических последствиях этого открытия.

Разделение памяти и рассуждений: ключевые открытия

Архитектурные различия

Исследователи обнаружили, что функции памяти и рассуждения в моделях ИИ обращаются к разным зонам архитектуры. Например:

  • Память: удаление соответствующих участков лишило модель 97% способности воспроизводить данные.
  • Рассуждение: модели сохранили способность логически мыслить даже после удаления механизмов памяти.

Примеры из экспериментов

На 22-м слое модели OLMo-7B учёные выяснили, что:

  • 50% компонентов активировались на 23% чаще при обращении к памяти.
  • Верхние 10% компонентов активировались на 26% чаще при работе с новыми задачами.

Почему ИИ плохо справляется с математикой?

Роль памяти в вычислениях

При обработке арифметических операций модели ИИ обращаются к участкам, отвечающим за память. Удаление этих механизмов снижает качество математических операций на 66%. Это объясняет, почему ИИ испытывает трудности с вычислениями без внешних инструментов.

Зазубривание вместо понимания

«Для языковой модели выражение ‘2 + 2 = 4’ — это заученный факт, а не математическая операция.»

Практические приложения открытия

Безопасность и конфиденциальность

Разделение функций позволяет:

  • Удалять защищённые авторским правом материалы и персональные данные.
  • Cохранять способность моделей решать задачи.

Ограничения метода

«Механизмы памяти изучены не до конца, и метод не гарантирует полного исключения конфиденциальных данных.»

«Ландшафт потерь» и управление памятью ИИ

Что такое ландшафт потерь?

«Ландшафт потерь» — это визуализация ошибок и верных прогнозов при изменении настроек модели. Обучение модели можно представить как спуск по этому ландшафту в поисках минимального числа ошибок.

Метод K-FAC: точное управление памятью

«K-FAC позволяет анализировать ландшафт и управлять им, удаляя фрагменты с низкой кривизной и сокращая показатели памяти.»

Это открытие открывает новые горизонты для разработки более безопасных и эффективных моделей ИИ, которые смогут решать сложные задачи без риска утечки конфиденциальной информации.

Поделиться статьей