Современные модели искусственного интеллекта, такие как OpenAI GPT-5, сочетают в себе две ключевые функции: память и рассуждение. Однако исследователи из Goodfire.ai сделали прорывное открытие, разделив эти функции на архитектурном уровне. В этой статье мы разберём, что это значит для будущего ИИ, какие проблемы это решает и как это может повлиять на разработку новых моделей. Читатель узнает о механизмах работы памяти и рассуждений, а также о практических последствиях этого открытия.
Разделение памяти и рассуждений: ключевые открытия
Архитектурные различия
Исследователи обнаружили, что функции памяти и рассуждения в моделях ИИ обращаются к разным зонам архитектуры. Например:
- Память: удаление соответствующих участков лишило модель 97% способности воспроизводить данные.
- Рассуждение: модели сохранили способность логически мыслить даже после удаления механизмов памяти.
Примеры из экспериментов
На 22-м слое модели OLMo-7B учёные выяснили, что:
- 50% компонентов активировались на 23% чаще при обращении к памяти.
- Верхние 10% компонентов активировались на 26% чаще при работе с новыми задачами.
Почему ИИ плохо справляется с математикой?
Роль памяти в вычислениях
При обработке арифметических операций модели ИИ обращаются к участкам, отвечающим за память. Удаление этих механизмов снижает качество математических операций на 66%. Это объясняет, почему ИИ испытывает трудности с вычислениями без внешних инструментов.
Зазубривание вместо понимания
«Для языковой модели выражение ‘2 + 2 = 4’ — это заученный факт, а не математическая операция.»
Практические приложения открытия
Безопасность и конфиденциальность
Разделение функций позволяет:
- Удалять защищённые авторским правом материалы и персональные данные.
- Cохранять способность моделей решать задачи.
Ограничения метода
«Механизмы памяти изучены не до конца, и метод не гарантирует полного исключения конфиденциальных данных.»
«Ландшафт потерь» и управление памятью ИИ
Что такое ландшафт потерь?
«Ландшафт потерь» — это визуализация ошибок и верных прогнозов при изменении настроек модели. Обучение модели можно представить как спуск по этому ландшафту в поисках минимального числа ошибок.
Метод K-FAC: точное управление памятью
«K-FAC позволяет анализировать ландшафт и управлять им, удаляя фрагменты с низкой кривизной и сокращая показатели памяти.»
Это открытие открывает новые горизонты для разработки более безопасных и эффективных моделей ИИ, которые смогут решать сложные задачи без риска утечки конфиденциальной информации.