Искусственный интеллект LongWriter преодолевает барьер в 10 000 слов, бросая вызов авторам-людям |

Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше

Исследователи из Университета Цинхуа в Пекине создали новую систему искусственного интеллекта, которая может создавать связные тексты объемом более 10 000 слов. Это значительный шаг вперед, который может изменить подход к написанию объемных текстов в различных областях.

Система, описанная в статье под названием «LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs», решает постоянную проблему в технологии ИИ: способность генерировать длинный, высококачественный письменный контент. Эта разработка может иметь далеко идущие последствия для задач, варьирующихся от академического письма до художественной литературы, потенциально изменяя ландшафт создания контента в цифровую эпоху.

Исследовательская группа под руководством Юши Бая обнаружила, что длина выходных данных модели ИИ напрямую коррелирует с длиной текстов, с которыми она сталкивается во время обучения. «Мы обнаружили, что эффективная длина генерации модели по своей сути ограничена образцом, который она видела во время контролируемой тонкой настройки», — объясняют исследователи. Это понимание привело их к созданию «LongWriter-6k» — набора данных из 6000 образцов написания объемом от 2000 до 32000 слов.

Скармливая эту богатую данными диету своей модели ИИ во время обучения, команда увеличила максимальную длину вывода с примерно 2000 слов до более 10 000 слов. Их модель с 9 миллиардами параметров превзошла даже более крупные фирменные модели в задачах генерации длинных текстов.

LongWriter-glm4-9b из @thukeg способен генерировать более 10 000 слов одновременно!?

В статье обозначена проблема современных LLM-программ с длинным контекстом: они могут обрабатывать входные данные длиной до 100 000 токенов, но при этом испытывают трудности с генерацией выходных данных, длина которых превышает 2 000 слов.

В статье предлагается, чтобы… pic.twitter.com/2jfKyIpShK
— Градио (@Gradio) 14 августа 2024 г.

Обоюдоострое перо: возможности и проблемы

Этот прорыв может трансформировать отрасли, зависящие от длинного контента. Издатели могут использовать ИИ для создания первых черновиков книг или отчетов. Маркетинговые агентства могут создавать подробные официальные документы или тематические исследования более эффективно. Компании, занимающиеся образовательными технологиями, могут разрабатывать ИИ-репетиторов, способных создавать комплексные учебные материалы.

Однако эта технология также создает существенные проблемы. Возможность генерировать огромные объемы текста, похожего на человеческий, может усугубить проблемы дезинформации и спама. Создатели контента и журналисты могут столкнуться с возросшей конкуренцией со стороны статей, созданных ИИ. Академическим учреждениям необходимо будет усовершенствовать инструменты обнаружения плагиата для выявления статей, написанных ИИ.

Сравнительная производительность ведущих языковых моделей ИИ, включая проприетарные и с открытым исходным кодом, а также новые модели LongWriter Университета Цинхуа. Таблица показывает, что LongWriter-9B-DPO превосходит другие модели по общим баллам и преуспевает в создании более длинных текстов объемом от 4000 до 20 000 слов. (Источник: github.com)

Этические последствия столь же глубоки. Поскольку текст, сгенерированный ИИ, становится неотличим от написанного человеком контента, вопросы авторства, креативности и интеллектуальной собственности становятся все более сложными. Развитие возможностей ИИ по написанию длинных текстов также может повлиять на языковые навыки человека, потенциально усиливая креативность или приводя к атрофии способностей к письму.

Переписывание будущего: последствия для общества и промышленности

Исследователи открыли исходный код и модели на GitHub, что позволило другим разработчикам использовать их работу. Они также выпустили демонстрационное видео, демонстрирующее, как их модель генерирует связный путеводитель по Китаю на 10 000 слов из простого запроса, подчеркивая потенциал технологии для создания подробного, структурированного контента.

Параллельное сравнение показывает вывод двух языковых моделей ИИ. Слева LongWriter генерирует историю из 7872 слов, а справа стандартная модель GLM-4-9B-Chat генерирует 1896 слов. (Источник: github.com)

По мере того, как ИИ продолжает развиваться, граница между человеческим и машинным текстом все больше размывается. Этот прорыв в генерации длинных текстов представляет собой не просто техническое достижение, но и поворотный момент, который может изменить наши отношения с письменной коммуникацией.

Теперь задача заключается в ответственном использовании этой технологии. Политики, специалисты по этике и технологи должны сотрудничать, чтобы разработать рамки этичного использования контента, созданного ИИ. Возможно, системам образования придется развиваться, делая упор на навыки, которые дополняют, а не конкурируют с возможностями ИИ.

Поскольку мы вступаем в эту новую эру письма с помощью ИИ, письменное слово, долгое время считавшееся исключительно человеческой сферой, вторгается на неизведанную территорию. Последствия этого сдвига, вероятно, найдут отклик в обществе, повлияв на то, как мы создаем, потребляем и ценим письменный контент в ближайшие годы.