Что такое промпт-инжиниринг и почему это профессия будущего. Простыми словами
Промпт-инжиниринг — это процесс создания и последующей оптимизации промптов, то есть запросов и задач для генеративных моделей (нейросетей). Правильно составленный промпт помогает получить более точный и близкий к желаемому результат, поэтому искусство их составления сейчас превращается в отдельную дисциплину на стыке логики, математики, программирования и гуманитарных дисциплин.
Простыми словами, промпт — это инструкция, которую пользователь даёт нейросети: нарисовать картинку, сократить текст, составить контент-план и т. д. Запрос надо составить таким образом, чтобы нейросеть дала ответ, максимально соответствующий вашим ожиданиям.
Эксперты статьи
Роман Душкин, главный архитектор систем искусственного интеллекта НИЯУ МИФИ Катерина Тихомирова, ведущий эксперт лаборатории цифровых технологий в гуманитарных науках НИЯУ МИФИ ______
История термина и профессии
Prompt с английского — это подсказка. И промпт-инжиниринг как «техника подсказок» появилась еще до массового распространения GPT — в направлении обработки текстов на естественном языке (Natural Language Processing, NLP).
Вероятно, первыми термин «промптинг» ввели в 2017 году исследователи из Carnegie Mellon University и National University of Singapore, которые создали большие языковые модели, обученные на промптах.
Промптинг развивался как направление при разработке GPT-2, GPT-3 и последующих версий чат-бота. А в 2022 году появились модели машинного обучения DALL-E 2, Stable Diffusion, Midjourney, которые научились использовать текстовые промпты для создания изображений.
Кто такой промпт-инженер, сколько он зарабатывает
Промпт-инженер — специалист по общению с ИИ. Промпт-инженеры помогают языковым моделям быть полезными для людей.
Официально в России этой профессии не существует — для этого должен быть утверждён профессиональный стандарт. А для этого прошло ещё слишком мало времени с тех пор, как эта специальность в принципе стала актуальной.
Тем не менее вакансии промпт-инженера на рекрутинговых сервисах появляются регулярно. В начале ноября 2024 года на одном из ведущих рекрутинговых сайтов в Москве размещены 10 вакансий с названием «промпт-инженер». Зарплаты: в одном месте это сумма от 80 000 рублей, в другом — от 100 000 до 300 000 рублей на руки в месяц.
До сих пор идут споры, нужна ли эта профессия вообще, или это всё-таки не специализация, а всего лишь навык — такой же, как умение работать с текстовыми редакторами и Excel.
Кто такой промпт-инженер по сути? Это человек, который умеет правильно задавать запросы большой языковой модели. Человек, который пару часов пообщался с ИИ, быстро поймёт, на что модель реагирует, и в конце концов научится задавать ей качественные запросы. оман Душкин главный архитектор систем искусственного интеллекта НИЯУ МИФИ
Эксперт добавил, что часто под промпт-инженером подразумевают человека, пытающегося обходить запреты и выявлять тонкости, т. н. tips and tricks, которые можно использовать в промптинге. Но такого специалиста правильнее называть тестировщиком.
Как стать промпт-инженером
Стать промпт-инженером или просто заниматься промпт-инжинирингом в рамках своей профессии может любой. Часто гуманитарное образование называют одним из преимуществ для этой профессии, но в конкретных компаниях может быть запрос и на высшее техническое образование — в зависимости от конкретных задач, под которые нанимают человека.
Сейчас появилось достаточно много курсов, бесплатных и платных, на которых обучают основам промптинга.
Расширить свои компетенции для этой профессии можно, например, за счёт изучения основ программирования на Python: некоторые работодатели, которые уже разместили вакансии промпт-инженеров, указывают это в требованиях.
Компании также надеются на имеющийся опыт работы с искусственным интеллектом, либо тестировщиком, бизнес-аналитиком и т. д.
Области применения промпт-инжиниринга
Промпт-инжиниринг поможет в генерации текста, изображений, анализе данных и программировании с помощью нейросетей.
В коэволюции выиграет тот, кто принимает и понимает принцип действия новых технологий. В сообществе сейчас часто звучит сленговое «кентавр» — так называют тех, кто использует в своей деятельности ИИ-технологии. То есть, кентавр — это врач+ИИ, водитель+ИИ, преподаватель+ИИ. атерина Тихомирова ведущий эксперт лаборатории цифровых технологий в гуманитарных науках НИЯУ МИФИ
В университетах благодаря промпт-инжинирингу можно быстро составлять планы и учебные программы, индивидуальные образовательные и научные траектории. В строительстве этот навык поможет в проектировании; в соцсетях — в создании иллюстраций, контент-плана и т. д. Большие языковые модели применимы в сельском хозяйстве, фармакологии, гейм-дизайне, музыке — где угодно.
Линейный сотрудник, участвующий в процессах обработки информации, должен при получении задачи спрашивать себя: как мне поможет её решить большая языковая модель или агент на её основе? Руководитель должен ставить вопрос: как поставленную передо мной цель достигнуть при помощи больших языковых моделей? оман Душкин
Навыкам промпт-инженерии можно обучить вообще всех сотрудников, которые работают с информацией. На основе языковых моделей они могут создать интеллектуальных агентов для решения тех или иных задач.
Например, при подготовке презентаций можно пользоваться для ускорения своей работы ботом-художником и ботом, помогающим создавать структуру и наполнять слайды текстами.
Основные принципы промпт-инжиниринга
Основные принципы промпт-инжиниринга зимой 2023–2024 гг. описали в своей статье на основе работы с нейросетью ChatGPT-4/4o трое исследователей из MBZUAI — университета искусственного интеллекта, базирующегося в Абу-Даби. В тексте 26 принципов, объединённые в пять групп.
1. Структурные принципы.
Здесь исследователи, например, рекомендуют: - указывать для нейросети аудиторию, к которой обращён результат (например, «объясни принцип круговорота воды для ученика начальной школы»); - давать ИИ начало мысли, которую нужно продолжить; - использовать только утвердительные конструкции. С этим, к слову, многие не соглашаются, потому что и с отрицательными директивами нейросети справляются; - использовать разделители: «Инструкция», затем «Пример», после этого — «Вопрос».
2. Описание задачи.
В этом разделе мы описываем, что нам нужно и какого результата мы хотим добиться от нейросетки. Исследователи рекомендуют: - давать подсказки: «объясни простыми словами», «используй простой язык», «используй тот же стиль, что и в образце»; - попросить ИИ проверить, насколько беспристрастен ответ, не опирается ли он на стереотипы.
3. Взаимодействие с пользователем.
Языковую модель можно побудить задавать дополнительные вопросы для того, чтобы она получила достаточно информации для необходимого результата. Используйте фразу: «С этого момента я хотел бы, чтобы ты задавала мне вопросы о задаче».
В конце своего общения с ИИ по одной теме можно подытожить всё сделанное до этого, чтобы сгенерировать подробный ответ со всей необходимой информацией.
4. Стиль общения с ИИ.
Исследователи призывают настойчиво требовать от нейросети результата: - пишите «твоя задача», «ты должен». Исследователи даже рекомендуют угрожать и обещать поощрение нейросети, добавляя такие фразы, как «ты будешь оштрафован», или, наоборот, «даю чаевые за лучшее решение»; - не надо быть вежливым: слова «пожалуйста», «будьте добры» можно опустить. Впрочем, и на этот счёт есть другие мнения среди исследователей; - повторяйте определённые слова или фразы несколько раз.
5. Сложные задачи.
Здесь исследователи призывают разбивать наиболее трудные запросы на последовательность простых.
Ещё один «секрет» — в контекстном прогреве. Сначала — предварительная беседа, small talk c ИИ-ботом на заданную тему, а затем — промпт. Это поможет получить хороший результат. атерина Тихомирова
Основные техники промпт-инжиниринга
Главных техник промптинга несколько.
Zero-shot prompting
Это самая распространённая техника: обычный вопрос нейросети, на который она ответит в свободной форме, основываясь на общем представлении о предмете.
One-shot и Few-shot prompting One-shot prompting — когда ИИ получил один пример. Few-shot — когда подсказок несколько.
Покажем, как это работает, на простейшей загадке.
Спрашиваем у нейросети: «Цветок — сколько?» ИИ пытается предположить ответ: «Цветок — одно слово». Это zero-shot prompting.
Теперь используем one-shot prompting: «Роза — четыре, цветок — сколько?» ИИ получил подсказку и сообразил: «Если вы имеете в виду количество букв в слове "цветок", то их шесть».
Несколько подсказок дали бы нейросети ещё больше информации для правильного ответа.
Chain-of-thought prompting
Это «доспрашивание»: получив первый ответ, мы задаём дополнительные вопросы или даём новые данные. Можно добавлять контекст, роли получателей информации и автора.
Например, моно делать так: сначала поставить задачу, потом добавить контекст и детали, затем дать инструкцию, назначить роль и задать стиль и тон.
Self-Consistency Это техника, когда языковая модель проверяет сама себя. Сначала ИИ генерирует ответ, а затем по просьбе пользователя («Проверь согласованность результатов с исходными данными») пересматривает его на согласованность. Generated Knowledge Prompting
Техника подразумевает, что пользователь, получив недостаточный ответ, самостоятельно насыщает языковую модель необходимыми данными для получения более развёрнутого результата.
Используются и более сложные техники: Tree of Thoughts (дерево мыслей), Prompt Chaining (разбивка задачи на подзадачи) и т. д. С развитием больших языковых моделей методов промптинга становится только больше.