Higgsfield Inc
Это не пошаговый рецепт, а способ думать о промпте. Идея в том, чтобы понять логику сильного промпта: что стоит держать под контролем, чем именно ты управляешь через слова и в каких местах всё обычно ломается. Главы открываются по клику, термины объясняются прямо по ходу текста.
Если ты читаешь промпт и не можешь представить описанного — модель тем более не сделает то, что ты задумал.
Модель не «чувствует настроение». Она реагирует на то, что можно увидеть и измерить.
Частая ошибка — описывать впечатление: «эпично», «красиво», «динамично», «дорогой кадр». Для модели это пустые слова — она не знает, как их показать. Сильный промпт состоит из конкретных видимых вещей: что за объект, что он делает, где стоит, куда смотрит, как движется камера, какой свет, какой кадр по крупности.
Простое правило: каждую абстракцию переводи в наблюдаемое. Не «напряжённая сцена», а «человек замирает, медленно сжимает кулак, свет только сбоку, лицо наполовину в тени». Если фразу нельзя «увидеть» — её, скорее всего, надо переписать или убрать.
Промпт — это не один абзац, а набор слоёв, у каждого своя задача.
Держи в голове набор блоков. Не обязательно использовать все — лишние убираем, — но важна логика порядка: сначала контекст сцены, затем референсы и пространство, и только потом стиль и общее настроение. Сначала модель должна понять, что это за кадр и кто в нём, а уже потом — как он «ощущается».
И описывай простым, понятным языком — не литературно-сложно, а чёткими прямыми указаниями. Модель не «читатель», который оценит красивую прозу; ей нужна ясная инструкция. Витиеватые предложения только размывают, что именно ты хочешь увидеть в кадре.
Где нужен контроль — пиши плотно и конкретно (идентичность, блокинг, первый кадр, взгляд, тайминг, оптика, свет, физика, диалог). Где не критично — скупо. Лучше меньше слов, но точных, чем много общих: модель реагирует на конкретику, а не на длину текста — лишние прилагательные только зашумляют сигнал и провоцируют конфликты инструкций.
Картинка задаёт внешность. Текст объясняет, что произойдёт, и лочит важное. Нужны оба.
Референс-изображение — это источник истины по внешности: лицо, тело, пропорции, костюм, текстура, цвет. Его не нужно переписывать прозой — длинное описание внешности только конфликтует с картинкой и сбивает её.
Но Seedance не догадается сам, что важно в сцене. Референс показывает, как выглядит объект, но не говорит: что он делает, как движется, что должно остаться неизменным, на что смотреть. Это всё — работа текста. Поэтому связка такая:
То есть важные для кадра вещи нужно проговорить словами, даже если они «вроде есть» на рефе — иначе модель может их потерять или переврать (особенно мелкий текст и логотипы). Описание персонажа держи минимальным, по формуле:
@TAG: возраст + роль/телосложение + текущее состояние + уникальные видимые признаки + критичные для действия детали + голос (только если есть реплика). 100% matches the reference.
@char_W1) — это «ручка» прикреплённого референса; пишешь её прямо в промпте там, где объект должен появиться. Правило: не указывай тег в кадре, где этого объекта нет (например тащишь персонажа из прошлого кадра по привычке) — иначе модель попытается впихнуть его в кадр.Где все стоят и куда смотрят — это надо сказать прямо, а не надеяться, что модель угадает.
within 1 meter, touching, back against the wall, hand on the door handle, at the kerb edge.Реши заранее, какой режим нужен под задачу — это разные инструменты.
Когда нужен точный контроль кадра — бери один непрерывный кадр (oner) или мультишот, где каждый кат описан явно: длительность, камера, кто в первом кадре, блокинг, действие, тип склейки. Здесь модель не должна сама придумывать лишние склейки — это сбивает преемственность.
0.0s to 1.0s 1.0s HARD CUT 1.0s to 3.0s
Не давай модели «изобретать» лишние склейки. Полезный лок: каждый сегмент — один непрерывный кадр, склейки только в заданных точках, камера сама не режет. При внутренних катах держи преемственность: тот же набор персонажей, та же геометрия, направление экрана, взгляд, лево/право, свет, костюм, состояние реквизита.
HARD CUT (жёсткая), SMASH CUT, MATCH CUT, INSERT CUT, REVERSE CUT, WHIP CUT. Фейды / кроссфейды / диссолвы — только если прямо попросили.
Два рычага задают «как снято»: крупность кадра (сколько влезает) и угол обзора объектива. Seedance заметно лучше реагирует на угол обзора в градусах (диагональный FOV), чем на миллиметры, поэтому в промпт идут именно градусы. Мм-эквивалент держим рядом как привычный ориентир: если ты привык думать «полтинник» или «портретник», просто смотри в соседнюю колонку.
| Сокр. | Что это | Что в кадре |
|---|---|---|
| ECU | Extreme Close-Up | деталь: глаза, кнопка, фара, кисть руки |
| CU | Close-Up | лицо целиком / один элемент крупно |
| MCU | Medium Close-Up | голова и плечи |
| MS | Medium Shot | примерно по пояс |
| MW / WS | Medium Wide / Wide | фигура целиком + окружение |
| EWS | Extreme Wide / establishing | общий план, масштаб, локация |
| Угол | ≈ мм | Эффект | Для чего |
|---|---|---|---|
| 107° ультраширик | ~16mm | передний план нависает крупно, пространство видно до самых краёв, прямые линии остаются прямыми | иммерсия, тесные интерьеры, объект вплотную к камере |
| 84° широкий | ~24mm | крупный передний план, окружение читается по всему кадру, лёгкое расширение перспективы | экшен, общие планы, «внутри сцены» |
| 47° нормаль | ~50mm | естественная перспектива, «как видит глаз», без искажений | документальный реализм, нейтральные кадры |
| 29° короткий телевик | ~85mm | компрессия фона, мягкое боке, субъект отделён от фона | портрет, эмоция, изоляция героя |
| 18° телевик | ~135mm | сильная компрессия, фон сплющен и придвинут, «подглядывание издалека» | наблюдение, эффект дистанции, спорт |
| 8° сверхдлинный телевик | ~300mm | экстремальная компрессия, фон в размытую цветовую заливку, резкий только субъект; нужна окклюзия переднего плана | слежка, наблюдение из засады, дикая природа |
Связывай крупность и угол в одну формулировку — так это и пишут в шот-листах: MEDIUM 84°, ECU 29°, TELEPHOTO 18° slow tracking. Описывай ещё и наблюдаемый результат: «фон компрессирован и размыт в мягкое боке, субъект резкий» (телевик) или «передний план крупный, окружение видно до краёв» (широкий) — это управляет картинкой надёжнее, чем сами цифры.
Камера — это человек или риг с физикой, а не абстрактное «движение».
Описывай движение как поведение оператора: высота, дистанция, угол, сторона относительно света, размер субъекта, размещение в кадре, характер движения, фокус, глубина резкости.
Хендхелд (съёмка с рук) описывай физически: дыхание оператора, микро-оседание, перенос веса, масса камеры на плече, человеческая коррекция. Избегай формулировок «random shake / digital jitter» — это даёт неестественную цифровую дрожь. «Плавность гимбала» и «парение дрона» пиши только если реально этого хочешь.
У всего есть масса. Движение должно иметь причину и следствие.
Закладывай гравитацию, массу, инерцию, трение, контакт, перенос веса, задержку ткани и волос, поток жидкости, поведение частиц (снег/дым/пыль/брызги двигаются по ветру или теплу, накапливаются, оседают по гравитации).
Если движение «плывёт» и выглядит фейково — почти всегда не хватает физической причинности в описании.
Свет — самый сильный рычаг качества. Относись к нему как к жёсткому правилу.
Всегда определяй: основной источник, направление света, сторону камеры относительно света, что в тени / на контуре, яркость фона, приоритет экспозиции, и (если нужно) запрещённый режим провала.
Чего избегать. Плоский фронтальный свет — когда свет бьёт прямо в лицо со стороны камеры — почти всегда выглядит «слопно»: дёшево, плоско, без объёма. На лице всегда должен быть рисунок света (светотень: одна сторона светлее, другая в тени). Это уже сильно поднимает кадр.
Ещё сильнее — контровой свет (contre-jour). Субъект между камерой и более ярким фоном, камера со стороны тени, лицо уходит в тень, деталь читают только мокрые блики, блеск глаз и тонкий контур. Важно понимать разницу: контровой — это не «яркое лицо с каёмкой света по волосам», а именно лицо в тени при ярком фоне. Если прошлые генерации «уплощались» — усиль: «вся сцена экспонирована по контровому, лицо может уйти в тень, силуэт несёт кадр».
Промпт — это запечатанный документ одного кадра. Модель знает только то, что в нём написано.
Ты держишь в голове весь проект: сюжет, прошлые сцены, кто кому кто, что было в предыдущем кадре. Модель этого не знает. Для неё каждая генерация — чистый лист: нет памяти о прошлых кадрах, нет понимания «общей истории». Поэтому всё, что важно для этого кадра, должно быть прямо в нём; а всё, что относится к другим кадрам или к твоему внутреннему контексту, — только мешает.
Внутрь не тащим: номера сцен, заголовки сценария, пересказ прошлых сцен, неиспользуемые теги/персонажей, формулировки «как раньше / continues / as above», людей и предметы, которые лишь упоминались в прошлой реплике, выдуманные ярлыки локаций. Модель не понимает «как раньше» — ей не с чем сравнить, и она либо проигнорирует это, либо нафантазирует. Всё, чего нет в этом кадре видимо или слышимо, — лишнее.
И наоборот: где нужен контроль — пиши плотно и конкретно; где не критично — скупо. Цель — чтобы каждая важная вещь была сказана один раз и ясно, без шума вокруг.
Описывай желаемое состояние, а не называй провал.
Позитивный контроль сильнее негативного. Вместо отдельного блока запретов лучше локально прописать нужное состояние рядом с правилом, которое оно защищает.
Причина простая: формулировка вроде «no rain / no dust» сама подсовывает модели образы дождя и пыли — и они нередко появляются. «clear dry / clean air / clean crisp image» работает чище. Отдельный список негативов — только если он действительно нужен.
Промпт редко рождается готовым в голове. Строй его в диалоге с моделью, а не «вслепую».
Когда промпт пишется через LLM, не вываливай сырую идею в надежде на телепатию. Постоянно сверяйся: проговаривай задумку и прямо проси модель задать тебе уточняющие вопросы по тому, что осталось недосказанным — блокинг, ракурс, свет, тайминг, поведение и эмоция персонажа, что в первом кадре, чем заканчивается.
Логика простая: любая двусмысленность в твоей идее — это место, где модель «додумает» за тебя, и часто не то, что ты имел в виду. Лучше закрыть такие дыры на этапе обсуждения (пара реплик), чем ловить «мимо» после генерации.
Стиль поддерживает контроль, а не заменяет его. Поэтому он идёт в самом конце промпта.
Сначала — всё, что определяет кадр: контекст, референсы, блокинг, оптика, движение, физика, свет. Стиль и эстетику добавляй последним слоем: он задаёт «фактуру» картинки, но не должен подменять собой постановку. Если поставить стиль вперёд, модель цепляется за «красивость» и теряет управление кадром.
Пиши стиль коротко — компактными якорями, а не длинными «синефильскими» цепочками, которые только зашумляют сигнал.
Kodak Vision3 500T, naturalistic low-key backlit silhouette, real film grain, grounded physical cinema texture.
Компактные якоря-ориентиры (по одному, не списком из десяти): Lubezki natural-light handheld, Deakins controlled silhouette, Cuarón intimate wide.
И отдельно про запреты в стиле: не выноси их в отдельный блок «NEGATIVE: …». Нужное состояние описывай позитивно и локально, рядом с тем, что оно защищает (подробно — в главе 11).
Один реальный промпт целиком — и зачем в нём написана каждая часть.
Сцена: ночью оранжевый McLaren W1 мчит по корейской эстакаде вдоль идущего рядом скоростного поезда; из окна поезда за машиной наблюдает ребёнок, показанный силуэтом. Три кадра, 15 секунд. Сначала сам промпт, затем разбор по блокам.
SCENE CONTEXT A papaya-orange McLaren W1 races along an elevated Korean highway at night beside a parallel high-speed railway. Three shots: a whip up to the car as it catches the head of a bullet train, a view from inside the train window as a child watches the car accelerate away, and an energetic move on the car. Clear dry night. ACTIVE REFERENCES @char_W1_one — McLaren W1 hypercar, papaya-orange bodywork with gloss-black roof, accents and aero, thin hooked split LED headlights glowing white, large black active rear wing, deep front splitter, side intakes, black five-spoke wheels with orange brake calipers, "W1" lettering on the plates. All details and "W1" badges stay exactly as in the reference, clean, crisp and identical. 100% matches the reference. @japanise_track — an elevated Korean highway at night on concrete pillars through a dense downtown of high-rise towers, dashed white lane lines, guardrails and mesh fencing, tall lit towers; running parallel on its own viaduct set slightly higher, a high-speed railway with a sleek white-and-blue Korean KTX bullet train (streamlined white body, blue and light-blue stripes, tapered salmon-nose front). Cold white and blue-white lamps, deep shadows, dry asphalt. All signage and gantry surfaces are smooth, blank and plain. 100% matches the reference. FORMAT MODE Controlled three-segment sequence with HARD CUTS at 5.0s and 11.0s, total 15s. Each segment is one single continuous shot; the only cuts are these specified HARD CUTS — the camera does not cut by itself. Real-time motion. Clear dry night. Diegetic sound only. OPTICS LENS LOCK SEG 1 = 47° standard normal, low whip rising to a profile tracking shot. LENS LOCK SEG 2 = 29° short telephoto, train-window interior 3/4 view. LENS LOCK SEG 3 = 47° standard normal, energetic orbit and whip. No drift mid-segment. FIRST FRAME AND SPATIAL BLOCKING Seg 1: low near the asphalt, @char_W1_one entering from screen-left in profile, the bullet train's nose just ahead on the higher parallel viaduct behind it. Seg 2: interior of the bullet train, a child silhouette in profile at the left of the window, the highway and car seen out the window at a 3/4 diagonal. Seg 3: tight on @char_W1_one for an energetic move. ACTION TIMING 0.0s to 5.0s — whip to profile. The camera starts low down on the asphalt and whips up fast to a side-on profile of @char_W1_one as it drives left to right and surges forward, catching up to the head of the white-and-blue KTX bullet train, which runs on the parallel viaduct slightly above and level with the car in the background. Strong weighted whip, energetic, motion blur on the background. 5.0s HARD CUT 5.0s to 11.0s — train-window POV. From inside the bullet train: at the left edge of the window a small child stands in profile as a dark silhouette, face mostly hidden. The camera looks out through the window at a 3/4 diagonal angle onto the highway below, where @char_W1_one is visible. The child notices the car and leans in closer to the glass to watch it; then the car accelerates hard, surging forward and pulling out of the window frame until it is gone from view, and the child turns his head, following it with his gaze. Calm, composed, gentle reflections on the glass. 11.0s HARD CUT 11.0s to 15.0s — energetic move. Camera whips in tight and fast on @char_W1_one, a hard aggressive orbit and whip as it powers along the highway, strong weighted shake and heavy motion blur, the lights smearing past. PHYSICS Car carries real mass and downforce, planted and heavy, surging with real acceleration as it pulls ahead. Tyres grip the dry asphalt in clean air, wheels with rotation blur. The bullet train moves with real mass and speed on its rails. The child moves subtly and naturally as he leans to the window and turns to follow the car. Cold lamp light and reflections crawl over the glossy orange-and-black bodywork and the train. Realistic motion blur on the energetic shots; camera shake there is weighted, physical and mechanical. The train-window shot stays calm and composed. LIGHTING Deep dark night, near-black sky, cold white and blue-white lamps, walls of cool glowing tower windows, deep shadows, faint night haze. The car's split LED headlights glow bright white. Cool light reflects over the glossy orange-and-black bodywork and the train. AUDIO Screaming engine dopplering and surging, tyres on dry asphalt, the whoosh of the bullet train, faint city hum. Diegetic sound only. POSITIVE LOCKS Clear dry night throughout. Each segment is one continuous shot cut only at the specified HARD CUTS; the camera never cuts on its own. The car drives on the right side of the road, left to right. Segment 1 is a low whip rising to a profile of the car as it catches the head of the bullet train. Segment 2 is a 3/4 diagonal view out the train window: a child in profile as a dark silhouette at the left, face mostly hidden, leans in to watch the car, then the car accelerates out of the window frame and the child follows it with his gaze. The KTX train is the white-and-blue Korean bullet train. All signage and gantry surfaces stay smooth, blank and plain. All of @char_W1_one's details and "W1" badges stay exactly as in the reference. No film grain, clean crisp image.
CINEDANCE
S.CH.