🎬 如何用 GPT + Gemini 2.5 Pro 写出
「能被 Sora 复刻」的电影级提示词?(收藏级干货)
每个做 AI 视频的人迟早会问一个问题:
怎么写出能让 Sora 真正复刻大片的提示词?
这不只是 prompt,而是一套从视觉设计、镜头语言到技术规避的系统工程。
今天我给你一整套【Sora 视频拆解 + Prompt Template】,基于Sora2 和 Gemini 2.5 Pro系统提示词重构,含示例 + 全字段结构,适合:
✔️ 想复刻好莱坞电影感画面
✔️ 想用 Sora 打广告/做短片/构图练习
✔️ 想让 Gemini 帮你写出每个镜头的构图、打光、动作、道具等完整提示词
📦 核心结构:Sora 复刻不是一句 Prompt,而是这几块拼图组成:
Prompt + Style + Camera + Lighting + Mood + Movement + Composition + Safety + Negatives
🎯 想生成“电影感”镜头,得让 AI 理解:
人在做什么(主体动作 + 表情)
镜头如何运作(推拉摇移 + 焦距 + 景深)
画面怎么构图(主角在哪一侧、站/坐/走)
光从哪来(软光/背光/霓虹光)
情绪是什么(孤独/紧张/欢乐)
不该出现什么(品牌误判/动态错误/皮肤漂移)
🧠 Gemini 的正确用法:不是一句“帮我写 prompt”,而是:
“请基于以下人物 + 分镜 + 情绪,生成符合 Sora 视频生成的逐镜头提示词,格式包括 prompt/style/lighting/camera movement 等字段。”
这样它才能输出机器可读的结构化提示词,适配多镜头、10s/30s/60s 的视频生成。
🧪 示例片段(Allscale 商业大片)
{ "meta": { "duration_s": 10.10, "resolution": "1080x1920", "aspect_ratio": "9:16", "fps": 30, "fps_confidence": 0.95, "scene_overview": "一支高能、快节奏的金融科技广告。
视频由多个地点、不同种族的用户的近景镜头快速拼接而成,他们接力说出产品的优点。
广告强调了全球化、高效和去中心化的特性,最后以动态分屏效果收尾,整体风格现代、精致且充满活力。", "dominant_palette": "多元化且具有电影感,每个镜头都有独立的色彩风格(科技蓝、黄昏紫、沙滩暖色调等)。", "audio_presence": true, "tolerances": { "color_deltaE_max": 2.5, "position_px_max": 5, "time_offset_s_max": 0.03, "scale_variance_pct_max": 2.0 } }, "shots": [ { "shot_id": "S1", "time_in_s": 0.00, "time_out_s": 0.90, "duration_s": 0.90, "transition_in": "cut", "transition_out": "cut", "camera": { "shot_size": "MCU", "movement": "static", "speed_style": "normal", "lens_estimate": "标准镜头 (50mm)", "depth_of_field": "浅" }, "composition": { "framing": "center", "subject_count": 1, "key_positions_px": null }, "lighting": { "type": "soft key light", "intensity": "medium", "practicals": "电脑屏幕或LED灯", "time_of_day": "indoor/night" }, "color": { "palette": "深灰、蓝绿色调", "contrast_level": "medium", "grade_style": "modern, tech" }, "subjects": "一位戴着眼镜的年轻东亚男性,穿着灰色连帽衫。", "actions": "他直视镜头,自信地说出台词。", "environment": "一个充满科技感的办公室或房间,背景有蓝绿色的灯光。", "props": null, "text_on_screen": "No KYC.", "audio": { "music": "有节奏的电子背景音乐", "sfx": "轻微的 whoosh 音效", "dialogue": "No KYC." }, "sora_prompt": { "prompt": "Cinematic medium close-up of a young East Asian man with glasses, wearing a gray hoodie. He speaks directly to the camera with a confident expression. The background is a modern, dark office with soft teal and blue lighting. Shot with a shallow depth of field.", "style": "polished, modern tech commercial", "camera_movement": "static", "lighting": "soft, moody, with teal backlighting", "duration": 0.9, "aspect_ratio": "9:16", "mood": "confident, direct, professional
📌 配合的负面约束:
1、artifact_suppression: 避免皮肤闪烁、手指变形、纹理断裂
2、physics_consistency: 风向与头发一致、光影与动作同步
3、safety_notes: 无武器特写、不包含危险模仿
🧩 系统级结构:我们还用到了这套 Prompt Template👇
👉 支持逐镜头/逐秒分析,输出 json、负面设计、结构容差、物理一致性检查等。
🧱 模块包括:
meta:时长 / 分辨率 / 色调 / 容差(ΔE、位置、时间)
shots[]:每个镜头的构图、人物、光、声音、动作、Sora prompt 等
sec_timeline[]:每秒摘要
negative_design:全局不应出现的东西
uncertainties:AI 模糊项标注
quality_notes:质量检查与对齐建议
💡 为什么要这么复杂?
因为:
“你想让 AI 当导演,就得先写好剧本 + 镜头设计 + 拍摄手册。”
Sora 本质是视觉编译器,它不理解抽象,它理解的是「镜头语言 + 构图模板 + 光影运算」。
✍️ 推荐搭配:
Gemini → 帮你写分镜剧本 + 镜头 prompt(结构化输出)
SORA直接使用Gemini撰写的json格式来执行每个视频细节
🎁 想要?
📦 评论区见原提示词,主要包含
✅ 结构化提示词
✅ Gemini + Sora 联动提示词工程
#ai #Sora2 #fyp