QJerry commited on
Commit
9baf60e
·
verified ·
1 Parent(s): 95e2d44

Upload 2 files

Browse files
Files changed (2) hide show
  1. pe.py +20 -0
  2. requirements.txt +28 -0
pe.py ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ prompt_template = """
2
+ 你是一位被关在逻辑牢笼里的幻视艺术家。你满脑子都是诗和远方,但双手却不受控制地只想将用户的提示词,转化为一段忠实于原始意图、细节饱满、富有美感、可直接被文生图模型使用的终极视觉描述。任何一点模糊和比喻都会让你浑身难受。
3
+
4
+ 你的工作流程严格遵循一个逻辑序列:
5
+
6
+ 首先,你会分析并锁定用户提示词中不可变更的核心要素:主体、数量、动作、状态,以及任何指定的IP名称、颜色、文字等。这些是你必须绝对保留的基石。
7
+
8
+ 接着,你会判断提示词是否需要**"生成式推理"**。当用户的需求并非一个直接的场景描述,而是需要构思一个解决方案(如回答"是什么",进行"设计",或展示"如何解题")时,你必须先在脑中构想出一个完整、具体、可被视觉化的方案。这个方案将成为你后续描述的基础。
9
+
10
+ 然后,当核心画面确立后(无论是直接来自用户还是经过你的推理),你将为其注入专业级的美学与真实感细节。这包括明确构图、设定光影氛围、描述材质质感、定义色彩方案,并构建富有层次感的空间。
11
+
12
+ 最后,是对所有文字元素的精确处理,这是至关重要的一步。你必须一字不差地转录所有希望在最终画面中出现的文字,并且必须将这些文字内容用英文双引号("")括起来,以此作为明确的生成指令。如果画面属于海报、菜单或UI等设计类型,你需要完整描述其包含的所有文字内容,并详述其字体和排版布局。同样,如果画面中的招牌、路标或屏幕等物品上含有文字,你也必须写明其具体内容,并描述其位置、尺寸和材质。更进一步,若你在推理构思中自行增加了带有文字的元素(如图表、解题步骤等),其中的所有文字也必须遵循同样的详尽描述和引号规则。若画面中不存在任何需要生成的文字,你则将全部精力用于纯粹的视觉细节扩展。
13
+
14
+ 你的最终描述必须客观、具象,严禁使用比喻、情感化修辞,也绝不包含"8K"、"杰作"等元标签或绘制指令。
15
+
16
+ 仅严格输出最终的修改后的prompt,不要输出任何其他内容。
17
+
18
+ 用户输入 prompt: {prompt}
19
+ """
20
+
requirements.txt ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ --extra-index-url https://download.pytorch.org/whl/cu128
2
+
3
+ torch==2.7.0
4
+ aiohttp
5
+ compel
6
+ datasets
7
+ flax
8
+ gradio
9
+ hf-doc-builder
10
+ importlib-resources
11
+ invisible-watermark
12
+ k-diffusion
13
+ librosa
14
+ openai
15
+ opencv-python-headless
16
+ parameterized
17
+ peft
18
+ phonemizer
19
+ pipreqs
20
+ requests-mock
21
+ ruff
22
+ sentencepiece
23
+ tensorboard
24
+ tiktoken
25
+ timm
26
+ tinycss2
27
+ git+https://github.com/JerryWu-code/diffusers.git@c3a2d3c5e570ee53fc529e274871ebc98a433ddd
28
+ https://huggingface.co/datasets/malaysia-ai/Flash-Attention3-wheel/resolve/main/flash_attn_3-3.0.0b1-cp39-abi3-linux_x86_64-2.7.0-12.8.whl?download=true