Делюсь опытом работы с нейросетями, решила написать несколько рекомендаций для улучшения результатов в Stable Diffusion, Fooocus, а также Midjourney или DALL-E.
1. Применение LoRA
Эти мини-модели помогают точно воспроизводить определенные стили, образы или характерные черты. Особенно полезны для создания темных сцен, логотипов и игровых элементов. Оптимальное количество одновременно используемых моделей — не более 5. Коллекция проверенных LoRA доступна на CivitAI
2. Референсы как инструмент
Используйте референсные изображения двумя способами:
— Через ControlNet и Image Prompt: различные препроцессоры позволяют работать с глубиной, позами и масками.
— Для анализа промптов: CLIP Interrogator и Florence-2 помогут создать детализированный запрос на основе примера.
3. Настройка параметров
Экспериментируйте с основными параметрами:
— CFG Scale: баланс между точностью и креативностью (1-2 для реалистичных моделей, 7 для аниме)
— Sampler: попробуйте разные методы обработки (Euler, DPM++ 2M Karras)
— Denoising Strength: регулирует интенсивность изменений при использовании дополнительных инструментов
4. Качество промпта важнее длины
Эффективный промпт должен быть конкретным и четким. Избыточные слова могут испортить результат. Учитывайте особенности модели, акже проверяйте модель на CivitAI на наличие слов-триггеров или функциональных слов. Практика в написании промптов поможет улучшить навыки.
5. Финальная обработка
Постобработка может значительно улучшить качество:
— HighRes Fix: повышение разрешения
— ADetailer: улучшение деталей (лица, руки)
— Inpainting: локальная перегенерация
— Upscale: увеличение размера
— Photoshop: корректировка цвета и устранение дефектов


