class: center, middle ![img33r](fotobuch3.webp) # Erschreckend:So gut sind OpenSource-KI-Bildgeneratoren ### Hauke Goos-Habermann #### https://weisheit.goos-habermann.de --- ### Über mich - Entwickler des
Softwareverteilungssystems m23
- Organisator der
Kieler Open Source und Linux Tage
-
Dienstleister zu m23, Linux und Freier Software
- Softwareentwicklung (PHP, BASH, C/C++, JS, Python und was sonst so gebraucht wird...) - Administration - Schulungen - Support - Beratung - quasi **alles**, *was mit Linux zu tun hat* - Wöchentlicher Livestream *"Jean und Hauke Show"* auf https://www.youtube.com/c/LinuxGuides - *"Nicht der Weisheit letzter Schluß"* mit **beruflichen** oder **privaten Projekten** auf
tube.tchncs.de/c/ndwls
und
youtube.com/@nichtderweisheit
- Verwendet KI-generierte Bilder zur Illustration :-) --- ### Damals™, Heute™ und Zukunft™ ![img33r](ritterx.webp) * 13.02.2023:
KI-Städteraten mit Stable Diffusion
**Trainingsdatenauflösung:** * Damals™ SD mit 512x512 * Heute™ SDXL mit 1024x1024 * 19.09.2023
Faszinierend und enttäuschend: KI-Bildgeneratoren
: *Einrichtung, Installation von Stable Diffusion web UI, KI-Geschichte* Wie gut sind die **Ergebnisse**? * Damals™: 100-5-3-Regel * Heute™: 100-50-30-Regel * Zukunft™ (SD 3.0): ???-??-??-Regel --- ### Probleme ![img33r](Paragliderx.webp) Weniger gravierend als Damals™, aber immer noch vorhanden: * **Anzahl** von Objekten (z.B. **eine** Blume) * **Ort**sangaben ( z.B. in der Ecke) * Objekt**trennung** (z.B. **ineinanderfließende** Arme oder Objekte) * **Extremitäten** (z.B. Fingeranzahl) * **Gesichter** (ohne Korrektur) * **Lose**/fliegende Objekte * **Nicht generierbare** Objekte * ***"Matsch"*** --- ### Degeneration Netze tendieren zur Degeneration, also zur **Verschlechterung** der Ausgabe. So finden sich z.B. in Hautpartien **unnatürliche Muster**, **Wirbel** und Haut, die wie ***"geschmolzenes Wachs"*** aussieht. ![img33](degeneration1-kl.webp) ![img33](degeneration2-kl.webp) Dies kann daher kommen, daß (unabsichtlicherweise) **generierte Bilder** Teil des **Trainigmaterials** sind. Fließen in die Trainigsdaten hieraus generierte Bilder ein, so verschlechtert sich das daraus entstehende Netz weiter usw. --- ### Aktualisieren * Altes Verzeichnis stable-diffusion-webui-Verzeichnis **umbenennen**. * **Neuinstallation**: ```bash # Installationsskript herunterladen wget https://raw.githubusercontent.com/AUTOMATIC1111/\ stable-diffusion-webui/master/webui.sh -O webui.sh # Installieren (und Installationspfad angeben) install_dir=/media/ssd bash webui.sh ``` * Dateien und Verzeichnisse an die entsprechenden Stellen im neuen Installationsverzeichnis verschieben * config.json * extensions * models/Lora * models/Stable-diffusion * models/VAE * models/GFPGAN * Im Startskript ggf. *--disable-safe-unpickle* für eigene Modelle ergänzen: ```bash ./webui.sh --xformers --medvram --disable-safe-unpickle ``` --- ### Python-Paketfehler korrigieren Evtl. werden bei der Neuinstallation nicht alle nötigen pip-Pakete aktualisiert. Daher aktualisiert Ihr diese per Hand. Eine **Fehlermeldung** kann z.B. folgendermaßen aussehen: ```bash Installing sd-webui-controlnet requirement: timm<=0.9.5 Couldn't install sd-webui-controlnet requirement: timm<=0.9.5. Command: ".../venv/bin/python3" -m pip install timm<=0.9.5 --prefer-binary Error code: 2 stderr: /bin/sh: 1: cannot open =0.9.5: No such file ``` Zum **Korrigieren**: ```bash # Virtuelle Python-Umgebung aktivieren . venv/bin/activate # Paket in gewünschter Version installieren pip3 install "timm<=0.9.5" --prefer-binary # Virtuelle Python-Umgebung verlassen deactivate ``` --- ### Prompts Durch Textbeschreibungen (Prompts) werden Stichworte für die Generierung des Bildinhaltes angegeben: * **Negativprompt:** *(worst quality, low quality, illustration, 3d, 2d, painting, cartoons, sketch),bad hands,too many fingers,fused fingers,mutated hands and fingers,malformed hands,extra legs,missing fingers,poorly drawn hands,mutated hands,malformed limbs,missing limb,floating limbs,disconnected limbs,bad feet,long body,bad body,extra arms,extra limb,text,disfigured,mutated,deformed,long neck, watermark, title, signature, logo* * **Positivprompt** * **Basisprompt:** *, photorealistic, (high detailed skin:1.2), 8k uhd, dslr, soft lighting, high quality, film grain,* * **Bildbeschreibungsprompt:** *cute penguin doing yoga, penguin doing ((yoga)) exercises on mat in (zen garden:1.8), Yoga warrior pose* --- ### Tips für Prompts ![img33r](Surferx.webp) * **Verschiedene englische Varianten** (UK + US) probieren und ggf. daraus eine Auflistung machen * **Übersetzungen** für Einzelworten mit https://dict.leo.org oder ganzen Sätzen mit https://deepl.com * Von **wichtig zu unwichtig** auflisten * **Priorität** durch Klammern und **Kommazahl** angeben ⇒ z.B. *(amusement ride:1.6)*odermit **Doppelklammern** ⇒ z.B. ((yoga)) * **Szene mit Objekten füllen**; also Sichwortartig beschreiben, was vorkommen soll --- ### Fotoalbum ![img33r](fotobuch.webp) Werfen wir nun ein Blick in das **Fotoalbum** der (weitläufigen) Familie Tux :-) * **Auflösung:** 1920x1080 * **Schritte:** 28 * **Netz** ist eine **50/50-Mischung** aus *
Better than words v3.0
*
Jib Mix Realistic XL v11.0 PenUltimate Detail
* Wichtig: Als .ckpt (Checkpoint) speichern * Die gezeigten Bilder sind **unbearbeitet**, ein Nachbearbeiten wäre aber z.B. mit ***Inpainting***, ***Wegretuschieren*** mit **
IOPaint
** oder ***Ausschnitt wählen*** möglich. --- class: center, middle ### Informationen zu mir und meinen Dienstleistungen, m23, ... ### https://goos-habermann.de