תוכן עניינים

כמוכם, גם אני לא אוהב ששולחים לי שטויות. לכן אני משתף רק מה שנראה לי מעניין מספיק. תרשמו, מקסימום לא תאהבו :)

וואי וואי, איזה כיף שהצטרפת!
בפעם הבאה שיוצא ניוזלטר (שזה אחת לשבוע, או כשיש משהו מעניין ממש), אתם תקבלו אותו ישר למייל שלכם :)
משהו לא מסתדר. אולי המייל לא תקין?
תבדקו ותנסו שוב.

למי שלא מכיר בכלל מה זה מידג'רני: זה מה שאתם צריכים לקרוא (המדריך למידג'רני חלק 1)

למי שרוצה קצת להרחיב את הידע שלנו במידג'רני - חלק 2 זה המדריך בשבילו

ויש גם דברים למי שרוצה ללמוד על איך לייצר כל תמונה בעזרת בינה מלאכותית מבלי לכתוב פרומפטים

 וגם על איך לייצר סיפור בעזרת תמונה עם בינה מלאכותית

איך מידג'רני לקח השראה עד היום

עד היום, למידג'רני הייתה יכולת לקחת "השראה" מתמונה אחרת. בכל פרומפט שלכם יכולתם להוסיף קישור לתמונה (פשוט על ידי הדבקה של ה-URL של התמונה בתוך הפרומפט, נקרא גם "Image Prompting") ואפילו לומר למידג'רני כמה משקל לתת לתמונה הזו כשהוא מייצר את מה שביקשתם.

אם למשל הייתי רוצה לייצר סוס רוקד, רעיון טוב היה לתת למידג'רני רפרנס לאיך בערך דמיינתי את זה, והייתי עושה את זה ככה (ממש העתק-הדבק לכתובת של התמונה):

/imagine {image_url.png} a dancing horse

זה היה עוזר לי להשיג תוצאה הרבה יותר קרובה למה שאני מתכוון, כי הרי לא תמיד המערכת יודעת למה באמת אנחנו מתכוונים. סוס רוקד יכול לרקוד בהרבה מקומות ובהרבה צורות. נראה לי. 

אבל - אבל גדול - השיטה הזאת לא עוזרת לנו למשוך סגנון ואסתטיקה מתוך התמונה שצירפנו. קשה לייצר משהו עקבי עם אסטיקה ספציפית שממשיכה מתמונה לתמונה ומאפשרת לכם לספר סיפור או ליצור עולמות בדיוניים משלכם. כאן נכנס פרמטר חדש שמאפשר לנו להעביר סגנונות בין התוצרים שלנו: sref.

פרמטר sref

קיצור של Style Reference.

"סטייל רפרנס" עובד רק עם גרסאות V6 ו-Niji 6 ומאפשר לכם ליצור סגנון קבוע בין התוצרים שלכם פשוט על-ידי כתיבת הוספת --sref בכל סוף פרמפט שלכם, יחד עם URL לתמונה. אפשר לשחק עם זה דיי הרבה, כמו למשל לשלב כמה תמונות רפרנס כדי לאחד סגנונות ולהוסיף לו משקלים לכל תמונה, כדי לומר למידג'רני ממי לקחת יותר או פחות השראה.

בהמשך לסוס הרוקד שלנו, זה השימוש שהייתי עושה עכשיו כשיש לי רפרנס:

/imagine {image_url.png} a dancing horse --sref {ref_url.png}

איך להוסיף תמונה לפרומפט

שתי שיטות מאוד פשוטות. 

  1. מעתיקים כתובת מהאינטרנט, כל כתובת של תמונה שאתם רוצים.
  2. מעלים תמונה לסיקורד או מג'נרטים אחת משלכם. קליק עכבר ימני עלייה ו-Copy Link.

איך להשתמש ב-sref

אז בגדול אפשר לשים כמה תמונות שרוצים, גם בפרומפט וגם ב-sref. זה לא באמת משנה. מה שמשנה זה מה שאתם מכוונים אליו. הרפרנס שתתנו לו. נחזור לדוגמה האהובה עליי אבל הפעם בואו פשוט נגוון איתה קצת. שימו לב שמעכשיו כל הפרומפטים שלי יסתיימו ביחס 16:9 וב-style raw כדי לתת לעצמי כמה שיותר שליטה על התוצר.

תזכורת קטנה: style raw לא משפיע על הסטייל אלא על הפרומפט עצמו. זו פקודה שמאפשרת לי לומר למידג'רני לתת יותר משקל לפרומפט שאני כותב לעומת לאסתטיקה הכללית שמידג' מוסיף לתוצרים שלי. במילים פשוטות, זה נותן לי יותר שליטה על התוצר.

/imagine a young child playing the drums --sref {reference_1.png} --ar 16:9 --style raw

זו התמונה שבחרתי להשתמש בה כרפרנס. מידג'רני עושה הבדל גדול בין התמונה לבין הסגנון שבא לידי ביטוי מתוכה, יותר בכיוון של אסתטיקה כללית.

תמונת רפרנס ראשונה לפרומפט מידג'רני בשימוש עם פרמטר sref

וזו התוצאה:

התוצאה הראשונה מפרומפט פשוט בשילוב רפרנס בפרמטר sref

איך לשלב כמה רפרנסים

עכשיו אני רוצה להתקדם וליצור משהו יותר ייחודי. מצאתי כמה תמונות שיכולות להיות רפרנס טוב למה שאני רוצה ליצור. רציתי לשלב את הסגנון של כוס הקפה ממוקדם יחד עם צבעים חזקים ועם עוד ציור נעים ומרגיע. אלה הרפרנסים שבחרתי:

מולטי רפרנס בפרמטר sref במידג'רני

השילוב מתבצע ככה:

/imagine a young child playing the drums --sref {reference_1.png} {reference_2.png} {reference_3.png} --ar 16:9 --style raw

והתוצאה:

התמונה הסופית של מידג'רני בשימוש עם פרמטר sref ושלוש תמונות רפרנס

שילוב sref עם משקלים

המשמעות של משקלים במידג'רני היא בעצם השיטה שלנו לומר למידג' איך וכמה להתייחס לכל ביטוי שלנו בפרומפט. אנחנו נעבור רגע על הסבר קצרצר על משקלים ואז ניישם את זה על הרפרנסים שלנו.

מה זה משקלים במידג'רני

משקלים הם השיטה שלנו להפריד בין חלקים בפרומפט. אחרי כל ביטוי אנחנו יכולים לכתוב :: (נקודותיים) ולומר מה רמת החשיבות שלו עם קצת מספרים. לדוגמה:

/imagine dragon:: fly::

אם הייתי כותב פשוט dragon fly, הייתי מקבל תמונה של שפירית. מכיוון שנתתי משקל לכל מילה בפרומפט יצרתי ביניהן הפרדה ולמעשה קיבלתי דרקון שעף. חוסך מכם תמונה לא מעניינת של דרקון שעף במקום שפירית.

אחרי הנקודתיים אני גם יכול לתת מספר ולומר כמה משקל לתת לחלקים בפרומפט:

/imagine dragon::2 fly::

כאן אני מציין שהחשיבות של החלק הראשון בפרומפט שווה פי 2 מהחלק השני שלו. לעומת זאת ומכיוון שזה דיי מתמטי, המספרים תמיד מהווים אחוז מהשם. כלומר, שני הפרומפט הבאים שווים לחלוטין אחד לשני.

/imagine dragon:: fly::
/imagine dragon::100 fly:100

וגם שני אלה:

/imagine dragon::2 fly::
/imagine dragon::4 fly::2

לתת משקלים לרפרנסים שלנו

באותה מידה - ונחזור לדוגמה של הילד והתופים עם הרפרנסים שלנו - אני יכול לתת משקל לכל רפרנס ששמתי. לדוגמה:

/imagine a young child playing the drums --sref {reference_1.png}::6 {reference_2.png}::2 {reference_3.png}:: --ar 16:9 --style raw

משקלו של הרפרנס הראשון הוא פי 3 מהשני, ופי 6 מהשלישי (שבו אין צורך לכתוב ::1 כי :: בלבד זה אותו הדבר). זו התוצאה:

תוצאה סופית לשימוש בפרמטר sref יחד עם weights

חשוב לזכור שמידג'רני לא יוצרת דברים אבסולוטיים. אין טעם לנסות לחשב לעומק כמה משקל לתת לכל דבר, אלא ללכת כמו סבתא כשהיא מוסיפה תבלינים לתבשיל. לפי הרגשה.

 ובואו נשקול את כל הפרומפט כולו

אחרי שהבנו משקלים ונשמנו עמוק, בואו נגיע לשלב האחרון שנלמד היום. מידג'רני חשבו כמה צעדים קדימה כאן ואפשרו לנו לתת משקל לא רק לרפרנסים עצמם אלא גם לסגנון הכללי שניישם על הפרומפט שלנו בשימוש עם sref. זה נעשה בעזרת פרמטר נוסף שנקרא sw.

SW מקבל מספרים בין 0-1000 כאשר 100 זה הברירת מחדל. בואו נניח שאני רוצה להגדיל במעט את ההשפעה של הסגנונות האלה על הפרומפט שלי:

/imagine a young child playing the drums --sref {reference_1.png}::6 {reference_2.png}::2 {reference_3.png}:: --sw 300 --ar 16:9 --style raw

וזו התוצאה:

תוצאה של שימוש בפרמטר sref עם שינוי משקלים בין הרפרנסים

שימוש הגיוני ב-sref

נתחיל מכמה דברים בסיסיים:

  1. אם אתם רוצים לכלול תמונה בפרומפט - תמונה שהיא לא רפרנס אלא בתוך הפרומפט עצמו - היא כמובן חייבת לבוא לפני sref.
  2. הפרמטר לא יעבוד על פרומפט ריק או שיש בו רק תמונה בלבד, הוא חייב לקבל טקסט.
  3. אם הפרומפט שלכם הוא יותר בסגנון פוטוריאליסטי והרפרנס הוא פחות הסגנון הזה - נניח סגנון ציורי - כנראה שתצטרכו לציין את זה בפרומפט עצמו, לפחות בגרסא הנוכחית של MJ 6 (שהיא alpha).

אני מאמין שהטכנולוגיה הזאת של מידג'רני, בינה מלאכותית, וכל מה שביניהם, נועד כדי להעצים אותנו, לפתוח לנו את הקופסא ולעזור לנו ליצור דברים חדשים שלא חשבנו עליהם. הרעיון של הסגנונות זה אחד הדברים הנהדרים שקרו במידג'רני, ומה שהרבה יוצרים חיכו לו. אם השימוש שלנו יסתכם בלהעתיק סגנונות קיימים וליצור על גביהם יצירות ועולמות חדשים, לא עשינו בזה כלום. אם נשתמש בהם כסגנון אחד ונשלב אותו עם עוד כמה אחרים כדי ליצור סגנון חדש שמשלב כמה מהם בצורה שאהבנו - זו היצירה שלה. יצירה של דברים חדשים מדברים קיימים.

לסיכום

האפשרות של Consistent Style הייתה חסרה במידג'רני הרבה זמן ונראה שעכשיו הם שמים בזה הרבה עבודה. בהשקה של sref הם גם ציינו שאחד הדברים שנמצאים כרגע בפיתוח הוא פיצ'ר שיאפשר ליצור דמות עקבית (Consistent Character). זה יהיה כבר לגמרי מטורף, כי לא רק שנוכל ליצור סיפורים ועולמות משלנו, נוכל גם ליצור לתוכם דמויות עקביות שממשיכות לאורך כל הסיפור וחיות בעולם שיצרנו.

אני מחכה בקוצר רוח ותהיו בטוחים שתשמעו על זה כאן, מוסבר במילים פשוטות.