אז אולי זו תהיה סדרת כתבות, ואולי לא, אבל איך שלא נקרא לזה, בינה מלאכותית זה הנושא הכי חם היום. Artificial Intelligence, הבינה המלאכותית, אולי השם השני של שנת 2023. אולי זה בכלל ChatGPT. הרבה לא יודעים את זה, אבל הדבר הזה היה קיים עוד הרבה לפני שאנחנו הכרנו אותו.
למעשה, האפשרות לשוחח עם בינה מלאכותית כמו עם בנאדם היה קיים הרבה לפני ChatGPT, הסנסציה שבעקבותיה כולנו הכרנו מה זה בינה מלאכותית. צ'אט ג'יפיטי נתן לאנשים א-טכנולוגיים, (הרבה מאלו שקוראים את מילים פשוטות) את האפשרות לדבר עם מכונה. זה אפשר נגישות. לפני זה, זה היה קיים בכלים נסיוניים של אותה חברה - OpenAI - שבאה לעולם מתוך כוונה להנגיש את כלי ה-AI, ועל זה קמו עוד כמה ויכוחים סביב היוצרים, הבעלים, המשקיעים, אבל נשים את כל אלו בצד כרגע.
אחד הכלים שהוציאו אותי לגמרי מאיזון הוא Midjourney. מחולל התמונות. יוצר הגרפיקות.
במילים פשוטות, מידג'רני הוא כלי ליצירת תמונות (Images). הוא מאפשר לכם לכתוב לו כמה מילים על איזה תמונה אתם רוצים ליצור והוא ייצור לכם אותה ממש אחרי כמה רגעים.
יש עוד הרבה כלים כמוהו. OpenAI בעצמם בנו כלי בשם DALL-E שעושה אותו דבר, עם הרבה יותר יכולות עריכה של תמונות בעזרת בינה מלאכותית. בין היתר, הכלי שלהם ידע להעלים או להחליף אובייקטים מסוימים מתוך תמונה (למשל למחוק את האקסית מתמונה ממש יפה שלכם), אבל בצורה ממש טובה.
Stable Diffusion הוא גם כלי דומה, או קבוצה של כמה כלים כאלה. סטייבל דיפיוז’ן זה מחולל תמונות קוד פתוח שכל אחד יכול לעשות איתו מה שהוא רוצה. אפליקציות שונות נבנו על המנוע הזה, והוא בשימוש דיי נרחב מעצם היותו קוד פתוח לחלוטין.
דוגמה למה אפשר ליצור עם AI
אפשר לדבר על התחום הזה בלי סוף אבל הפעם אני רוצה להציג בפניכם איך אפשר להשתמש בו ליצירתיות, לבניית סיפור ולקבל הרבה השראה. מידג'רני הוא הכלי שאני משתמש בו, אז אנחנו נדבר עליו. זה בעצם בוט שאני מדבר איתו דרך תוכנת צ'אט בשם Discord. על ההתקנה וההפעלה של כל הדבר הזה נדבר בפעם הבאה.
המנוע הזה כל הזמן מתחדש, משתדרג, מתחולל, מתקסם (מלשון קסם) וכל מיני תיאורים אחרים שהופכים אותו לממש מגניב ויפה. אגב, אני לא אכנס כאן לשום טיעון בעד ונגד בינה מלאכותית, זה לא מעניין אותי כרגע.
הנה כמה דוגאות:
computer mouse design, line art on white background, minimalistic
a man with a hat and a tan shirt looking down, in the style of black and white contrast, poetcore, pixelated portraits, webcam photography, sparse, angular linework, bloomsbury group, cute and dreamy
a full body picture of matt metal dinosaur, walking on a high mountain, epic shot
a colorful parrot flying in the fields of the desert, very minimalistic, epic composition, tree in background
וזו באמת הצגת יכולת מאוד צרה ומצומצמת.
אוקיי. אז אפשר לייצר איזה תמונה שרוצים. נכון?
אבל איזה מגניב היה אם ממש היה אפשר לבנות מזה סיפור. להחליט מה אנחנו רוצים לספר, או אפילו לא להחליט, ולתת לדמיון שלנו ושל המכונה לקחת אותנו לאן שלא יהיה. צריך לזכור, אין משהו אבסולוטי ביצירת תמונות עם בינה מלאכותית. הכוונה היא שלא ניתן לדעת בוודאות מוחלטת מה יצא בתמונה שנבקש ממנה, אבל החכמה היא לנסות להיות כמה שיותר קרוב.
איך לייצר תמונות שמספרות סיפור
נצא לדרך. רציתי ליצור סיפור על ילד בן 14 שיושב בבית וקורא ספר. עדיין לא ראיתי בדמיון שלי איך כל הסביבה נראית, רק ידעתי שאני רוצה שהוא ישב ליד השולחן ויקרא ספר.
14 years old boy sitting on an office chair by the table, boy holding an modern open book, clean black tshirt, short hair, medium shot, side angle shot, studio soft light
אחר כך הבנתי שאני רוצה שהוא יהיה שמנמן. אז הוספתי את המילה Fat, והפרומפט הוא:
a fat 14 years old boy sitting on an office chair by the table, rading a modern book, clean black tshirt, short black hair, medium shot, side angle shot, studio soft lighting, bright light
אולי הילד הזה גם חנון מחשבים? ביקשתי ממידג'רני להרחיב לי את התמונה לכיוון ימין, והוספתי מחשב.
small computer screen with few lines of code
אוקיי. הוא ילד שמנמן שיושב עם ספר על השולחן, המחשב מולו, עכשיו נשאר אוכל. נוסיף Fast Food.
small dish of fast food meal
התמונה צפופה לי מדי. אני רוצה לצאת החוצה, שיראו חדר, ואולי איזה חלון עם נוף. שיתן קצת מרחב, אחרת אנחנו נקברים בתוך המון המון פרטים שקיימים לאורך כל הדרך והעין קצת מתבלבלת בין כל הדברים שהיא מסתכלת עליהם. אז נעשה Zoom Out לתמונה, ונוסיף חלון.
clean room with window view
צריך לזכור: התהליך הזה לקח לי בערך שעה של נסיונות. לקח זמן עד שקיבלתי את הילד שהבאתי כאן, עד שדייקתי את הפרומפט, עד שהוספתי את סוג התאורה שרציתי ועד שראיתי תוצאה שהיא הכי קרובה למה שראיתי בדמיון. ואני חושב שזה קם ונופל על זה - על ליצור את מה שקיים לנו בדמיון. לא כולם יודעים לצייר או לצלם. אבל כולם יודעים לדמיין. וזה כלי שנותן לכל אחד את האפשרות ליצור את מה שיש להם בדמיון בעזרת מילים בלבד.
האפשרות הזאת ליצור את מה שקיים לנו בדמיון ולהביא אותו למציאות באמצעות תמונה או גרפיקה כלשהי, אני קורא לה אמנות.
קצת על Prompt Engineering
נקבל בברכה את המקצוע החדש שיצא עידן הבינה המלאכותית, Prompt Engineering. פרומפט זה המילים שאנחנו כותבים למנועי AI, ובעיקר למנועי NLP (Natural language processing) שמתעסקים בעצם בלהבין שפה. אם נדע לתאר למנועים האלה, למודלים החכמים האלה את מה שאנחנו רוצים שהם יצרו עבורנו אנחנו נקבל רמת דיוק מטורפת.
הפרומפט הוא דרך התקשורת שלנו עם ה-AI. אנחנו יכולים לומר הרבה דברים. אבל חכמים ממני כבר אמרו - לא משנה מה אמרת, משנה מה הבינו. אז אנחנו צריכים לגרום לעצמנו להיות יותר ברורים, יותר חדים, מנוסחים טוב יותר.
בכתיבת פרומפטים אנחנו מתעסקים עם מחשב, אז הכללים משתנים. יש לזה את החוקים שלנו וכל מנוע עובד קצת אחרת. בפועל, מי שיודע "לדבר" עם המנועים האלה, יגרום להם להוציא תוצאות מדויקות יותר עבור מה שהוא מחפש.
כן, יש פה הרבה סיכונים.
כן, זה לא שחור ולבן. זה לא רק טוב, או רק רע.
אבל זה ממש מקצוע חדש שנולד, ואפשר ללמוד אותו.
לסיכום
בחודשים הקרובים אני הולך לדבר הרבה על AI. יצירת הסיפור שדיברתי עליו עכשיו עשתה לי חשק לכתוב על זה, אז עשיתי את זה ואפילו יצא לי קצת יחסית למדריכים אחרים. אולי כי זה לא ממש מדריך ואולי כי אני כותב את השורות האלה ב-2 בלילה. אחד מהשניים, בטוח.