האם בינה מלאכותית יכולה לכתוב פאנפיקציה טובה?

מאז שכלי יצירת טקסט המופעלים על ידי בינה מלאכותית הועברו לרשות הציבור בחודשים האחרונים, הם התבשרועל ידי כמהכמו העתיד של דואר אלקטרוני, חיפוש באינטרנט ויצירת תוכן. אבל לכלים האלה המונעים בינה מלאכותית יש גם כמה חסרונות ברורים: הם נוטיםלהיות לא נכון, ולעתים קרובות מייצרים תשובות לכךלחזק הטיות גזעיות, למשל. יש גם חששות אתיים רציניים לגביהםנתוני אימון לא מוגדרים.

אין זה מפתיע שהוויכוחים על השימוש בכלים הללו מתרחשים גם בחללי פאנדום. מעריצים נרגשים פנו אליהם כמעט מיד כדרך חדשה לחקור את הדמויות האהובות עליהם. עם ההנחיה הנכונה, AI יכול לירוק כמה פסקאות של כתיבה דמויית בדיוני. אבל באותה מהירות, כותבי פאנפיק רבים החלו להתבטא נגד הנוהג.

"איפה מידע המקור של AI שבו הוא משתמש? פאנפיקציות אחרות, המקור המקורי, סיפורים אחרים? האם הבינה המלאכותית תעשה גניבה גניבה למחברי פאנפיקציה אחרים?" שואל הסופר Redd, שאומר ש"בסך הכל, יש להרחיק את הבינה המלאכותית מפאנפיקציה".

למידת המכונה שמאחורי כלי הבינה המלאכותית הללו מחייבת אותם בדרך כללמאומן על כמויות גדולות של נתונים קיימים, לעתים קרובות מגורדים מהאינטרנט. אבל קשה לדעת בדיוק מה נתפס על הכוונת, או כמה כתובה המוגנת בזכויות יוצרים כלולה. OpenAI, החברה שעומדת מאחורי מערכת GPT-4 המשמשת כבסיס לכמה מכלי יצירת הטקסט הפופולריים הזמינים כיום,לא חשףעל אילו נתונים המודל הוכשר. (OpenAI לא הגיבה לבקשה להגיב בנושא זה בזמן לפרסום.) עם זאת, GPT-3 הוכשר על 45 טרה-בייט של נתוני טקסט, שחלק גדול מהם נלקח מסריקת אינטרנט רחבה.

Fanfic הוא גם פרקטיקה אמנותית וגם קהילה - ועד כה, גם כלי AI לא יכולים לשכפל

לאור הנרחבות לכאורה של סריקה זו, כמו גם היכולות של הכלים הללו ליצור פיקציה, תורמים רבים לאתרים כמו Archive of Our Own ו-Fanfiction.net מאמינים שייתכן שהעבודות שפורסמו שם היו חלק מהנתונים ששימשו לאימון המודלים הללו . חלק מהכותבים האלה לא אוהבים שייתכן כי נעשה שימוש בעבודתם בצורה כזו ללא רשותם. בארכיון משלנו,מספר הולך וגדל של משתמשיםנועלים את היצירות שלהם כך שיוכלו לקרוא אותן רק על ידי המחוברים לחשבונות קיימים. משתמשים שנועלים את התמונות האלה מאמינים שזה יעזור למנוע את מציאת העבודה שלהם בסריקות נתונים של AI.

ארכיון משלנו, שנפנה להערה, אומר שהוא "ערך כמה שינויים בקוד האתר שימנעו מבוטים מקודדים באחריות לגשת אליו", אך הגבלת תנועה אוטומטית לחלוטין אינה אופציה מכיוון שהיא תפר את האינטראקציה של האתר עם החיפוש מנועים, קוראי מסך וכלים אחרים.

אבל שאלות אתיות אלו הן רק חלק מהתמונה. Fanfic היא גם פרקטיקה אמנותית וגם קהילה - ועד כה, גם כלי AI לא יכולים לשכפל.

במחקר שלי עבור מאמר זה, התנסיתי בארבעה מחוללי טקסט שונים: הגישה הישירה של OpenAI ל-ChatGPT, Bing AI, בארד של גוגל ו-Notion AI. בדקתי כל אחד מהם עם אותן הנחיות רחבות ("כתוב לי פאנפיק") בהתחלה, כדי לראות מה הם ימצאו. לאחר מכן, כדי לשחזר משהו קרוב יותר לאופן שבו הם נמצאים בשימוש על ידי כמה מעריצים, השתמשתי בבקשות ספציפיות יותר, כולל דמויות פופולריות, ספינות וטרופים בפאנדום. בסך הכל, זו הייתה חוויה לא מתגמלת. לכל כלי הייתה גישה משלו לניסיון פיקציה, אבל לתוצאות הסופיות היו קווי דמיון רחבים: הסיפורים היו כלליים ומגושמים.

ראשית, למרות ההסכמה הרווחת בחוגי הפנדום שהכלים הללו יודעים מה זה fic, הכלים לרוב לא הגיבו בצורה קוהרנטית להנחיה הרחבה. בשלב מסוים Bing AI הפיק סיכום ישיר של הספר בפועלהארי פוטר ואבן החכמיםבמקום כל סוג של פאנפיק. כששאלתי איזה הבדלים זה יעשה לסיפור המקורי, Bing AI חיפשה את ההבדלים בין האבן החכמיםספר וסרט וסיפר לי כמה מהם. כשאמרתי שזה לא מה ששאלתי, זה סיים את השיחה. כאשר ביקשתי את זה שוב, לאחרונה, זה הניב טיפים לכתיבת פאן-פיקציה במקום ליצור את הסרט ישירות.

כשהכלים האלה אכן יצרו משהו שמתקרב לפיקציה, הוא לא היה כתוב היטב. בארד, למשל, בתגובה להנחיה "כתוב לי פאנפיק", הוציא סרט הארי פוטר/הרמיוני גריינג'ר בן 377 מילים, שבו הארי עוזר להרמיוני עם שיעורי הבית שלה. כל מי שיש לו ידע חולף על זיכיון הקוסמים - כך שכמעט כל אחד מתחת לגיל 40 - יוכל לזהות שזה לא אופי ושיש להחליף את התפקידים.

באמצע הסרט שנוצר על ידי AI, הארי והרמיוני מתוודים על רגשותיהם אחד כלפי השני ומתחילים להתנשק. זה לא בדיוק אירוע חריג בפאנפיקציה, אבל אין רגש בסצנה. זה נראה כמו הניסיון הראשון של טווין להבין כתיבה רומנטית. זה לא עלבון לטווינים, שמגיע להם ליהנות מתהליך היצירה ולתרגל את כישוריהם. יש הרבה פאנפיקציה בעולם שנקראת בדומה לניסיון של בארד - אבל יש גם אלפים הרבה הרבה יותר טובים.

ברירת המחדל של בארד לסרטי הארי פוטר לא הייתה חד פעמית. Bing AI ו-OpenAI עשו את אותו הדבר. (נראה ש-Notion AI לא זיהה מה זה פאנפיקציה ויצרה סיפורים שלא היו קשורים למדיה הקיימת.) הסיפורים שכלי AI אלה יצרו התמקדו גם בזוגות הטרוסקסואלים. בבדיקת אותה הנחיה בסיסית בשלושת הכלים הללו מספר פעמים כל אחד, הם המשיכו לחזור לספינות הארי פוטר הישרות: בנוסף להרמיוני/הארי, הם הגיבו עם הרמיוני/רון, הרמיוני/דראקו ולונה/דראקו, אבל אף פעם לא משהו לא היה M/F.

למרות שרבים עזבו את הפנדום של הארי פוטר בשנים האחרונות - כסופרג'יי קיי רולינג הצהירה מספר הצהרות אנטי טרנסיות- זו עדיין קהילה מסיבית ופעילה, עם ההמספר השני בגובהושל יצירות על Archive of Our Own וכמעט 70,000 יצירות חדשות שנוספו בשנת 2021. אבל העבודות שנוצרו על ידי AI לא היו מייצגות את סוגי הסרטים שאנשים אמיתיים כותבים בפועל. בארכיון משלנו, הרמיוני/דראקו היא ספינת ה-F/M הפופולרית ביותר, אבל אפילו את זה מאפיל הארי/דראקו, שיש לו פי שלושה יותר פיקציות שהוקדשו לה. זה גם הרבה פחות פופולרי ממה שהיה פעם. בְּיָמֵינוּ,ספרי "תקופת הפודדים".- ולעתים קרובות אלה שמתמקדים ברמוס/סיריוס ספציפית - הם מוקד גדול יותר בפאנדום.

ויחסים בין גברים לגברים הם כמעט תמיד הרבה יותר פופולריים בפנדום. כצורה אמנותית המתמקדת במילוי הפערים שנותרו במדיה הקיימת, הוספת מערכות יחסים קוויריות ואימות קריאות קוויריות של דמויות אהובות היא אחד המניעים המרכזיים של פאנפיק. נראה כי כלי בינה מלאכותית, לעומת זאת, התרחקו מיצירת כל פיקציה של M/M. הנחיה לכל אחד מהכלים עבורעַל טִבעִיסיפורים הפאנפיים החזירו במרכזם דין ווינצ'סטר/ג'ו הארוול וסם ווינצ'סטר/ג'סיקה מור, למרותדין/קסטיאלהיא ללא ספק הספינה הפופולרית ביותר בכל פאנדום ב- Archive of Our Own. יש יותר מ-110,000 יצירות בתג AO3 בלבד, בהשוואה ל-811 דין/ג'ו פיקס בלבד.

אלגוריתמי הבינה המלאכותית נוטים בבירור לעבר הטרוסקסואליות. זה שהם גם בעד הארי פוטר קשור. כל מה שהמחוללים האלה מייצרים נוטה לגנרי, ומגמה הן למודל הדומיננטי למיניות והן למוצרי התקשורת עם טביעות הרגל התרבותיות הגדולות ביותר. הם לא - ולא יכולים - להגיב בקלות לניואנסים של הפנדום, עם מערך האינטרסים המגוון הרבה יותר שלו והנטייה הנגדית-תרבותית כלפי קוויריות. בקיצור, התגובות שלהם להנחיות פיקטיביות פשוטות הן הדגמה טובה לאופן שבו הכלים האלה לא מצליחים לכבוש את הלב האנושי שיושב במרכז כל אמנות או קהילה הגונה.

באופן רחב יותר, להרגל של מחוללי טקסט להתקרב לממוצע, במקום להיות מסוגלים להסתגל לניואנסים של צורך אינדיבידואלי, יש השלכות הרבה יותר גדולות מאשר חיבה לאניות ישרות. כלים שהוכשרו על גרידות תוכן עצומות ישכפלו את מה שהכי נפוץ. לא קשה לדמיין אילו פרספקטיבות הולכות לאיבוד בתהליך הזה.

הם לא - ולא יכולים - להגיב בקלות לניואנסים של הפנדום, עם מערך האינטרסים המגוון הרבה יותר שלו והנטייה הנגדית-תרבותית לקוויריות

מגבלה מרכזית נוספת היא שהכלים הללו לא יפיקו חומר מפורש, מכיוון שהוא מפר חלק מתנאי השירות שלהם.מדיניות השימוש של OpenAI, למשל, לא לאפשר את "תיאור הפעילות המינית", בעודקוד ההתנהגות של Bing AIאוסר על יצירה או שיתוף של "תוכן למבוגרים". אבל סצנות מין, כמו בסוגים אחרים של ספרות, הן חלק חשוב מהפאנפיק. מתוך כמעט 11 מיליון עבודות ב- Archive of Our Own, כמעט 2 מיליון, או כ-18%, מדורגים כמפורש. עוד 15% מדורגים בוגר. יש דרישה ברורה לסוג כזה של כתיבה ש-AI לא יכול למלא כרגע.

מגבלת התוכן המפורשת יכולה גם להפריע לשימוש בכלים בכלל. התשובות של בינג AI מוציאות מילה בכל פעם, אז אחרי שביקשתי ממנה ספר פאן (דירוג לא מוגדר) של דין ווינצ'סטר/קסטיאל, הצלחתי לראות את זה נכתב במשך זמן מה לפני שהתחלתי בטעות ליצור משהו מפורש ונאלצתי להפוך את המסלול . זה פתאום מחק את עצמו באמצע המשפט והחליף אותו ב"טעות שלי, אני לא יכול לתת לזה תגובה כרגע. בוא ננסה נושא אחר." חזרה על ההנחיה מיד לאחר מכן יצרה את התגובה "אני מצטער אבל אני לא יכול ליצור תוכן לא הולם." עם זאת, במבחן מאוחר יותר, המחיקה הפתאומית - לאחר הפקת כמה משפטים של פיקציה - קרתה שוב.

תמונה: Bing AI דרך Jay Castello

לבינג יש גם את ממשק המשתמש היחיד שמספק ציטוטים, עם כל הודעהלְרַבּוֹת"קישורים לתוכן האינטרנט שאליו הוא מפנה." בהתחשב בהנחיות ספציפיות יותר, הציטוטים הללו נקשרו לקטעי תוכן נישה מאוד. לדוגמה, כאשר ביקשו משהו מז'אנר פגיעה/נחמה, הציטוטים שלו כללו דפי מחברים של כותבים ספציפיים בארכיון משלנו, כמו גם פוסט ב-Tumblr עם פחות מ-200 הערות. בלוג המפתחים של מיקרוסופט אינו מציע הסבר נוסף מעבר לקריאה של הפניות אלה ציטוטים, כך שלא ברור אם אלה נגרדו כחלק ממודל הבינה המלאכותית של הבוט או כחלק מהחיפוש באינטרנט שהכלי עושה כדי להקשר הנחיות. בלי קשר, זה מרגיש לא נוח להגיש את יצירותיהם של היוצרים הקטנים האלה בהקשר שסביר להניח שיוצרים כאלה לא דמיינו כשהם פרסמו אותם.

אבל מעבר לכל המגבלות האלה, יש גם בעיה הרבה יותר סובייקטיבית, אבל מהותית, עם השימוש בכלים האלה כדי ליצור פאנפיקציה. למרות שהם הוגדרו ככלים שהופכים חקר יצירתי לנגיש יותר, השימוש בהם ליצירת פאנפיק פשוט לא הרגיש יצירתי או חקרני. אני אוהב לכתוב. להקניט שרשורים מעניינים עד שאני מוצא מספיק כדי שניתן יהיה לחבר אותם יחד למשהו מספק מבחינה נרטיבית הוא אחד הדברים האהובים עלי לעשות בעולם. כתיבת סרטון היא אולי הגרסה המזוקקת ביותר לכך, כי השרשורים קיימים מראש ואני כבר מושקע בהם. מניסיוני, שימוש בכלי AI לא משחזר את התחושה הזו במעט. זה לא מצריך או אפילו מעודד את התהליך הרפלקטיבי של הכתיבה או העבודה הטרנספורמטיבית של הפאנפיק, שניהם יכולים להיות קשים אבל הם מתגמלים מאוד כשלעצמם. במקום זאת, אין ממה ליהנות מלבד המוצר המוגמר, שהוא בדרך כלל שטוח וחסר חיים.

"החלק הטוב ביותר בכתיבה הוא לשפוך את עצמך לתוך העבודה שלך ולגרום לאנשים ליהנות ממנה"

אני לא היחיד שמרגיש ככה. "בשבילי, השימוש ב-AI ל-fanfiction מרגיש כאילו הוא מביס את המטרה", אומר הסופר Seraph Abell. "החלק הטוב ביותר בכתיבה הוא לשפוך את עצמך לתוך העבודה שלך ולגרום לאנשים ליהנות ממנה. איך בינה מלאכותית יכולה אפילו ליצור מחדש סוג כזה של תשוקה?" Fic הוא לעתים קרובות גם אישי עמוק, שלא ניתן ליצור מחדש על ידי AI. "אתה יכול לראות חלקים ממני [בתמונה שלי] ואתה יכול לראות מה אני אוהב בתוכנית", אומר אבל.

"כשאני כותב פאנפיקציה, הכל בא מהמקום הזה בתוכי שבו אני צריך נואשות להוציא את המילים האלה על פיסת תקשורת שנגעה לי בנשמתי", אומר רד. "כתיבת פאנלים עוסקת בשיתוף ובקהילה, לא רק במספר הלהיטים והסימניות."

למעשה, נראה שרוב כותבי הסרטים מרגישים כך. התג "נוצר בינה מלאכותית" ב- Archive of Our Own אינו בשימוש טוב, ורבים מהתמונות שם מתויגות גם "crack" - כלומר, הכותב פשוט שיחק. רבים מהם צוחקים במפורש על כמה גרוע יצירת הטקסט, או פשוט תיארו את הטקסט שנוצר כניסוי. כתוצאה מכך, האתר לא היה צריך לקבוע כלל כללי בנוגע לסיפורים שנוצרו על ידי בינה מלאכותית, למרות שהוא הציג שאלות ממשתמשים מספיק כדי לקבל תשובה קיימת: "כרגע, אנחנו לא אוסרים יצירות מעריצים שנוצרו בינה מלאכותית ככזו, אם הם מתאימים אחרת כעבודות מעריצים. עם זאת, אנו עוקבים אחר המצב. בהתאם לנסיבות, עבודות שנוצרו בינה מלאכותית עלולות להפר את מדיניות האנטי-ספאם שלנו, אך זהו מצב מתפתח".

לכותבי ספרות יש דעות שונות לגבי האופן שבו AO3 ואתרים אחרים יכולים לטפל ב-AI אם הם יהפכו לבעיה גדולה יותר. "אני לא בעניין של צנזורה. אז אם מישהו רוצה לבנות את כל רשימת העבודות שלו מתוך עבודה שנוצרת בינה מלאכותית, לכו על זה. פשוט תייגו אותו כראוי כדי שכולם ידעו", אומר רד. אבל סבורה שיש לאסור את היצירות, בעיקר כדי למנוע גניבת עין של יצירות קיימות, אך באופן דומה חושב שאם הן מותרות, יש לתייג אותן כדי שהקוראים יוכלו להימנע מהן אם הם מעדיפים.

עם זאת, כרגע נראה שבינה מלאכותית היא יותר כלי לפאנפיקציהקוראיםשרוצים לצרוך משהו במהירות ובקלות, אולי עבור זיווגים של ספינות או טעמים שאינם מכוסים היטב על ידי הפאנדום בכלל. היצירות הללו הן לשם השעשוע שלהן, ונראה שהן לא מרגישות צורך לשתף. סופרים, לעומת זאת, עדיין כותבים. וזה לא סביר שישתנה בקרוב.