מותו של הזרם? כיצד יוטיוב וה-AI של Lyria מחוללים מהפכה במוזיקה המותאמת אישית
Sunday, 05-10-25, 09:44, ACT ::: ::: נושא: AI בינה מלאכותית @ 171
הפקת סאונד בזמן אמת עשויה לייתר את מודל ספריות הסטרימינג המסורתיות – והכול מתחיל ביוצרים של ה-Shorts

״מכתב מהעתיד״ באקט מוסיקלי לפני 30 שנה, ✅
העולם שבו יצרנו, הפצנו וצרכנו תוכן אודיו ומוזיקה משתנה לנגד עינינו בקצב מסחרר. במשך העשור האחרון, מודל הסטרימינג של שחקניות כמו ספוטיפיי (Spotify) ודיזר (Deezer) היה הדוגמה המובהקת לאופן שבו מוזיקה נצרכת: ספרייה עצומה של קטלוגים קיימים, המוגשת למשתמשים באמצעות אלגוריתמי המלצה.
העולם שבו יצרנו, הפצנו וצרכנו תוכן אודיו ומוזיקה משתנה לנגד עינינו בקצב מסחרר. במשך העשור האחרון, מודל הסטרימינג של שחקניות כמו ספוטיפיי (Spotify) ודיזר (Deezer) היה הדוגמה המובהקת לאופן שבו מוזיקה נצרכת: ספרייה עצומה של קטלוגים קיימים, המוגשת למשתמשים באמצעות אלגוריתמי המלצה.
אך כיום, נראה כי ענקית התוכן יוטיוב (YouTube), באמצעות חטיבת הניסויים החדשה שלה, YouTube Labs, והטכנולוגיה פורצת הדרך Lyria 2 של Google DeepMind, מכוונת למהפך עמוק יותר. היא לא רק מאפשרת יצירת תוכן מהירה יותר, אלא מציבה חזון שבו המוזיקה הופכת לאובייקט דינמי, אישי ונוצרת בזמן אמת, דבר שעלול להפוך את ספריות הסטרימינג המסורתיות ללא רלוונטיות בעתיד הקרוב.
AI משנה את כללי המשחק – מהמוזיקה המנוגנת לזו הנוצרת בזמן אמת
בעוד חברות כמו ספוטיפיי ודיזר מנסות להילחם בגל הולך וגדל של יצירות מוזיקה שנוצרו באמצעות בינה מלאכותית, יוטיוב בוחרת כיוון אחר לגמרי – אימוץ. פלטפורמת הווידאו הגדולה בעולם השיקה את YouTube Labs, מתחם חדש המציע גישה מוקדמת לכלים מבוססי בינה מלאכותית, ובמרכזם: מודל המוזיקה החדש של DeepMind בשם Lyria 2, שמסוגל להפוך דיבור ישיר לשיר מלא, תוך שניות.
המשמעות פשוטה ומרעישה כאחד: בעידן הקרוב, יוטיוב לא רק תשדר מוזיקה – היא תיצור אותה, בזמן אמת, עבור כל משתמש, לפי טעמו, מצבו הרגשי ואפילו לפי השעה ביום.
זוהי קריאת השכמה לכלל האקוסיסטם: מפיקים, יוצרי תוכן, אנשי פרסום, ובעיקר, לפלטפורמות הזרמת האודיו עצמן.
Lyria 2 – האיום הדינמי החדש
יוטיוב הודיעה לאחרונה על הרחבת כלי הבינה המלאכותית שלה ליוצרי Shorts (הפורמט הוויראלי לסרטונים קצרים), כשגולת הכותרת היא כלי בשם Speech to Song המופעל על ידי Lyria 2 של גוגל דיפמיינד. כלי זה מאפשר ליוצרים להפוך דיאלוג מוקלט או קטע דיבור קצר לפסקול מוזיקלי שלם עבור הסרטון שלהם, תוך שניות.
זו אינה רק תכונה נוספת לעריכת וידאו. Lyria 2 מייצגת משפחת מודלים המסוגלת לייצר מוזיקה באיכות גבוהה (High-fidelity audio) עם ניואנסים עדינים על פני מגוון רחב של ז'אנרים וקומפוזיציות מורכבות. בנוסף ליכולות הגנרציה ה'אופליין' שלה, קיים גם מודל Lyria RealTime (זמן אמת), אשר מאפשר יצירת זרמי מוזיקה רציפים, אינטראקטיביים ונשלטים.
כלי כמו "Speech to Song", בשילוב עם תכונות עריכה נוספות מבוססות AI (כגון Veo 3 ליצירת וידאו ו-Edit with AI לטיוטות ראשוניות), משנים את כללי המשחק עבור יוצרי התוכן. אם בעבר היוצרים נאלצו לחפש קטע מוזיקה מורשה בספרייה סטטית (או לשלם עבורו), הרי שכעת הם יכולים לייצר אותו בהתאמה מושלמת, ברגע, ובאופן שהוא מטבעו מקורי (AI-Generated), תוך עקיפת הצורך ברישיונות קיימים.
כשאלגוריתם הופך למפיק מוזיקלי אישי
הטכנולוגיה החדשה, שפותחה על ידי Google DeepMind, מאפשרת להמיר טקסט או דיבור לא רק למלודיה, אלא לשיר שלם הכולל עיבוד, כלי נגינה, הרמוניות וקול אנושי מלא.
ב־YouTube Shorts ניתן כבר כעת לומר משפט כמו “create a chill lo-fi beat for studying”, ולקבל תוך שניות קליפ מוזיקלי מותאם אישית – כולל שירה מקורית.
החזון הרחב עוד יותר הוא שילוב המודל בתוך פלטפורמת יוטיוב כולה, כך שכל צופה יוכל “להלחין” תוכן משלו, ליצור פסקול ייחודי לסרטון או לייצר גרסה אישית לשיר מוכר – בזמן אמת.
מנגד: דיזר וספוטיפיי יוצאות למלחמה
בעוד יוטיוב פותחת את שעריה ליצירה חופשית מבוססת בינה מלאכותית, Deezer ו־Spotify מתמודדות עם תופעה מדאיגה: הצפה של תכנים “לא אנושיים”.
על פי דיווחים בתעשייה, מעל 30,000 רצועות מוזיקה שנוצרו על ידי AI מועלות לדיזר מדי יום, רובן חסרות ייחוד ולעיתים גם נועדו “להונות” את מנגנוני התמלוגים של האמנים.
ספוטיפיי הכריזה לאחרונה על שורה של צעדים למאבק בתופעה – סינון תכנים, זיהוי אוטומטי של שירים שנוצרו באלגוריתמים, והסרת מנויים מזויפים שנועדו לנפח נתוני השמעה. אך גם בתוך ספוטיפיי עצמה יש הבנה הולכת וגוברת: אי אפשר לעצור את הבינה המוזיקלית – אפשר רק לאמץ אותה בצורה אחראית.
מבחינתנו - והכרזנו על כך עוד לפני 30 שנה בדיוק באקט מוסיקלי (״מכתב מהעתיד״):
מבחינתנו - והכרזנו על כך עוד לפני 30 שנה בדיוק באקט מוסיקלי (״מכתב מהעתיד״):
המהפכה הבאה: מוזיקה בזמן אמת, לפי טעם ורגע
הכיוון שיוטיוב מציגה מסמן שינוי מהותי בתפיסת המוזיקה הדיגיטלית. אם כיום אנו “בוחרים” מה לשמוע מתוך מאגר, הרי שבעתיד הקרוב לא נבחר – אלא נבקש.
המערכת תדע לנתח את העדפות המשתמש, מצב הרוח, המיקום הגאוגרפי וההיסטוריה האישית, ותיצור רצועה חדשה ומקורית, רק בשבילו.
כך, המוזיקה תהפוך משירות הזרמה (streaming) לשירות יצירה (generation).
עידן “הנגן” או “הפלייליסט” יוחלף בעידן של מוזיקה דינמית, מתפתחת ובלתי חוזרת – כל השמעה שונה מקודמתה.
האם מודל הסטרימינג המסורתי גוסס?
פלטפורמות כמו ספוטיפיי ודיזר עומדות כיום בפני שני אתגרים קיומיים מנוגדים:
- הצפת "AI Slop" (זבל AI): קצב הגידול של תוכן המופק על ידי בינה מלאכותית הוא בלתי נתפס. בדיזר, למשל, דווח כי כ-30,000 רצועות AI מועלות לפלטפורמה מדי יום, וכי תוכן זה מהווה כ-28% מכלל הרצועות החדשות המועלות. זהו "זיהום" המאיים לדלל את מאגר התמלוגים, להקשות על גילוי מוזיקה איכותית ולהטיל ספק באמינות הקטלוג.
- המהפכה המותאמת אישית של Lyria: יוטיוב, כאמור, משחררת כלי AI עוצמתיים המאפשרים יצירה מיידית ומותאמת אישית. המגמה אינה עוד צריכת מוזיקה מתוך ספרייה קיימת, אלא צריכת מוזיקה חדשה שנוצרה עבורך, ברגע זה, ולעולם לא תשמע אותה שוב בדיוק באותה צורה.
כאשר משתמש ממוצע של שירות כמו Deezer נאלץ להתמודד עם קטלוג מוצף ב"מוזיקת זבל" (AI slop) ובה בעת, יוטיוב מציעה לו ליצור פסקול אישי, מדויק, ומיידי לכל רגע בחייו – החוזה הצרכני משתנה באופן דרמטי. למה לשלם על מנוי לספרייה סטטית כשניתן לקבל אודיו חי, דינמי וייחודי המותאם לכל וידאו, סטורי או פעילות?
Lyria RealTime – הזרם שמחליף את הזרם
Lyria, כפי שפיתחה Google DeepMind, אינה מודל יצירה מסורתי שמייצר קובץ אודיו קבוע. הוא מורכב משני חלקים עיקריים שמשנים את כללי המשחק:
- Lyria 2 (Offline Generation): זהו הדור האחרון של המודל, המספק איכות סאונד מקצועית (Professional-grade audio) ויכולת יצירת קומפוזיציות מורכבות. המודל יכול לשמש כ"שותף יצירתי" לאמנים, לעזור בניסוח הרמוניות, יצירת וריאציות או עקיפת "חסם הכתיבה".
- Lyria RealTime (Real-Time Streaming): זהו המרכיב הקריטי ביותר. באמצעות חיבורי WebSocket, המודל מאפשר יצירה רציפה ואינטראקטיבית של מוזיקה בשידור חי. משתמש יכול להזין "פרומפט" (תיאור טקסטואלי) כמו "ג'אז פיוז'ן עם באס פאנקי" ולקבל זרם מוזיקה רציף. ולא רק זאת, הוא יכול לשנות פרמטרים כמו טמפו, סגנון או כלי נגינה בזמן אמת, והמוזיקה תעבור טרנזיציה חלקה בהתאם לקלט החדש.

המשמעות ליוצרי תוכן ופרסום:
בעידן ה-Shorts והטיקטוק, שבו תוכן ויזואלי מיוצר ונצרך במהירות של אלפי מגה-בייטים לדקה, המהירות וההתאמה המושלמת של הפסקול הן המפתח.
יוצרי תוכן: אינם צריכים להתפשר יותר על קטע מוזיקה קיים ש"בסדר" או לדאוג לרישיונות. הם יכולים לבקש: "ביט טראפ אגרסיבי באורך 15 שניות עם מעבר סאונד דראם אנד בייס בסוף", ולקבל זאת באופן מיידי, מוכן לשימוש (ומסומן ב-SynthID של גוגל למען שקיפות).
אנשי פרסום ומותגים: במקום לשלם תמלוגים גבוהים על Sync Licenses (רישיון סינכרון) למוזיקה קיימת, ניתן ליצור סאונד מותג (Brand Sound) מדויק וייחודי, וריאציות שלו, או פס קול דינמי הנשלט על ידי נתוני המשתמשים בזמן אמת. לדוגמה: סרטון פרסומת שישנה את המוזיקה שלו בהתאם לשעה ביום או למיקום הצופה.

ניתוח ההשפעה על התעשייה: בין ספוטיפיי ליוטיוב, הבעיה, העיצום והפתרון
1. הפגיעה במודל הסטרימינג: ספוטיפיי ודיזר
פלטפורמות הסטרימינג המסורתיות מוכרות "אוספים". ככל שהאוסף מוצף יותר ב"זבל AI" (דבר שספוטיפיי ודיזר מנסות כעת לטפל בו באמצעות מסנני ספאם, מדיניות איסור "דיפ-פייקס" של קולות אמנים, ותיוג תוכן AI), כך ערכו יורד בעיני המשתמש.
- התגובה של ספוטיפיי: הפלטפורמה הודיעה על שיפור במדיניות ה-AI שלה, כולל: אכיפה משופרת של הפרות התחזות (כנגד שיבוט קולי לא מורשה), מערכת סינון ספאם חדשה (שהובילה להסרת למעלה מ-75 מיליון רצועות "ספאמיות") ודרישה לגילוי AI עם קרדיטים בסטנדרט התעשייה (DDEX).
- התגובה של דיזר: דיזר כבר החלה לתייג תוכן AI באופן גלוי, להוציא אותו מאלגוריתמי המלצות ואף להגביל את השתתפותו בפלייליסטים מערכתיים.

פעולות אלה, למרות שהן חשובות להגנה על אמנים, הן למעשה הודאה בבעיה: הצורך ב"שומר סף" כדי להבטיח שהספרייה תישאר רלוונטית ואיכותית. במקביל, יוטיוב מציעה חלופה שאינה דורשת סינון – יצירה נקייה ומותאמת אישית של 100%.
2. העצמת היוצרים והמפיקים
הכוח עובר מידי בעלי הקטלוג לידי מי שיודע להפעיל את כלי הבינה המלאכותית ביעילות. מפיקי מוזיקה ואודיו מקצועיים צריכים לאמץ את Lyria ואת מודלים דומים לא כ"אויב" אלא כDAW (Digital Audio Workstation) חדש. היכולת ליצור סקיצות, וריאציות, או להשלים פערים מוזיקליים באופן מיידי, הופכת את התהליך ליעיל פי כמה.
מה יעלה בגורל האמנים האנושיים?
השאלה המוסרית והכלכלית לא פחות חשובה: האם אמנים “אמיתיים” יישארו רלוונטיים כאשר כל אדם יוכל ליצור שיר באיכות הפקה הוליוודית בלחיצה אחת?
יוטיוב מנסה להרגיע את הרוחות באמצעות הצהרות שיתוף פעולה עם תעשיית המוזיקה – שמירה על זכויות יוצרים, תיוג ברור של תכנים שנוצרו על ידי AI, והבטחה כי הכלים החדשים ישמשו להעצמת היצירה האנושית, לא להחלפתה.
אך לא כל החברות משתכנעות – בחלק מבתי ההפקה כבר נערכים לשינוי במודל הכלכלי, שבו תמלוגים יחולקו בין “אמן אנושי” ל“מודל מוזיקלי”.
הכותב: ראובן מנשרוף, מייסד ועורך אקט מוסיקלי ומומחה אודיו בעל 45 שנות ניסיון.