The Future of Sound Production: Exploring the Latest Innovations in Audio Technology
תפריט
שלום אורח ::: Tue, 17 Sep 2024, 12:41
logo המגזין הישראלי לטכנולוגיות באודיו ומוסיקה Musical Act Magazine AI

ה-DeepMind AI של גוגל מייצר קולות אנושיים מציאותיים ביותר

מאת: ACT@R-M ::: ::: נושא:

בדרך להחליף אותנו, קול אנושי הולך להיות מופק בידי מכונה - ללא דגימה הפעם

האינטליגנציה המלאכותית DeepMind של גוגל הפיקה את מה שיכול להיות נאום המכונה הכי ריאליסטי עד כה. WaveNet מחוללת קולות באמצעות דגימה של דיבור אנושי אמיתי ומידול ישיר של צורות גל שמע המבוססות עליו, כמו גם השמע שנוצר על ידה בעבר.

במבחני גוגל, מאזינים אנגלים וסיניים מצאו את WaveNet יותר מציאותי מסוגים אחרים של יישומי טקסט לדיבור, למרות שזה פחות משכנע מאשר דיבור אנושי בפועל. אם זה לא הספיק, היא יכולה גם לנגן בפסנתר די טוב.
 
 
יישומי טקסט לדיבור חשובות כיום יותר ויותר במחשוב, מכיוון שאנשים מתחילים להסתמך על בוטים ועוזרים אישיים של AI כמו סירי של אפל, קורטנה של מיקרוסופט, Alexa של אמזון ועוזרת גוגל.
 
 
אולם, אם תשאלו את סירי או קורטנה, הם תשבנה בפועל בהקלטות שנעשו מקול אנושי, מסודרות ומשולבות בחלקים קטנים. מה שנקרא טקסט משורשר לדיבור, וכפי שמומחה אחד אמר, זה נשמע כמו בקשת כופר מעוותת של דורשי כופר. התוצאות לרוב מציאותיות למדי, אך כפי ש- Google כותבת, הפקת פרסומת שמע או טון קול חדש מחייבת שחקן כדי להקליט כל צליל אפשרי בבסיס נתונים. הנה משפט אחד שנוצר על ידי גוגל.
 
 
 

ללא ספריה של קולות אנושיים אמיתיים העושים קולות

האלטרנטיבה היא טקסט-לדיבור פרמטרי  - בניית קול שנוצר לחלוטין על ידי מחשב, תוך שימוש בכללים מקודדים, המבוססים על דקדוק או צלילי פה.
קולות פרמטריים אינם זקוקים לחומר גלם מקור כדי להפיק מילים. אך התוצאות, לפחות באנגלית, הן לעתים קרובות מסובכות ורובוטיות. אתם יכולים לשמוע אותם כאן.
 
המערכת של גוגל עדיין מבוססת על קלט קולי אמיתי. אבל במקום לקצץ הקלטות, היא למדה מהן, ואז יוצרת באופן עצמאי צלילים משלה במגוון קולות. התוצאות הן משהו כזה.


מוצרי אלקטרוניקה ומחשבים במחירים הזולים ביותר, אספקה מהירה - כמו לרכוש בארץ
  • כלים וירטואליים, פלאגים - VST/i
    RE: VST ARSENAL 2024
    mixtrim: --------------- המיוחדים* ---------------- * - 15 פלאגינס מופלאים שתמיד חיכינו... לשרשור המלא אחרון
  • כלים וירטואליים, פלאגים - VST/i
    Variaudio
    מקסימוס: לא שומע את הסאונד של הvariAudio בתוך שולחן העריכה כשאני מזיז אותם לשרשור המלא אחרון
  • מש' Steinberg
    RE: מקצבים לקיובייס 13 Elements
    ReuvenM: ב-Cubase Elements 13 אין תמיכה מובנית במנוע יצירת מקצבים אוטומטיים כמו... לשרשור המלא אחרון
  • מוסיקה אלקטרונית
    kimchi SWAMP
    SallyT: inundated by the BAYOU לשרשור המלא אחרון