אפליקציית iOS חדשה המנקה את הדיבור בזמן אמת והופכת אותו לטקסט מוכן לעריכה, מבלי לדבר "לאט בשביל המחשב"

Google השיקה בשקט את AI Edge Eloquent, אפליקציית הכתבה קולית חדשה ל-iOS שמיועדת להמיר דיבור לטקסט נקי ומובנה בזמן אמת, בלי מנוי ובלי תלות בחיבור אינטרנט. עבור אנשי אודיו, במאים, שחקנים ותסריטאים, מדובר בכלי עבודה פרקטי: במקום "קלף פתקים" וקבצי אודיו פזורים - טקסט מסודר שאפשר להעביר מיד לעריכה, לסטוריבורד או למסמכי הפקה. האפליקציה רצה על המכשיר עצמו, עם אפשרות להיעזר בענן לשיפור נוסף, כך שהיא מתאימה גם לסטים סגורים, חדרי ישיבות אקוסטיים פחות, או נסיעות שבהן אין חיבור יציב.
מה Eloquent עושה בפועל?
Eloquent היא אפליקציית תמלול "חכמה" שמנסה להבין מה התכוונתם להגיד - ולא רק להעתיק מילה במילה את כל ה"אה", "אממ" והעצירות באמצע משפט. בזמן הדיבור היא מציגה גל-קול חי וטקסט שמתעדכן בזמן אמת, ולאחר סיום ההקלטה היא עוברת שלב נוסף של ניקוי: הסרת מילות מילוי, תיקון גבולות משפטים והפיכת המונולוג למשהו שאפשר לקרוא.
- תמלול בזמן אמת - תוך כדי הדיבור מופיע טקסט על המסך, כך שקל לראות אם משהו "התפספס" לפני שממשיכים. עצרו לרגע וחשבו - כמה פעמים נזכרתם ששכחתם להוסיף משפט למסמך שהוא. אפילו רשימת קניות, התראה לגוף תקשורת, משפט מתחרז בשיר או המשפט שיפיל את כולם בסטנד-אפ?
- ניקוי מילים מיותרות - האפליקציה מסירה באופן אוטומטי "אה", "אממ", הפסקות ודיבור שבור, כך שהטקסט נראה כמו גרסה כתובה של מה שהתכוונתם לומר, לא של מה שנאמר מילה במילה.
- פורמטים שונים של טקסט - אפשר להפוך את אותו תמלול לגרסאות שונות: נקודות עיקריות, ניסוח פורמלי, תמציתי או מפורט יותר. זה שימושי במיוחד לתסריטים, סיכומי ישיבה, תיאור סצנות או בניית שלד לסרט/פרק בסדרה. זה חזק, לא לזלזל.

עיבוד מקומי, פרטיות וגלגול לענן
אחד ההבדלים בין Eloquent לכלי תמלול קלאסיים הוא הדגש על עיבוד מקומי: מודלי ה-AI יורדים למכשיר עצמו, והקלטת הקול יכולה להישאר שם מבלי לעלות לשרתים. במצב לא-מקוון (offline), כל העיבוד נעשה על הטלפון, כך שאפשר לעבוד גם באולפן ללא אינטרנט או על סט סגור ואפילו במרחב-מוגן לא עלינו טפו-טפו - והאודיו לא יוצא החוצה.
למי שרוצה ניקוי אגרסיבי יותר וניסוח משודרג, יש אפשרות להפעיל מצב ענן: התמלול הראשוני נעשה מקומית, והליטוש הסופי - ניסוח, חלוקה לפסקאות, התאמה לטון - נעשים בענן.
מבחינתנו, אנשי אודיו והפקה, זה פותח כמה שימושים ברורים: תיעוד הערות בימוי בזמן חזרה, תמלול ראיונות, בניית גרסאות טקסט לסצנות מאולתרות, או פשוט שמירת רעיונות מוזיקליים/טקסטואליים כטקסט אפשרי לשיר או לדיבור/דיבוב.
שימושים אפשריים לאנשי אודיו, במה ותוכן
טכנאי אולפן ומיקס
טכנאי יכול להכתיב לעצמו בזמן סשן הערות על טקים בהקלטות, הגדרות מיקרופונים, בעיות אקוסטיות והערות לגבי המיקס - ולקבל בסיום סשן מסמך מסודר במקום דף קשקושים. אפשר גם לתעד באסוציאטיביות ("בבית השני הקול מציק, לבדוק קומפרסיה, אולי להחליף מיקרופון") ולתת לכלילסדר את זה כנקודות מסודרות.
במאים ושחקנים
במהלך חזרות, הבמאי יכול להכתיב הערות בזמן אמת לגבי משחק, חסימות (blocking), קצב סצנה ורעיונות לצילום - מבלי לעצור ולרשום ידנית. השחקנים יכולים להשתמש באפליקציה כדי לתמלל תרגולי טקסט, לעקוב אחרי שינויי ניסוח בין חזרות, ולייצר מהר מסגרת של גרסאות טקסט שונות לסצנה.
תסריטאים ויוצרי תוכן
מי שמפתח רעיונות בעל-פה - בנסיעה, בהליכה או על כוס קפה - יכול פשוט לדבר אל המכשיר ולקבל מסמך ראשוני שניתן להדביק לתוכנת כתיבה או לתוכנת ניהול פרויקטים. מצבי הטקסט השונים (נקודות, רשימה קצרה, גרסה "פורמלית") מאפשרים לעבור מהר בין סיעור מוחות חופשי לבין טקסט קריא שאפשר לשלוח הלאה לצוות.
איך עובדים עם Eloquent - זרימת עבודה בסיסית
- התקנה וסט-אפ - מורידים את Google AI Edge Eloquent ל-iOS, עוברים תהליך הרשאות למיקרופון ובוחרים אם להתחיל בעבודה offline (ללא צורך באינטרנט) בלבד או לאפשר גם מצב ענן לשיפור טקסט.
- יצירת "סשן" חדש - פותחים הקלטה חדשה לפי סוג המשימה: הערות סשן, חזרה, רעיון תסריט, סיכום פגישה וכו'.
- דיבור חופשי - בזמן הדיבור רואים גל-קול ולייב-טקסט; אין צורך לדבר"לאט בשביל ה'מחשב' :), המודל מיועד להתמודד עם דיבור שוטף יחסית.
- סיום וניקוי - עם עצירת ההקלטה, הכלי מעבירה את הטקסט ניקוי שני: מוציאה מילים כמו "אה" ו"אממ", מסדרת משפטים ומציע פורמט טקסט רצוי.
- ייצוא והמשך עבודה - את הטקסט אפשר להעתיק ולשלוח לתסריט, לדוקומנט הפקה, למייל או לצ'אט צוות, או לשמור באפליקציה כמסמך עבודה מתמשך.
כלי קומפקטי לעבודה יומיומית
Eloquent לא מנסה להחליף תוכנת עריכת תסריטים או מנהל פרויקטים, אלא למלא את המקום שבו רוב הרעיונות וההערות נולדים - בדיבור חופשי ובזמן שבו אתה הכי פחות מוכן עם אפשרות לתעד. עבור אנשי אודיו, אולפן ותוכן, זה עוד כלי קטן שנכנס לכיס: פחות רעיונות שהולכים לאיבוד, יותר טקסט מסודר שאפשר להעביר ישר לשלב הבא בשרשרת ההפקה.
חינם... ועם פרטיות. אה כן, ולאנדרואיד ממש בקרוב.