דיבור לטקסט של Microsoft Azure הוא אחת הפלטפורמות המתקדמות ביותר לזיהוי קולי בסביבה. כחלק ממגוון המוצרים של שירותי דיבור קוגניטיבי של מיקרוסופט, הוא עושה שימוש באלגוריתמי למידה עמוקים כדי להתגבר על איכות צליל ירודה ויכול להסתגל לסגנונות דיבור מגוונים לתעתיקי שמע מדויקים. בסקירת הנאום לטקסט הזה של מיקרוסופט נבחן מקרוב את השירות הזה.
ראוי לציין כי דיבור לטקסט של מיקרוסופט אינו מהווה תוכנה להכתבה ידידותית למשתמש. במקום זאת, מדובר בפלטפורמה המכוונת למפתחים שנועדה לעזור לעסקים ליצור, לבדוק ולנהל את המוצרים שלהם. אם אתה רק רוצה לתמלל קבוצה של קבצי שמע, אפליקציות חלופיות לדיבור לטקסט עשויות להיות אפשרות טובה יותר. עיין במדריך התוכנה הטוב ביותר לדיבור לטקסט שלנו לקבלת האלטרנטיבות הטובות ביותר.
Microsoft Azure נאום לטקסט: תוכניות ותמחור
בעזרת דיבור לטקסט של Microsoft Azure אתה יכול לתמלל עד חמש שעות שמע בחינם וליצור מודל קולי אחד בהתאמה אישית בחודש. עם זאת, עם התוכנית החינמית, רק בקשת שמע בודדת זמינה זמינה בכל פעם, כלומר אפשרות זו אינה ברת קיימא עבור מרבית העסקים.
חיוב שירות דיבור Azure מחולק לתוספות של שנייה. (זיכוי תמונה: מיקרוסופט)
אם ברצונך לתמלל יותר מקליפ דיבור אחד בבת אחת, תצטרך לשדרג למערכת התמחור הסטנדרטית של Azure. מחיר זה כולל $ 1 לשעה של שמע ותומך בעד 20 בקשות במקביל. חיובים נוספים כרוכים אם אתה צריך להשתמש במודל אודיו מותאם אישית או לתמלול קבצי קול רב ערוציים. השירותים הנוספים הללו עולים $ 1.40 ו- $ 2.10 לשעת שמע בהתאמה.
למרות שמיקרוסופט מפרטת את המחירים שלה ב “לשעת שמע” בפורמט, כמו הסטנדרט בתעשייה, החיוב מחולק למעשה לתוספות של שנייה כך שלא תשלם עבור זמן עיבוד רב יותר מהנדרש.
Microsoft Azure נאום לטקסט: תכונות
התכונה העיקרית של Azure Speech to Text היא הגישה שהיא מעניקה למערכת עיבוד השפה הטבעית החזקה של מיקרוסופט. במהלך השנים האחרונות נאום AI של מיקרוסופט הגיע לכמה אבני דרך חשובות. המשמעות היא שעכשיו היא יכולה להשלים משימות שבעבר לא היו אפשריות עבור שירות זיהוי דיבור, כגון שידור מדויק של דיבורים בין שיחות בקבוצות קטנות.
שירות דיבור לטקסט של Microsoft Azure יכול להשתלב עם Office 365 לדיוק אופטימלי. (זיכוי תמונה: מיקרוסופט)
תכלת עובדת עם עשרות שפות וניבים וניתן להתאמן – באמצעות מודלים של זיהוי דיבור בהתאמה אישית – כדי להתאים טוב יותר לסגנון הדיבור של המשתמש, לרעש בסביבת רקע ואוצר מילים. אם הארגון שלך כבר מחויב למערכת האקולוגית של מוצרי מיקרוסופט, אתה יכול למנף נתוני Office 365 של משתמשים כדי לשפר טוב יותר את דיוק זיהוי הדיבור עבור מונחים ספציפיים לארגון. וחשוב מכך, ניתן לעשות זאת מבלי לפגוע באבטחת הנתונים שלך מכיוון שניתן להפעיל דיבור לטקסט באופן מקומי.
Microsoft Azure נאום לטקסט: התקנה
Microsoft Azure תוכנן עבור מפתחים ולא עבור צרכנים. משמעות הדבר היא שהקמתו היא הליך מעורב ומאתגר במקצת שהכי טוב למישהו עם ידע רב טכני.
הגדרת Azure אינה בדיוק פשוטה אלא אם כן יש לך ניסיון בקידוד. (זיכוי תמונה: מיקרוסופט)
הדרך המהירה ביותר להגדרת תצורה של Azure היא להשתמש ב- Azure Speech SDK בשפת תכנות כמו Java או C ++. לשם כך תצטרך להירשם לחשבון Azure בחינם וליצור פרויקט ריק בסביבת הפיתוח שלך. לאחר מכן תצטרך להשתמש ב- Microsoft Visual Studio ולכתוב תוכנית קצרה כדי לאתחל את אובייקט ה- SpeechRecognizer של מיקרוסופט.
Microsoft Azure נאום לטקסט: ממשק
בדומה לפלטפורמות שעתוק בתפזורת אחרות, Microsoft Azure Speech to Text מיועד להפעלה כממשק תכנות יישומים (API), נוסף לתוכניות Office 365, או לשילוב בפלטפורמות ושירותים חדשים. בגלל זה, אין ממשק דיבור לטקסט אחד. מה שמשתמש הקצה יראה תלוי בשילוב Azure Speech to Text.
הפורטל המקוון Azure הוא אינטואיטיבי ונוח לשימוש. (זיכוי תמונה: מיקרוסופט)
בינתיים, היזם המנהל את Azure יעשה זאת דרך פורטל Azure המקוון של מיקרוסופט, שמרגיש מודרני וקל לניווט. לוקח מספר דקות לאתר את דף המשאבים של שירותי הדיבור, וברגע שנוסף מופע לחשבונך, ניתן לצפות בהתראות ניטור ושימוש בחלון אחד..
Microsoft Azure נאום לטקסט: ביצועים
כחלק מבדיקת הדיבור לטקסט של מיקרוסופט, היינו מעוניינים לראות כיצד פלטפורמה זו התמודדה עם האתגר של עיבוד הקלטות קוליות גולמיות, לאחר שברגע שחשבון Azure שלנו היה מוכן להעלאה, העלנו סדרת קליפים עם רמות שונות של רעש רקע. . מעבר לכל לוח, Azure עשתה עבודה טובה בעיבוד הדגימות שלנו מכיוון שלא ראינו יותר מקומץ טעויות במהלך הערכתנו.
הפעלת מודל הדיבור המותאם אישית של Azure שיפרה את דיוק התמלול שלנו. (זיכוי תמונה: מיקרוסופט)
תכלת אמנם התאמצה מעט בעת עיבוד ביטויים נדירים או מיוחדים כמו שמות קבוצות ספורט ומונחים מדעיים בהתחלה, אך הדבר נפתר במהירות על ידי הפעלת אפשרות הפלט של הדגם המותאם אישית. לאחר שהפעלנו אפשרות זו, Azure הצליחה להסתגל לסגנון אוצר המילים והדיבור הייחודי בו השתמשנו.
דיבור לטקסט של מיקרוסופט: תמיכה
כדי ללמוד כיצד לקיים אינטראקציה עם SDK לשירותי שירותי דיבור דרך שפות תכנות שונות ולשלב את הפונקציות של Azure Speech לטקסט בפלטפורמה משלך, אתה בהחלט תזדקק לעזרה. למרבה המזל, מיקרוסופט יצרה קטלוג מקיף של חומרי הדרכה לפלטפורמת Azure, בו תוכלו למצוא דוגמאות קוד וטיפים שימושיים..
פרק ההדרכה באתר Azure מכיל משאבים מועילים רבים. (זיכוי תמונה: מיקרוסופט)
כמו כן, כל לקוחות Azure מקבלים תמיכה בחיוב וניהול מנוי בחינם, אשר ניתן לגשת אליהם באמצעות מערכת כרטיסים. ניתן להוסיף תמיכה מעמיקה יותר לחשבונך תמורת עמלה חוזרת, החל מ- $ 29 לחודש.
נאום לטקסט של מיקרוסופט Azure: פסק דין סופי
פלטפורמת הדיבור לטקסט Azure עושה שימוש בטכנולוגיה מתקדמת בכדי לספק שירות תמלול כמעט מושלם. זה המתאים ביותר לעסקים שכבר הושקעו במערכת האקולוגית של Microsoft Office 365 מכיוון שניתן ליצור בצורה מאובטחת מודלים של קול ואוצר מילים בהתאמה לארכיון המסמכים הקיים שלך. חלק מהעסקים הקטנים עשויים להיאבק עם Azure שכן הקמתה כראוי דורשת תשומת לב מצד מפתח ענן של מיקרוסופט.
התחרות
אמזון טרנסקריב, Google Cloud Speech-to-Text ו- Watson Speech to Text הם מתחרים ישירים ל- Microsoft Azure. שלוש הפלטפורמות הללו גם כולן מסוגלות לבצע תעתיקי אצווה בנפח גבוה במדויק. Google Cloud הוא המתחרה הקרוב היחיד שמסוגל לעבוד עם יותר שפות מ- Azure, וזה גם זול יותר, עם קצב התחלתי של 0.006 $ בלבד לדקה לעומת 0.017 $ של Azure.
כדי למצוא חלופות אחרות ל- Microsoft Azure Speech to Text, עיין במדריך התוכנה הטוב ביותר לדיבור לטקסט שלנו.