רקע: כאשר בוחנים את הטכנולוגיות השונות שאיפשרו לאדם לנהל ממשק עם מכונה – נהוג להתחיל לפני כ 190, בימים הראשונים של מכונות הכתיבה. ראו למשל במאמר של Merry Meeker מקרן ההון סיכון בסיליקון וואלי – KPCB, מתוך - Internet Trends, 2016 (http://bit.ly/2dbfT5r ):
לאורך השנים הללו, הדרך להעביר מידע ולהזין נתונים עירבה הקשה או הקלדה ובאופן כללי מגע בין האדם המזין את הנתונים לבין ה"פלטפורמה" בין אם המדובר היה בכרטיסי ניקוב, דפים או מסמכים דיגיטלים.
עם הופעתם של המכשירים החכמים – PalmPilot ב 1996 והטלפון החכם, האייפון ב 2007, החל עידן חדש. מצד אחד, משטח המגע, הממשק הפיזי, הפך להיות מצומצם יותר – אך בהיות המכשירים מחוברים לרשת, ניתן היה לייצר תהליכי עבודה גמישים, התומכים בניידות המשתמש.
הממשק הטבעי הבא הנו - כמובן – הקול. החל ב 2011 עם הופעתה של SIRI - העוזרת האישית המפורסמת של apple, אשר יצרה שינויים עמוקים בתרבות עצמה – מעבר לחידוש הטכנולוגי – כפי שניתן להיווכח מסרטים וסדרות כגון Her (www.imdb.com/title/tt1798709/ ), Black Mirror ( http://www.imdb.com/title/tt2085059/ ) ועוד. נראה כי החזון המדובר מבלייד ראנר (המקורי...) קורם עור וגידים.
אך כפי שקורה במקרים רבים – יש פער בין הטכנולוגיה כפי שמפרסמים אותה בסרטים עלילתיים ובסרטוני התדמית, למציאות בשטח. יעידו על כך משתמשי SIRI ועוזרות אישיות אחרות - עדיין אנחנו נאלצים לשנות את האופן שבו אנחנו מדברים על מנת שמנונע זיהוי הדיבור יצליח לזהות את מה שאנחנו אומרים – כך שבמקום שהטכנולוגיה תסייע לנו, אנחנו מוצאים עצמנו משנים התנהגות ומתאימים את עצמנו לטכנולוגיה...
בחזרה למציאות: בחודשים האחרונים, וביתר שאת לאחר הדוח האחרון של Mary Meeker שם נכתב כי הקול כממשק יתחיל לעניין מותגים שונים בתהליכי יצירת ערך (קישור: http://bit.ly/2vyr52u ) ובהמשך לכך נעשים יותר ויותר מאמצים למצוא את הדרך הנכונה לייצור הערך והמימוש הנכון – כפי שניתן לראות במאמר זה בעברית על האופן שבו יש לתכנן אפליקציות בעידן הממשק הקולי (קישור: http://bit.ly/2BeECCa ). אנחנו עדים ליותר ויותר פתרונות בעולם הקול, החורגים מהתחום של עוזרת אישית \ רמקול חכם. שם העתיד נמצא.
אמזון שולטת היום ב 70% מעולם פתרונות הקול, בעיקר באמצעות הפעילות האגרסיבית שלה דרך ALEXA, על הרכיבים השונים שלה (Scott Galloway, L2Inc). יחד עם זה, ארגונים רבים המחפשים לממש ממשקים קולים מחפשים דרכים שונות להטמיע אותן – ולא בהכרח באמצעות המוצרים והטכנולוגיה של אמאזון. הסיבות לכך הן מגוונות, אך בשורה התחתונה אנו חווים פריחה בהתפתחות הממשקים הקוליים.
בהטמעת ממשק קולי, לכל חברה או פתרון המחפשים לעשות זאת, יש מספר אתגרים:
• דיוק – המשתמש מצפה מהממשק לזהות את קולו בצורה מדוייקת, בפעם הראשונה שהוא מדבר, בכל צורה שבה הוא מדבר – גם אם יש לו מבטא, או אם הוא לא אומר את הערכים המדוייקים, ובאופן כללי – הוא מצפה לדבר באופן חופשי ופתוח.
• קלות ההטמעה – רבות מן החברות המבקשות להטמיע ממשק קולי אינן חברות טכנולוגיה – חברות אלו עשויות להיות חברות קמעונאיות, חברות שירותים, שירותים פיננסיים, חברות ייצור מוצרי צרכנות, ועוד ועוד.
• אבטחת המידע – עבור חברות מסויימות, מקום העיבוד והאפשרות שימוש של המידע על ידי הגורם המעבד את המידע עשוי להיות רגיש. פרטיות המידע חשובה הן לחברות והן למשתמשים שלה. ראו למשל כאן (קישור: http://bit.ly/2AzhWJP )
מעל לכל הנאמר כאן, נראה כי עדיין לא ברור מה יהא ה VUI UX – דהיינו חווית המשתמש של הממשק הקולי. האם הקול של העוזר\ת צריך להיות נשי או גברי? האם המשתמש צריך לעשות engagement צמוד לפתרון או שצריכה להיות חוויה מינימליסטית, מה הממשק הגרפי אמור לשקף במקביל לאינטראציה הקולית – במקום שיש מסך, איך מתנהל הממשק הקולי ללא מסך (voice first) ועוד.
נעשים המון נסיונות כל הזמן, וככל שעובר הזמן אנו קרבים לנקודה שבה יהיה best practice לדרך הטמעת הממשק הקולי בצורה נכונה. כרגע – מתבצע המון ניסוי וטעיה.
על אף שאנחנו עדיין בתקופה שבה הממשק הקולי מתהווה, ניתן גם לדבר על העתיד. אנחנו נראה ממשקים קוליים מעורבים באופן אינטנסיבי בפתרונות ה commerce – אפשר כבר לראות עוד ועוד התייחסויות ל VCommerce, פרסומות מותאמות אישית ואינטראקטיביות וכמובן – הרכב האוטונומי.
עמיר צרויה הוא שותף יזם, מנכ"ל טוקואורו
amir@tukuoro.com
Tukuoro, the Voice Layer
רקע: כאשר בוחנים את הטכנולוגיות השונות שאיפשרו לאדם לנהל ממשק עם מכונה – נהוג להתחיל לפני כ 190, בימים הראשונים של מכונות הכתיבה. ראו למשל במאמר של Merry Meeker מקרן ההון סיכון בסיליקון וואלי – KPCB, מתוך - Internet Trends, 2016 (http://bit.ly/2dbfT5r ):
לאורך השנים הללו, הדרך להעביר מידע ולהזין נתונים עירבה הקשה או הקלדה ובאופן כללי מגע בין האדם המזין את הנתונים לבין ה"פלטפורמה" בין אם המדובר היה בכרטיסי ניקוב, דפים או מסמכים דיגיטלים.
עם הופעתם של המכשירים החכמים – PalmPilot ב 1996 והטלפון החכם, האייפון ב 2007, החל עידן חדש. מצד אחד, משטח המגע, הממשק הפיזי, הפך להיות מצומצם יותר – אך בהיות המכשירים מחוברים לרשת, ניתן היה לייצר תהליכי עבודה גמישים, התומכים בניידות המשתמש.
הממשק הטבעי הבא הנו - כמובן – הקול. החל ב 2011 עם הופעתה של SIRI - העוזרת האישית המפורסמת של apple, אשר יצרה שינויים עמוקים בתרבות עצמה – מעבר לחידוש הטכנולוגי – כפי שניתן להיווכח מסרטים וסדרות כגון Her (www.imdb.com/title/tt1798709/ ), Black Mirror ( http://www.imdb.com/title/tt2085059/ ) ועוד. נראה כי החזון המדובר מבלייד ראנר (המקורי...) קורם עור וגידים.
אך כפי שקורה במקרים רבים – יש פער בין הטכנולוגיה כפי שמפרסמים אותה בסרטים עלילתיים ובסרטוני התדמית, למציאות בשטח. יעידו על כך משתמשי SIRI ועוזרות אישיות אחרות - עדיין אנחנו נאלצים לשנות את האופן שבו אנחנו מדברים על מנת שמנונע זיהוי הדיבור יצליח לזהות את מה שאנחנו אומרים – כך שבמקום שהטכנולוגיה תסייע לנו, אנחנו מוצאים עצמנו משנים התנהגות ומתאימים את עצמנו לטכנולוגיה...
בחזרה למציאות: בחודשים האחרונים, וביתר שאת לאחר הדוח האחרון של Mary Meeker שם נכתב כי הקול כממשק יתחיל לעניין מותגים שונים בתהליכי יצירת ערך (קישור: http://bit.ly/2vyr52u ) ובהמשך לכך נעשים יותר ויותר מאמצים למצוא את הדרך הנכונה לייצור הערך והמימוש הנכון – כפי שניתן לראות במאמר זה בעברית על האופן שבו יש לתכנן אפליקציות בעידן הממשק הקולי (קישור: http://bit.ly/2BeECCa ). אנחנו עדים ליותר ויותר פתרונות בעולם הקול, החורגים מהתחום של עוזרת אישית \ רמקול חכם. שם העתיד נמצא.
אמזון שולטת היום ב 70% מעולם פתרונות הקול, בעיקר באמצעות הפעילות האגרסיבית שלה דרך ALEXA, על הרכיבים השונים שלה (Scott Galloway, L2Inc). יחד עם זה, ארגונים רבים המחפשים לממש ממשקים קולים מחפשים דרכים שונות להטמיע אותן – ולא בהכרח באמצעות המוצרים והטכנולוגיה של אמאזון. הסיבות לכך הן מגוונות, אך בשורה התחתונה אנו חווים פריחה בהתפתחות הממשקים הקוליים.
בהטמעת ממשק קולי, לכל חברה או פתרון המחפשים לעשות זאת, יש מספר אתגרים:
• דיוק – המשתמש מצפה מהממשק לזהות את קולו בצורה מדוייקת, בפעם הראשונה שהוא מדבר, בכל צורה שבה הוא מדבר – גם אם יש לו מבטא, או אם הוא לא אומר את הערכים המדוייקים, ובאופן כללי – הוא מצפה לדבר באופן חופשי ופתוח.
• קלות ההטמעה – רבות מן החברות המבקשות להטמיע ממשק קולי אינן חברות טכנולוגיה – חברות אלו עשויות להיות חברות קמעונאיות, חברות שירותים, שירותים פיננסיים, חברות ייצור מוצרי צרכנות, ועוד ועוד.
• אבטחת המידע – עבור חברות מסויימות, מקום העיבוד והאפשרות שימוש של המידע על ידי הגורם המעבד את המידע עשוי להיות רגיש. פרטיות המידע חשובה הן לחברות והן למשתמשים שלה. ראו למשל כאן (קישור: http://bit.ly/2AzhWJP )
מעל לכל הנאמר כאן, נראה כי עדיין לא ברור מה יהא ה VUI UX – דהיינו חווית המשתמש של הממשק הקולי. האם הקול של העוזר\ת צריך להיות נשי או גברי? האם המשתמש צריך לעשות engagement צמוד לפתרון או שצריכה להיות חוויה מינימליסטית, מה הממשק הגרפי אמור לשקף במקביל לאינטראציה הקולית – במקום שיש מסך, איך מתנהל הממשק הקולי ללא מסך (voice first) ועוד.
נעשים המון נסיונות כל הזמן, וככל שעובר הזמן אנו קרבים לנקודה שבה יהיה best practice לדרך הטמעת הממשק הקולי בצורה נכונה. כרגע – מתבצע המון ניסוי וטעיה.
על אף שאנחנו עדיין בתקופה שבה הממשק הקולי מתהווה, ניתן גם לדבר על העתיד. אנחנו נראה ממשקים קוליים מעורבים באופן אינטנסיבי בפתרונות ה commerce – אפשר כבר לראות עוד ועוד התייחסויות ל VCommerce, פרסומות מותאמות אישית ואינטראקטיביות וכמובן – הרכב האוטונומי.
עמיר צרויה הוא שותף יזם, מנכ"ל טוקואורו
amir@tukuoro.com
Tukuoro, the Voice Layer
הודעתך לא התקבלה - נסה שוב מאוחר יותר
Oops! Something went wrong while submitting the form