האנשים והתהליכים שמאחורי בינה מלאכותית
בחירת קול 📢
פורסם בתאריך: 1 באפריל, 2019 / עודכן בתאריך: 1 באפריל, 2019 – מחבר: Konrad Wolfenstein
לבינה מלאכותית יש מוניטין רע כגורם לגרימת מקומות עבודה ותחליף לעובדים אנושיים. בתחומים מסוימים זה נכון, אך באחרים, במיוחד בכל הנוגע לניקוי ועיבוד נתונים, בינה מלאכותית מובילה את הדרך ביצירת מקומות עבודה חדשים.
' תיוג נתונים וביאורים' היא תעשייה פורחת שצמחה מהבינה המלאכותית. מערכי נתונים לא מובנים ממקורות כמו מצלמות ומדיה חברתית, או מקורות מובנים כמו מסדי נתונים, מתויגים, מתויגים, צבועים או מודגשים כדי לחשוף הבדלים ודמיון בין אנשים. כדי לאמן מכונה לזהות תמרור עצור, אדם ייכנס לצילומי מצלמת רחוב ויתייג את כל תמרורי העצור בתמונה. לאחר מכן המכונה תקבל נתונים המזהים אלפי תמונות אלה. עם הזמן, על ידי עיבוד הנתונים המתויגים, המערכת תוכל להיות מדויקת יותר בזיהוי מהו תמרור עצור. סוג זה של למידת מכונה, שבו מערכת משפרת את הדיוק על ידי קבלת נתונים נוספים, נקרא למידה עמוקה.
מכיוון שתהליך זה חיוני עבור אלגוריתמים לביצוע מדויק של פונקציות ליבה, תעשיית תיוג הנתונים תצבור חשיבות משמעותית בחמש השנים הקרובות. בשנת 2018, שוק הכנת נתוני בינה מלאכותית ולמידת מכונה, תהליך התלוי במידה רבה בבני אדם המבצעים תיוג ידני של נתונים, הוערך ב-500 מיליון דולר. על פי Cognilytica , צפוי כי סכום זה יוכפל ביותר מפי שניים, ויגיע ל-1.2 מיליארד דולר עד 2023. ספקי צד שלישי צופים עלייה משמעותית בצמיחה זו, מגודל שוק של 150 מיליון דולר למיליארד דולר באותה תקופה. תיוג נתונים חשוב במיוחד עבור יישומי בינה מלאכותית כגון זיהוי אובייקטים ותמונות, כלי רכב אוטונומיים, והערות טקסט ותמונה.
בינה מלאכותית זוכה למוניטין רע כגורמת לגרימת מקומות עבודה ומחליפה של עובדים אנושיים. בתחומים מסוימים זה נכון, אך באחרים, במיוחד סביב אופן ניקוי ועיבוד נתונים, בינה מלאכותית מובילה יצירת מקומות עבודה חדשים.
תיוג נתונים והערות הם תעשייה פורחת שנולדה מבינה מלאכותית. מערכי נתונים לא מובנים ממקורות כמו מצלמות ונתוני מדיה חברתית או מקורות מובנים, כמו מסדי נתונים, מתויגים, מסומנים, צבועים או מודגשים כדי להראות הבדלים ודמיון בין אנשים. כדי לאמן מכונה ללמוד מהו תמרור עצור, אדם חייב להיכנס לצילומי מצלמה של רחוב ולסמן את כל תמרורי העצור בתמונה. לאחר מכן המכונה מוזנת בנתונים המזהים אלפי תמונות אלה. עם הזמן המערכת יכולה לזהות בצורה מדויקת יותר מהו תמרור עצור על ידי עיבוד הנתונים המתויגים. סוג זה של למידת מכונה, שבו מערכת הופכת מדויקת יותר על ידי הזנת נתונים נוספים, נקרא למידה עמוקה.
מכיוון שתהליך זה חיוני עבור אלגוריתמים כדי לבצע במדויק חלקים מרכזיים של תפקידם, תעשיית תיוג הנתונים צפויה להמריא בחמש השנים הקרובות. בשנת 2018, שוק הכנת נתונים של בינה מלאכותית ולמידת מכונה, תהליך המסתמך במידה רבה על אנשים לתיוג ידני של נתונים, עמד על 500 מיליון דולר. על פי Cognilytica , צפוי כי שוק זה יוכפל ביותר מפי שניים, ויגיע ל-1.2 מיליארד דולר עד 2023. ספקי צד שלישי צופים עלייה משמעותית בצמיחה זו, מ-150 מיליון דולר בשוק למיליארד דולר באותה מסגרת זמן. תיוג נתונים חיוני במיוחד עבור בינה מלאכותית העוסקת בזיהוי אובייקטים ותמונות, כלי רכב אוטונומיים וביאור טקסט ותמונות.





















