Die Menschen und Prozesse hinter der künstlichen Intelligenz – The People and Process Behind Artificial Intelligence
Veröffentlicht am: 1. April 2019 / Update vom: 1. April 2019 – Verfasser: Konrad Wolfenstein
Künstliche Intelligenz hat einen schlechten Ruf als Jobkiller und Mensch-Arbeiter-Ersatz. In einigen Bereichen ist dies der Fall, aber in anderen, insbesondere in Bezug auf die Bereinigung und Verarbeitung von Daten, ist die KI führend bei neuen Jobs.
‚Data labeling and annotation‘ ist eine aufstrebende Branche, die aus der KI hervorgegangen ist. Unstrukturierte Datensätze aus Quellen wie Kameras und Social Media-Daten oder strukturierte Quellen wie Datenbanken werden beschriftet, markiert, gefärbt oder hervorgehoben, um Unterschiede und Ähnlichkeiten von Personen aufzuzeigen. Um eine Maschine zu trainieren, um zu lernen, was ein Stoppschild ist, muss eine Person in das Kameramaterial einer Straße gehen und alle Stoppschilder auf dem Foto markieren. Der Maschine werden dann Daten zugeführt, die Tausende dieser Bilder identifizieren. Mit der Zeit kann das System durch die Verarbeitung der gekennzeichneten Daten genauer erkennen, was ein Stoppschild ist. Diese Art des maschinellen Lernens, bei der ein System genauer wird, indem es mehr Daten erhält, wird als Deep Learning bezeichnet.
Da dieser Prozess für die Algorithmen zur genauen Ausführung der Kernfunktionen unerlässlich ist, wird die Data Labeling Industrie in den nächsten fünf Jahren an Bedeutung gewinnen. Im Jahr 2018 lag der Markt für KI- und maschinelle Lerndatenaufbereitung, ein Prozess, der stark von Menschen abhängig ist, die Daten manuell beschriften, bei 500 Millionen Dollar. Laut Cognilytica wird sich das voraussichtlich mehr als verdoppeln und bis 2023 1,2 Milliarden Dollar erreichen. Drittanbieter erwarten einen deutlichen Anstieg dieses Wachstums, der von 150 Millionen Dollar des Marktes auf 1 Milliarde Dollar im gleichen Zeitraum ansteigen wird. Das Data Labeling ist besonders wichtig für die KI, die sich mit Objekt- und Bilderkennung, autonomen Fahrzeugen sowie Text- und Bilbeschriftung beschäftigt.
Artificial intelligence gets a bad rap as a job killer and human-worker replacer. In some areas this is true, but in others, particularly surrounding how data are cleaned and processed, AI is spearheading new jobs.
Data labeling and annotation is a burgeoning industry born from AI. Unstructured datasets from sources like cameras and social media data or structured sources, like databases, are labeled, marked, colored, or highlighted to show differences, similarities by people. To train a machine to learn what a stop sign is, a person must go into camera footage of a street and mark up all the stop signs in the photo. The machine is then fed data identifying thousands of these images. Overtime the system can more accurately identify what a stop sign is by processing the labeled data. This type of machine learning, where a system gets more accurate by being fed more data, is termed deep learning.
As this process is essential for algorithms to accurately perform core parts of its function, the data labeling industry is set to take off over the next five years. In 2018, the market for AI and machine learning data preparation, a process that relies heavily on people to manually label data, stood at $500 million. According to Cognilytica, that is expected to more than double, reaching $1.2 billion by 2023. Third-party providers an expect to see a significant uptick in that growth, going from $150 million of the market to $1 billion over that same time frame. Data labeling is particularly essential for AI that deals with object and image recognition, autonomous vehicles, and text and image annotation.
You will find more infographics at Statista