人工知能を支える人々とプロセス
公開日: 2019 年 4 月 1 日 / 更新日: 2019 年 4 月 1 日 - 著者: Konrad Wolfenstein
人工知能は雇用を奪い、人間の労働者を代替するものとして悪い評判があります。 一部の分野ではこれが当てはまりますが、他の分野、特にデータのクリーニングと処理に関しては、AI が新しい仕事をリードしています。
「データのラベル付けとアノテーション」は、AI から生まれた新興産業です。 カメラやソーシャル メディア データなどのソースからの非構造化データ セット、またはデータベースなどの構造化ソースは、人々の間の相違点と類似点を示すためにラベル付け、強調表示、色付け、または強調表示されます。 機械に一時停止標識が何であるかを学習させるには、人が道路のカメラ映像の中に入って、写真に写っているすべての一時停止標識にマークを付ける必要があります。 その後、マシンにはこれらの数千枚の画像を識別するデータが供給されます。 時間の経過とともに、ラベル付けされたデータを処理すると、システムは一時停止標識が何であるかをより正確に識別できるようになります。 より多くのデータを受信することでシステムの精度が向上する、このタイプの機械学習はディープラーニングと呼ばれます。
このプロセスはアルゴリズムがコア機能を正確に実行するために不可欠であるため、データラベリング業界は今後 5 年間で重要性が高まるでしょう。 2018 年の AI および機械学習のデータ準備の市場は、人が手動でデータにラベルを付けることに大きく依存するプロセスであり、5 億ドルでした。 Cognilyticaによると、その額は 2 倍以上に増加し、2023 年までに 12 億ドルに達すると予想されています サードパーティプロバイダーは、この成長が大幅に増加し、同じ期間で市場の 1 億 5,000 万ドルから 10 億ドルに増加すると予想しています。 データのラベル付けは、オブジェクトと画像の認識、自動運転車、テキストと画像のラベル付けを扱う AI にとって特に重要です。
人工知能は仕事を奪うもの、人間の代わりになるものとして悪い評判を受けています。 一部の分野ではこれは真実ですが、他の分野、特にデータのクリーニングと処理方法に関しては、AI が新しい仕事の先頭に立っているのです。
データのラベル付けと注釈は、AI から生まれた急成長産業です。 カメラやソーシャル メディア データなどのソースからの非構造化データセット、またはデータベースなどの構造化ソースは、人ごとの相違点や類似点を示すためにラベル付け、マーク付け、色付け、または強調表示されます。 機械に一時停止標識が何であるかを学習させるには、人が道路のカメラ映像に入り、写真内のすべての一時停止標識にマークを付ける必要があります。 次に、マシンにはこれらの何千もの画像を識別するデータが供給されます。 時間が経つにつれて、システムはラベル付けされたデータを処理することで、一時停止標識が何であるかをより正確に識別できるようになります。 より多くのデータが供給されることでシステムの精度が向上する、このタイプの機械学習はディープラーニングと呼ばれます。
このプロセスはアルゴリズムがその機能の中核部分を正確に実行するために不可欠であるため、データラベリング業界は今後 5 年間で本格化すると予想されます。 2018 年の AI および機械学習のデータ準備の市場は、人による手作業によるデータのラベル付けに大きく依存するプロセスであり、その規模は 5 億ドルでした。 Cognilyticaによると、その額は 2 倍以上に増加し、2023 年までに 12 億ドルに達すると予想されています。サードパーティプロバイダーは、同じ期間で市場の 1 億 5,000 万ドルから 10 億ドルまで、その成長が大幅に増加すると予想しています。 データのラベル付けは、物体と画像の認識、自動運転車、テキストと画像の注釈を扱う AI にとって特に不可欠です。
Statistaでさらに詳しいインフォグラフィックを見つけることができます