この記事はMobility Technologies Advent Calendar 2022の21日目です。
DRIVE CHARTではMoT統合以前よりDeNA時代からデータ作成時のアノテーションツールとしてNotaを利用しています。近年では多数のOSS版アノテーションツールが普及しています。本記事ではNotaの代表的な機能の紹介に加え、様々なコンピュータビジョンタスク用のOSSアノテーションツールについて紹介します。
機械学習における分類タスクなどのモデル開発ではラベルのついたデータセットが必要になります。一般的にコンピュータビジョンタスク、自然言語処理タスクなどにおいて複雑なラベルを付与する場合、専用のツールがあるとアノテーション作業の効率が向上します。世の中には商用版、OSS版など様々なアノテーションツールが普及しています。DRIVE CHARTではMoT統合以前よりDeNA時代からNotaというDeNAが開発するOSSアノテーションツールを利用しています。本記事ではNotaの代表的な機能や特徴について紹介します。それ以外にも昨今普及しているコンピュータビジョンタスク用OSS版アノテーションツールをいくつか調査したので合わせて紹介します。
https://github.com/dena/nota
https://github.com/heartexlabs/label-studio
https://github.com/opencv/cvat
https://github.com/open-mmlab/labelbee-client
https://github.com/microsoft/VoTT
Notaを中心に複数のアノテーションツールを紹介しました。昨今では個人情報などのセンシティブなデータを運用するケースも多くセルフホスト版の導入ニーズが高まっているかもしれません。またアノテーターの方たちの生産性を損なわないためにショートカットキーなど使い勝手に関する機能も必要となってきます。Notaはアノテーターの方たちとAI開発者でPDCAを回しながら開発してきた現場指向のアノテーションツールです。興味のある方はぜひ使ってみてください。
それでは皆様よいアノテーションライフを!
興味のある方は 採用ページ も見ていただけると嬉しいです。
Twitter @mot_techtalk のフォローもよろしくお願いします!