数据标注员就是使用自动化的工具从互联网上抓取、收集数据。包括文本、图片、语音等等,然后对抓取的数据进行整理与标注。它相当于互联网上的专职编辑。目前标注员的工作内容常见的有拉框标点,打标签,分割,批注等等。其中分类就是最常见的打标签,比如标注画面上动物毛发颜色、动物耳朵等等;框选是将画面中相对应的对象标框标注;还有一种是描点标注,一般用于更细致的人脸标注:需要在眉毛、眼睛、鼻子、嘴巴等关键点做二十多个标记点。
从他们的基本工作内容就可以看出来,数据标注是个非常枯燥而又考验人耐力的工作,并且相比较AI所代表的高科技,标注看起来毫无技术含量。