자율주행, 자연어 인식 등 인공지능 프로그램 개발을 위해 인공지능이 학습 데이터를 쉽게 인식할 수 있도록 텍스트, 사진 이미지, 동영상, 사운드 등의 파일에 등장하는 사물, 동식물, 특정 단어 등에 라벨(정보 표식)을 수집하고 입력하여 가공한다.
수행직무
작업 전 프로젝트 가이드를 숙지한다. 조건에 부합하는 이미지, 영상을 촬영하거나 음성 또는 사운드를 녹음하여 업로드한다. 또는 상황별 적절한 Q&A 데이터셋을 생성한다. 이미지에서 정해진 대상으로 마우스로 드래그하여 박스를 그린다. 대상에 특정 부위에 점을 찍는 직업은 스켈레턴 추출작업을 한다. 사진 속 사람의 얼굴 표정을 보고 감정을 추론해 태깅하거나 이미지를 글로 상세히 묘사하는 작업을 한다. 화자가 특정 동작이나 대사를 말할 때 해당 구간 선택, 고객사에서 필요한 데이터에 따라 영상의 구간을 선택해 추출한다. 구간 추출 후에는 감정을 태깅하거나 대사를 받아쓰는 직업을 한다. 주어진 시나리오에 맞는 Q&A 대화 만들거나 제시된 지문 읽고 질문 만드는 작업을 한다. 주어진 문장을 읽고 의미가 같은지 다른지 태깅하는 작업, 주어진 지문을 읽고 핵심 내용을 요약하는 작업, 문장을 읽고 느껴지는 감정을 태깅하는 작업을 한다. 주어진 음성을 듣고 들리는 대로 받아쓰는 작업을 한다. 기준음성과 비교 대상음성을 듣고 화자가 같은지 다른지를 태깅하는 작업을 한다.