1) 추상 요약문 검증 데이터 구축
추상 요약문 정제/가공을 위한 어노테이션
2) 말뭉치 : 시소러스 / 개체명 데이터 구축
시소러스 구축을 위한 어노테이션
(1차집필 - 정의문 작성, 패싯 태깅)
개체명 데이터 구축을 위한 어노테이션
(2차집필 - 품사 선택, 상위어-하위어-관계어 설정)
1) Segmentation
Semantic Segmentation : 이미지의 모든 픽셀(요소)에 클래스 라벨을 예측하는 라벨링 방법(instance 사이의 구분 없음)
Instance Segmentation : 이미지의 모든 instance(물체)에 대해서 클래스 라벨을 예측하고, 추가로 임의의 ID를 부여
Pandptic Segmentation : 두 가지의 segmentation을 결합한 형태로 이미지 안의 모든 화소에 대해 클래스 라벨을 예측하고 임의의 ID를 부여
Semantic Segmentation |
색칠 공부처럼 이미지 상의 모든 픽셀에 대해 클래스 카테고리를 부여한다. 중첩은 분할하지 않고 인식한다. 하늘이나 길과 같은 물체로 셀 수 없는 클래스의 영역 분할로 가능하다. U-NET을 이용한 Auto Encoder 방식이 주된 사용 예이다. |
Instance Segmentation |
Object detection과 같은 물체의 인식을 픽셀 레벨에서 수행하는 태스크이다. 중첩의 경우 분할하여 인식한다. Rol 단위로 모든 것을 분할할 수는 없다. Mask R-CNN이 주요 모델이며, detection 기법을 사용하며 instance 영역을 취득한 후, 각각의 영역에 대해 mask를 예측한다. |
Pandptic Segmentation |
semantic cegmentation과 instance segmentation을 결합한 방식이다. 이 태스크에서는 셀 수 있는 클래스(예를 들어 차나 사람)를 Thing 클래스라고 하며, 셀 수 없는 클래스(예를 들어 하늘이나 길)는 Stuff 클래스 라고 하는데, Thing 클래스에 대해서는 Instance Segmentation, Stuff 클래스에 대해서는 semantic segmentation을 수행한다. |
2) 키포인트 / 바운딩박스 / 폴리곤 / 큐보이드 / 스켈레톤
[ 3D Cuboid ]
[ Skeleton ]
[ Auto Annotation ] 머신러닝 or 딥러닝을 통한 Prediction data 생성
[ Video Annotation ]