본문 바로가기 주메뉴 바로가기

Works

저작도구 및 솔루션

자연어 처리 분야 저작도구(Annotation Tool)

1) 추상 요약문 검증 데이터 구축

추상 요약문 정제/가공을 위한 어노테이션

2) 말뭉치 : 시소러스 / 개체명 데이터 구축

시소러스 구축을 위한 어노테이션
(1차집필 - 정의문 작성, 패싯 태깅)

개체명 데이터 구축을 위한 어노테이션
(2차집필 - 품사 선택, 상위어-하위어-관계어 설정)

Vision Task(Image/Video) Annotation

1) Segmentation

Semantic Segmentation : 이미지의 모든 픽셀(요소)에 클래스 라벨을 예측하는 라벨링 방법(instance 사이의 구분 없음)

Instance Segmentation : 이미지의 모든 instance(물체)에 대해서 클래스 라벨을 예측하고, 추가로 임의의 ID를 부여

Pandptic Segmentation : 두 가지의 segmentation을 결합한 형태로 이미지 안의 모든 화소에 대해 클래스 라벨을 예측하고 임의의 ID를 부여

Semantic Segmentation

색칠 공부처럼 이미지 상의 모든 픽셀에 대해 클래스 카테고리를 부여한다.

중첩은 분할하지 않고 인식한다.

하늘이나 길과 같은 물체로 셀 수 없는 클래스의 영역 분할로 가능하다.

U-NET을 이용한 Auto Encoder 방식이 주된 사용 예이다.

Instance Segmentation

Object detection과 같은 물체의 인식을 픽셀 레벨에서 수행하는 태스크이다.

중첩의 경우 분할하여 인식한다.

Rol 단위로 모든 것을 분할할 수는 없다.

Mask R-CNN이 주요 모델이며, detection 기법을 사용하며 instance 영역을 취득한 후, 각각의 영역에 대해 mask를 예측한다.

Pandptic Segmentation

semantic cegmentation과 instance segmentation을 결합한 방식이다.

이 태스크에서는 셀 수 있는 클래스(예를 들어 차나 사람)를 Thing 클래스라고 하며, 셀 수 없는 클래스(예를 들어 하늘이나 길)는 Stuff 클래스 라고 하는데, Thing 클래스에 대해서는 Instance Segmentation, Stuff 클래스에 대해서는 semantic segmentation을 수행한다.

2) 키포인트 / 바운딩박스 / 폴리곤 / 큐보이드 / 스켈레톤

[ 3D Cuboid ]

[ Skeleton ]

[ Auto Annotation ] 머신러닝 or 딥러닝을 통한 Prediction data 생성

[ Video Annotation ]