본문 바로가기
교육

('23년 3월) 데이터라벨링 AIED 2급 자격증 후기

by 1983_0 2023. 3. 16.

데이터라벨링_aide2급_자격증 후기
인공지능 데이터전문가 2급_자격 후기

 

  데이터라벨러로 활발히 활동하기 위해 AIDE 자격증을 준비하면서 공부한 내용을 정리해 봤습니다. 저는 2023년 2월 내일배움카드를 통해 데이터라벨링 기초과정을 듣고 크라우드웍스 이론패키지를 수강한 후 3월 둘째 주에 AIDE 2급 자격증 시험을 보았는데요. 자격증 시험 전에 한 번씩 읽어보시면 도움이 될 거 같아 정리 및 요약한 것들입니다.

 

데이터라벨링 AIDE 2급 자격증 후기

시험난이도는 내배카 데이터라벨링 기초과정과 이론강의를 들었다면 쉽게 풀 수 있는 정도였어요. 저는 미리 시험준비를 해놓고  20분만에 풀정도로 어려워서 고민할 문제는 별로 없었어요. 인공지능 이론 20문항, 실습 프로젝트 30문항으로 모두 객관식으로 진행됩니다.

 

시험 응시시간은 60분이며 100점 만점에 60점 이상이 되면 합격할 수 있어요. 1문제당 배점이 2점이 아니라 각각 다르기 때문에 커트라인 생각할 때 유의하셔야 해요. 

 

 

 

 

 

 

 

1. 4차 산업과 인공지능

 

  • 4차 산업혁명 이해 : 4차 산업혁명은 <지능(AI)>과 <정보(빅데이터)>의 발전을 통한 산업혁명을 의미한다. 
    • 21세기 초반~ : 인공지능, 빅데이터, 사물인터넷, 3D프린팅, 로봇, 공유경제, 로봇
  • 인공지능 서비스 개념 : 인공지능 서비스는 데이터 획득, <데이터가공(전처리)>, 모델생성, 실시간서비스의 총 4단계로 구성된다.
    • 데이터획득 : IoT, Mobile, M2M을 통한 데이터인 이미지, 영상, 텍스트 등 수집과정을 말함.
      • M2M(Machine To Machine) - 사물(지능)통신, 기계간의 통신, 인간 개입이 없는 무인화, 지능화 서비스
    • 데이터 가공(전처리) : 데이터 라벨링, 구분·선별, 포맷변경, 결합, 변형 등
      • 데이터라벨링(Data Labeling) - 사람이 만든 사진, 문서 등 데이터를 인공지능이 학습할 수 있는 형태로 가공하는 작업.
    • 모델생성 : 모델개발 → 데이터 입력 → 데이터 학습 → 모델수정
      • 머신러닝(ML) 학습 종류 - 지도학습, 비지도 학습, 강화학습
  • 인공지능 발전단계 : 인공지능의 발전은 1단계 AI개념, 2단계 전문가 시스템, 3단계 <머신러닝><딥러닝>으로 발전하고 있다.
    • 인공지능의 아버지 - 엘렌 튜링

 

2. 인공지능 방법론

 

  • 인공지능 원리 : <퍼셉트론, perceptron>은 신경망 (딥러닝)의 기원이 되는 알고리즘으로 프랑크 로젠블라트가 고안한 알고리즘이다.
    • 1957년 로젠블라트가 고안한 알고리즘
    • 딥러닝(신경망)의 기원이 되는 알고리즘
  • 신경망의 구조 : 신경망(인공신경망)은 <입력층(input layer)>,<은닉층(hidden layer)>, <출력층(output layer)>으로 구성되어 있다.
    • 인공신경망(ANN) : 생물학의 신경망에서 영감을 얻음. 입력층, 은닉층, 출력층으로 구성된다.
    • 인공지능(AI) > 머신러닝(ML) > 딥러닝(DL)
    • 머신러닝과 딥러닝 차이점 : 기계의 자기 학습 여부
  • 머신러닝의 학습방법 : 머신러닝은 <지도> 학습, <비지도> 학습, <강화> 학습을 사용한다.
    • 지도학습 - (예측, 분류) 문제와 정답을 알려주고 학습(분류, 회귀)
    • 비지도학습 - (연관규칙, 군집) 답을 알려주지 않고 학습
    • 강화학습 - (보상) 보상을 통해 학습

 

3. 인공지능 알고리즘

 

  • 딥러닝 학습데이터 : 딥러닝 학습을 위하여 데이터는 <훈련(train)>데이터와 <평가(test)>데이터로 분류하여 사용한다.
    • 딥러닝(Deep Learning) - 기계가 자동으로 대규모 데이터에서 패턴과 규칙을 학습. 의사결정이나 예측등을 수행하는 기술, 여러 층을 가진 인공신경을 사용하여 머신러닝 학습을 수행.
    • epochs(에포크) - 반복적인 학습
  • 인공지능 객체검출 : 학습을 통하여 여러 개의 객체를 인식하고 인식된 객체를 검출하는 것을 객체검출<Object Detection>이라 한다.
    • 분류(Classification) - 1개의 객체를 찾는 것을 말함.
    • 영역표시(Localization) - 분류를 통해 검출한 객체 위치를 box형태로 지정하는 것
      • 바운딩박스(Bounding box) - 학습을 통해 검출한 객체 영역을 사각형으로 표시하는 방법
    • 객체검출(Object Detection) - 여러 개의 객체를 찾아낼 때 사용하는 방식
    • 의미적 분할(Instance Segmentation) - 이미지 내의 의미 있는 단위로 분할하는 작업. 이미지의 영역별 의미를 부여하는 경우 사용함.
  • 인공지능 알고리즘 : 신경망끼리 경쟁하여 최적화를 수행하는 신명망은 <생성적 적대 신경망(GAN)>이라 한다.
    • 합성곱신경망(CNN) - 영상처리에 많이 활용, 데이터의 특징을 분석하여 패턴을 파악하는 구조로 Convolution과정과 Pooling과정을 통해 진행
    • 순환신경망(RNN) - 음성, 언어처리에 사용, 계층의 출력이 순환하는 인공신경망.
    • 생성적 적대 신경망(GAN) - 이미지 생성, 복원 활용. 신경망끼리 경쟁하여 최적화를 수행하는 신경망

 

4. 인공지능과 빅데이터

  • 초기 빅데이터의 특징 : 빅데이터의 3V는 <규모(Volume)>, <속도(Velocity)>, <다양성(Variety)>의 특징을 가지고 있다.
    • 중요 : Volume, Velocity, Variety 영어로 반드시 알고 있어야해요.
  • 빅데이터의 특징(3V) : 빅데이터의 특징 중 다양성(Variety)은 <정형> 데이터, <반정형> 데이터, <비정형> 데이터로 구분된다.
  • 데이터가공(라벨링) 작업 : 인공지능 학습에 필요한 데이터는 <라벨링> 작업을 통하여 원천데이터와 함께 <데이터셋> 형태로 제공된다.
    • 데이터셋은 인공지능 학습을 위해 필요한 데이터를 관련성 있게 모아 놓은 자료의 집합
    • 데이터셋(Dataset) = 원천데이터 + 라벨링데이터
  • 저작권 : 사람의 생각 및 감정을 통해 만들어진 창작적인 표현의 결과물을 말함.
  • 초상권 : 특정인임을 식별할 수 있는 신체적 특징에 관해 영리적으로 사용할 수 없음.

 

5. 데이터라벨링 실습 용어

 

  • 바운딩박스(Bounding box) - 물체를 마우스로 드래그하여 직사각형 모양의 박스 안에 포함되도록 그리는 작업
  • 감정분석 - 사진 속 사람의 표정을 보고 감정상태를 추론하는 작업
  • 포인트(Point) - 이미지의 특정 지점에 마우스를 클릭하여 점을 찍는 작업. 안면인식을 통해 정밀하고 섬세한 감정분석을 요구함.
  • 얼굴랜드마크 - 마우스를 클릭하여 얼굴 주요 부위에 점을 찍는 작업
  • OCR - 이미지 속의 글자를 바운딩한 후 태깅이나 전사하는 작업
  • 폴리곤(Polygon) - 다각형 모양으로 작업대상의 외곽선을 따라 점을 찍어 그리는 작업. 점이 선의 형태로 이어져 빈 공간 없이 대상을 검출하는 작업
  • 폴리라인(Polyline) - 여러 개의 점을 가진 선을 이용해 특정 영역을 라벨링 한다. 인도, 차선 등을 구분하기 위해 사용함.
  • 큐보이드(Cuboid) - 2D가 아닌 3D 객체들을 정육면체로 생성하는 작업으로 자율주행에서 차량의 앞뒤 좌우 표기하는데 유용함.
  • 스켈레톤 추출 - 작업대상의 행동 패턴을 분석하기 위해 특정 부위에 점을 찍어주는 작업
  • 스멘틱 세그멘테이션 - 폴리곤, 폴리라인, 브러시 등을 사용하여 경계를 나누어 분할. 이미지 내의 모든 대상의 위치 및 모양 등을 영역으로 분류해 내는 작업
  • 특정구간 추출 - 작업대상이 사전에 제시된 기준에 해당하는 말이나 행동 등을 할 때의 구간을 선택하여 추출하는 작업
  • 문장 의미 비교 - 주어진 문장들의 의미가 같은 것인지를 태깅하는 작업
  • 감정 태깅 - 게시된 글을 읽었을 때 느껴지는 감정을 선택하는 작업
  • 키워드 찾기 - 대화 내용 속에서 핵심이 되는 키워드를 찾아내는 작업
  • 문장 요약 - 글을 읽고 핵심이 되는 내용을 요약하는 작업
  • 화자 구분 - 제시된 음성을 모두 듣고, 동일한 사람의 목소리인지를 판단하여 태깅하는 작업
  • 음성 받아쓰기 - 주어진 음석을 듣고 받아 쓰는 작업(이중전사, 일반전사)

 

함께 보면 도움되는 정보↓↓

 

 

 

('23년 3월) 데이터라벨링 AIED 1급 자격증 후기

시간, 공간제약 없이 할 수 있는 부업을 찾던 중 알게 된 데이터라벨링인데요. 2급에 이어 일주일 간격으로 1급 AIDE 자격시험 공부하면서 복습한 내용을 토대로 정리해 봅니다. 자격증 취득을 위

studym.tistory.com

 

2023년 내일배움카드 데이터라벨링 수강신청시 궁금증(Q&A)

요즘 부업으로 핫한 데이터라벨링이라고 들어보셨나요? 내일배움카드를 발급받아 데이터라벨링 기초, 심화과정을 국비로 수료하는 것이 가능한데요. 마침 2023년 1월 30일부터 데이터라벨링 교

studym.tistory.com

 

마치며

  2023년 3월, 인공지능 데이터전문가 2급 자격증을 위해 학습하며 정리 및 요약한 내용입니다. 2급은 용어정리만 잘해두어도 어렵지 않게 공부할 수 있으실 거예요. 문제를 보면 답이 뭐다 하는 단답형 문제가 많았어요. OX문제, 실습은 교육할 때 보았던 이미지로 나와서 크게 어렵지 않았습니다. 자격증 취득에 도움 되길 바랄게요.

 

 

 

반응형

댓글