• 티스토리 홈
  • 프로필사진
    Cat_Code
  • 방명록
  • 공지사항
  • 태그
  • 블로그 관리
  • 글 작성
Cat_Code
  • 프로필사진
    Cat_Code
    • 분류 전체보기 (117)
      • [네이버 부스트캠프] (46)
        • ⭐주간 학습 정리 (43)
        • 🎶추가 학습 정리 (3)
      • [연습의 흔적들] (27)
        • 백준⚾ (26)
        • 캐글 & 데이콘 🤝 (1)
      • [ML] (23)
        • 머신러닝 💕 (5)
        • 딥러닝 🔫 (10)
        • 데이터 분석 🖤 (1)
        • 수학 ☑️ (4)
        • LLM🦜 (3)
      • [CS] (17)
        • 파이썬 🖤 (13)
        • 해체 분석기📝 (3)
        • Service Product (1)
        • MultiMedia (0)
      • [개발일지] (2)
  • 방문자 수
    • 전체:
    • 오늘:
    • 어제:
  • 최근 댓글
      등록된 댓글이 없습니다.
    • 최근 공지
        등록된 공지가 없습니다.
      # Home
      # 공지사항
      #
      # 태그
      # 검색결과
      # 방명록
      • [네이버 부스트 캠프 AI Tech]3D Understanding
        2023년 04월 06일
        • Cat_Code
        • 작성자
        • 2023.04.06.:52

        본 글은 네이버 부스트 캠프 AI Tech 기간동안

        개인적으로 배운 내용들을 주단위로 정리한 글입니다

         

        본 글의 내용은 새롭게 알게 된 내용을 중심으로 정리하였고

        복습 중요도를 선정해서 정리하였습니다

         

        ✅ Week 5

        1. What is 3D?
          1. 3D Data represent
          2. 3D Data sets
        2. 3D tasks
          1. 3D recognition
          2. 3D obejct detection
          3. 3D Segmentation
          4. Conditional 3D generation

        1. What is 3D?

        우리가 생활하고 살아가는 공간은 3D로 구성되어 있다

        따라서 이 3D를 모델에 학습시키고 데이터적으로 표현할 수 있다면

        더 많은 것을 딥러닝으로 구현할 수 있을 것이다

         

        실제로 우리가 3D 세상을 어떻게 인식할까?

        사실 우리가 인식하고 있는 3D는 2D로 projection된 객체들이다

         

        즉, 실제 3D의 물체를 우리는 시각적으로 2D로 받아들이고 있는것이다

        이는 컴퓨터 화면에 사진을 띄웠을 때도 같은 원리로 작동한다

         

        기존 3D 객체를 2D의 형태로 변환하여 화면에 구현하게 된다

         

        그렇다면 2D 객체를 다시 3D로 되돌릴 수는 없을까?

        가능하다

        projection 되어진 2개의 2D가 있다면 교차점을 통해서 3D로 되돌릴 수 있다

        이를 Triangulation이라고 한다

         

        1.1 3D Data represent

        그렇다면 실제로 우리는 3D를 컴퓨터에서 어떻게 표현할 수 있을까?

        2D 이미지의 경우 RGB 3차원을 갖는 2차원의 행렬로 표현을 했었다

         

        이와 다르게 3D는 다양한 형태로 표현이 가능하다

        (1) Multi view image

        : 여러 각도에서 객체를 촬영한 이미지

         

        (2) Volumetric

        : 3D 객체를 격자로 나누어서 3D space 차지 정도를 나타난 형태

         

        (3) Part assembly

        : 객체의 기본적인 부분을 나눠서 표현한 형태

         

        (4) Point Cloud

        : 3D 공간 상에 위치한 포인트들의 집합

         

        (5) Mesh 

        : Point Cloud 의 점들을 삼각형의 형태로 선으로 연결한 형태

         

        (6) Implicit shape

        : 고차원의 함수를 이용해서0과 교차하는 지점을 이어 나온 3D 형태

         


        1.2 3D Data sets

        3D data는 많이 존재하지 않기 때문에 얻기가 어렵다

        대표적인 Datasets들은 다음과 같다

         

        ⭐ShapeNet

         

         

        ShapeNet

        ShapeNet is an ongoing effort to establish a richly-annotated, large-scale dataset of 3D shapes. We provide researchers around the world with this data to enable research in computer graphics, computer vision, robotics, and other related disciplines. Shape

        shapenet.org

         

        ⭐PartNet

        각 파트별로 구성되어있어서 Segmentation에 좋은 데이터셋

         

        PartNet

        Figure 3. PartNet Hierarchical Shape Part Template and Annotation. We show the expert-defined hierarchical template for lamp (middle) and the instantiations for a table lamp (left) and a ceiling lamp(right). The And-nodes are drawn in solid lines and Or-no

        partnet.cs.stanford.edu

         

        ⭐ScanNet

        RGB-Depth Dataset

         

        ScanNet

        Richly-annotated 3D Reconstructions of Indoor Scenes

        www.scan-net.org

         

        ⭐Outdoor 3D scene datasets

         - KITTI dataset  

         

        The KITTI Vision Benchmark Suite

        We thank Karlsruhe Institute of Technology (KIT) and Toyota Technological Institute at Chicago (TTI-C) for funding this project and Jan Cech (CTU) and Pablo Fernandez Alcantarilla (UoA) for providing initial results. We further thank our 3D object labeling

        www.cvlibs.net

        - Semantic KITTI

         

        SemanticKITTI - A Dataset for LiDAR-based Semantic Scene Understanding

        Dynamic We annotated moving and non-moving traffic participants with distinct classes, including cars, trucks, motorcycles, pedestrians, and bicyclists. This enables to reason about dynamic objects in the scene.

        www.semantic-kitti.org

        - Waymo Open Dataset

         

        Open Dataset – Waymo

        The field of machine learning is changing rapidly. Waymo is in a unique position to contribute to the research community with some of the largest and most diverse autonomous driving datasets ever released.

        waymo.com


        2. 3D tasks

        3D data들 또한 2D image 처럼 다양한 task들이 존재한다

        지금부터 3D의 다양한 task들에 대해서 알아보도록 하자

         

        2.1 3D obeject recognition

        3D data도 2D data와 마찬가지로  CNN 모델을 사용해서 라벨을 출력하는 classification에 활용된다

        여기서 사용되는 CNN 은 Volumetric CNN으로 이는 모델의 차원과 인풋의 형태만 달라졌을 뿐

        크게 달라진 점은 없다


        2.2 3D obeject detection

        3D object detection의 경우 앞에서 살펴본 KITTI 데이터셋의 형태를 활용해서 진행할 수 있다

        3D 이미지의 위치를 파악한다거나 3D 공간을 파악함으로써 

        이러한 task는 자율주행에 많이 활용된다


        2.3 3D semantic segmentation

        3D semantic segmentation의 경우 앞에서 살펴본 Segmantic KITTI 데이터셋을 활용해서 진행할 수 있는데

        이러한 task는 각 객체의 클래스를 추출하는 것을 목표로하고

        3D Mesh를 segmentation하는 Task도 존재한다

         


        2.4 Conditional 3D generation

        3D 데이터셋은 또한 생성모델에서도 활용이 가능하다

         

        Mesh R-CNN의 경우 조금 특별한데

        2D 이미지를 input으로 넣으면 3D mesh를 출력값으로 리턴한다

        모델 구조는 어렵지 않는데

        앞에서 배웠던 Mask R-CNN에 3D branch를 추가해서 3D mesh 출력을 추가해준다

         

        Mesh R-CNN

        Rapid advances in 2D perception have led to systems that accurately detect objects in real-world images. However, these systems make predictions in 2D, ignoring the 3D structure of the world. Concurrently, advances in 3D shape prediction have mostly focuse

        arxiv.org

         

        '[네이버 부스트캠프] > ⭐주간 학습 정리' 카테고리의 다른 글

        [네이버 부스트 캠프 AI Tech]Pytorch 알쓸신잡 - Autograd 작동원리  (0) 2023.04.11
        [부스트 캠프]Week 5 회고 및 Week 6 목표 정리  (0) 2023.04.10
        [네이버 부스트 캠프 AI Tech]Multi Modal  (0) 2023.04.05
        [네이버 부스트 캠프 AI Tech]Conditional Generative Model  (0) 2023.04.03
        [네이버 부스트 캠프 AI Tech]Landmark Localization & Detecting objects as keypoints  (0) 2023.04.03
        다음글
        다음 글이 없습니다.
        이전글
        이전 글이 없습니다.
        댓글
      조회된 결과가 없습니다.
      스킨 업데이트 안내
      현재 이용하고 계신 스킨의 버전보다 더 높은 최신 버전이 감지 되었습니다. 최신버전 스킨 파일을 다운로드 받을 수 있는 페이지로 이동하시겠습니까?
      ("아니오" 를 선택할 시 30일 동안 최신 버전이 감지되어도 모달 창이 표시되지 않습니다.)
      목차
      표시할 목차가 없습니다.
        • 안녕하세요
        • 감사해요
        • 잘있어요

        티스토리툴바