본문 바로가기

Etc..

(21)
[인공지능 연구동향] Video Models, Metric Learning사례 분석 다수의 input task 모델 Video 하나의 input과 다르게 비디오는 motion에 대한 정보를 담고 있음 프레임이 진행되면서 translation, scale, rotation, camera motion, light change 등 다양한 data augmentation이 이루어짐 이미지 쌍이 input인 경우 Optical flow estimation input으로 연속된 RGB 이미지 쌍이 들어올 경우target은 두 이미지의 변화에 따른 dense flow map과 2D translation displacement가 됨. 대표적인 모델로 FlowNet이 있음 FlowNet U-NET과 유사하게 encoder - decoder 구조를 가짐 Supervised training이며 loss로 ..
[인공지능 연구동향] Object Detection, Semantic Segmentation 사례 분석 Object Detection, Semantic Segmentation 사례 분석 다양한 task에 대한 모델 다양한 task classification만으로는 이미지에 대한 모든 정보를 파악하고 활용하고 있다고 보기 어려움 각 object가 어디에 있고, 얼마나 있고 등 다양한 정보를 활용할 수 없게 됨. Object detection은 어떤 object가 있는지 뿐만 아니라 각 object가 어디에 있는지까지 box를 쳐서 알 수 있음 하지만 이것만으로 충분하지 않는 경우가 있음 sementic segmentation은 픽셀 단위로 object를 구분할 수 있음 하지만, 같은 클래스의 object끼리는 서로 구분이 되지 않음. instance segmentation은 개별 object가 서로 구분되면..
[인공지능 연구동향] Convolutional_Neural_Netwrok_구조 사례 분석 Case Study 98 년도 LeNet - 5 주 목적은 손으로 쓴 글자나 숫자를 인식하는 것 ConvNet을 활용하여 local receptive field, weight sharing을 적극 활용하고자 했던 사례 2012년 AlexNet 8개의 layer, activation function으로 ReLu를 사용, L2규제와 weight decay 적용 현재 convNet 구조에 사용되고 있는 많은 기법이 Alexnet에서 부터 사용 됨 에러율이 크게 줄어듦으로 써 convNet을 파고드는 계기가 됨 이후로는 좀 더 깊은 네트워크 구조를 만드는 데 초점을 맞추기 시작함. 네트워크가 깊으면 깊을수록 더 많은 nonlinearity가 추가되고, 표현할 수 있는 linear region의 조합이 다채로워짐..
[인공지능 연구동향] Convolutional_Neural_Netwrok_기본 CNN이 필요한 이유 neural network Neural Network 구조는 input data의 형태에 대해 크게 초점을 맞추지 않음 임의의 Vectorized된 input이 들어왔을때 결과를 확인하는 정도 였음. 초점을 image에 맞추면 CNN이 필요함. CNN 사람은 물론 다양한 정보를 활용하여 행동을 결정, 주로 시각적인 정보를 폭넓게 활용 사람의 얼굴 인식, 차선과 앞뒤차량 인식, 수술 및 진단 등에 사용 이미지를 Neural Network 구조에 Input으로 바로 집어 넣으려면? 문제점 이미지는 픽셀로 이루어진 2d grid 형태 1024 x 768 사이즈의 이미지는 가로로 1024개, 각 가로마다 세로로 768개의 픽셀로 이루어져 있음 한 픽셀에는 RGB에 대한 정보도 담겨 있음 (..
[인공지능 연구동향] Neural_Networks_학습_방법과_이슈 Neural Networks 학습 방법과 이슈 신경망은 Gradient기반의 optimization기법 사용 gradient는 각 input에 따른 output의 변화량을 나타낸다. Gradient descent recap optimization 진행 gradient를 계산하고 그 반대 방향으로 업데이트를 진행한다. 너무 큰 learning rate는 loss값을 발산시킨 너무 작으면 학습속도를 지나치게 느리게 하고 global minima에 도달하는데 어려움을 겪을 수 있음 딥러닝의 학습을 가능하게 만드는 주요 알고리즘이다. 어떤 종류의 smooth enough한 function에서도 잘 동작 특정 조건에 따라 non-smooth function에서도 업데이트 가능 local optimum에 빠지는 문..
[인공지능 연구동향] Neural_Netwrok_기본 Neural Networks 기본 개요 딥러닝을 배우는 이유 딥러닝은 다양한 분야에서 다양한 Task를 수행하기 위해 사용 함. 컴퓨터 비전 뿐 아니라 자연어 처리(GPT3), 음성처리(웨이브넷) 분야에서도 놀라운 성능을 보여주고 있음 또한, 게임(체스, 바둑, 도타, 스타크래프트) 분야나 제어분야 (자율주행차량) 에서도 널리 사용되고 있음. 딥러닝이 다양한 분야에서 성공을 거두는 것에 도움 준 요소들 *컴퓨팅 파워의 향상 *(특히 GPU) : GPU는 컴퓨터 그래픽을 처리하기 위한 장치로 CPU에 비해 굉장히 많은 코어를 가지고 있기 때문에 기계학습에 사용되고 있다. 딥러닝의 주요 연산은 행렬곱셈으로 이루어져 있기 때문에 병렬화 하기 매우 용이하기 때문. 최근에는 벡터, 행렬연산에 최적화된 Tensor..
[인공지능 연구동향] Deep Learning OverView Deep Learning OverView 딥러닝 정리 딥러닝은 데이터로부터 유용한 패턴을 추출한다 이를 위해서 Neural Network나 Gradient 기반의 Optimization을 이용한다. 딥러닝을 구연하고 활용하는 측면에서 주로 Python을 사용한다. Python : 문법이 쉬우며 딥러닝을 구현할 수 있는 라이브러리가 잘 구현되어 있다. Tensorflow, Pytorch : 딥러닝을 사용하는데 도움을 주는 라이브러리 , 지속적인 업데이트로 점점 더 많은 기능을 제공하고 있다. 딥러닝을 실제로 활용하는 부분에서 어려움을 겪을 부분은 좋은 질문과 좋은 데이터를 만드는 것 따라서 문제를 잘 정의하고 접근할 필요가 있다(Hard Part : Good Question + Good Data) 현재 시..
[인공지능 연구동향]인공지능의 역사 인공지능의 역사 인류는 인간의 역사 속에서 인공의 지능을 가진 무언가에 대해서 계속 상상을 해왔다. 이러한 상상은 굉장히 오래 되었는데 거의 최초로 등장한 것은 그리스 신화의 청동거인 '탈로스' 이다. 흔한 판타지 소설,만화등에 나오는 골렘과 비슷한 것인데, 주변을 능동적으로 감시하고 공격을 막는 고대인들이 상상한 인공지능이라고 할 수 있다. 이 뿐만 아니라, 중국, 그리스 , 인도 등 다양한 국가의 고대 철학자는 인간의 지능을 체계화하고 분석하고 이해하고자 하는 많은 시도를 해 왔다. 최근들어서 인공지능에 대한 상상력은 더욱더 발전하고 정교해져 영화로도 제작되어 상상을 구현했는데, 이것은 우리의 삶에 어떠한 영향을 줄 수 있는지에 대한 가능성을 보여준다. 인공지능의 발전 1700년대 산업시대 산업혁명으..