DataScience
article thumbnail
CNN(Convolution Neural Network) 합성곱 신경망
영상처리/기초 2023. 5. 8. 09:34

NN(neural network) 신경망 위 그림은 신경망 기본모델 입니다.w는 가중치, b는 편향입니다. 입력(feature)과 출력은 데이터셋으로 알고있는 상황입니다. 뉴런에서 함수를 더하기로 정의합니다.그러면 출력은 y= xw+1 b가 될것입니다. 이 모델의 목표는 알고있는 y,x에 무작위 w값을 넣어보고 y값과 실제값을 비교한뒤 오차만큼 다시 w를 수정해서 y를 다시 출력해보고 최종적으로 제일 잘 맞는 w,b의 값을 찾는것 입니다. 그래서 모든 y,x에 맞는 식을 세우는것, 즉, 일반화 한다 생각하시면 될 것 같습니다. 하지만 모든 데이터들은 위와 같이 단순하게 일차원적이지 않습니다. 일상생활의 데이터들은 특징끼리 서로 연관되어있기도하고 여러가지 복합적입니다 마치 아주 복잡한 n차 다항식과 같습니..

article thumbnail
convolution(합성곱)
영상처리/기초 2023. 5. 4. 11:15

a,b 두개의 벡터가 있습니다.두 함수를 연산하여 새로운 함수를 얻는 가장 간단한 방법 중 하나는 단순히 더하는 방법이 있습니다. f(x),g(x)를 이미지라 생각하고 a,b를 각각 픽셀값이라 생각하면 1234,5678을 더하면 새로운 이미지 6,8,10,12가 나옵니다. 이번에는 합성곱인데요. 라플라스 변환에 나오는 그 합성곱입니다. 앞선 두 연산과 달리 단순히 숫자 연산만 하는것이 아니고 새로운 함수를 만들어냅니다. 이미지 처리에서 기본이 되는 연산입니다. 미분방정식을 푸는데 많이 사용되고 다항식을 서로 곱하는 것과 같은 맥락입니다. 1,2,3과 4,5,6 합성곱하는 방법은 다항식을 푼다고 생각하시면 쉽습니다. 다항식으로 만들고 분배법칙으로 푼다음 계수만 갖고오면 합성곱 결과가 나타납니다. 필터(커널..

article thumbnail
Image Processing 기초
영상처리/기초 2023. 5. 3. 09:37

모든 이미지는 픽셀로 이루어져있습니다. 픽셀이란 Picture+Element의 합성어 입니다. 코부분을 확대하면 사각형 여러개가 모여있는것을 볼수 있는데 이 사각형 하나하나를 픽셀 or 화소라고 부릅니다. 100x100 이미지면 10000픽셀로 640*480은 307200픽셀 이루어져있습니다.FHD는 200만, qhd는 370만, uhd는 830만 픽셀입니다. 픽셀 및 해상도 개념은 이미지뿐만 아니라 모니터, 카메라에서도 쓰고있습니다. 그리고 픽셀의 색을 숫자로 표현하고 범위는 0~255으로 이루어져있습니다. 한 픽셀에 숫자가 한개 있으면 1채널이라 부르고 gray scale이라고 해서 흔히말하는 흑백사진입니다. 0은 black, 255는 white입니다. 한 픽셀에 숫자가 3개씩 있으면 3채널이라 부르..

article thumbnail
YOLOv8 imagesegmentation
영상처리/기초 2023. 2. 26. 22:10

Ultralytics YOLOv8은Ultralytics 에서 개발한 YOLO(You Only Look Once) 객체 감지 및 이미지 분할 모델의 최신 버전입니다. YOLOv8은 이전 YOLO 버전의 성공을 바탕으로 새로운 기능과 개선 사항을 도입하여 성능과 유연성을 더욱 향상시키는 최첨단 SOTA(최신 기술) 모델입니다. https://docs.ultralytics.com/ YOLOv8 Docs Home Welcome to the Ultralytics YOLOv8 documentation landing page! Ultralytics YOLOv8 is the latest version of the YOLO (You Only Look Once) object detection and image segmen..

영상 요약해주는 Vision Transformer 모델
영상처리/기초 2023. 2. 26. 21:34

22분 짜리 영상을 1분으로 요약하는 ViT모델 데이터 데이터 분야 - AI 데이터찾기 - AI-Hub (aihub.or.kr) AI-Hub 샘플 데이터 ? ※샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며, 데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되 aihub.or.kr 학습모델 영상요약모델 - Google Drive 영상요약모델 - Google Drive 이 폴더에 파일이 없습니다.이 폴더에 파일을 추가하려면 로그인하세요. drive.google.com run import torch from training.summary.datamodule import SummaryDataset from transformers import..

article thumbnail
Vision Transformer(ViT) 리뷰
영상처리/기초 2023. 2. 26. 21:00

Transformer 기존 sequence transduction model들은 인코더와 디코더를 포함한 복잡한 recurrent 나 cnn에 기반함 가장 성능이 좋은 모델 또한 attention mechanism으로 인코더와 디코더를 연결한 구조임 "Transformer" : 온전히 attention mechanism에만 기반한 구조. (recurrence 나 convolution은 사용하지 않음) - 더 parallelizable하고, 훨씬 적은 학습 시간이 걸림 Vision Transformer Transformer 가 원래는 언어 모델인데 언어모델에 이미지를 분할해서 input으로 넣어준게 Vision Transformer입니다. 줄여서 ViT라고 합니다. ViT의 특징 - 기존 CNN 기반 SO..

article thumbnail
GAN(Generative Adversarial Networks)
영상처리/기초 2023. 2. 15. 13:05

GAN은 Generative Adversarial Networks의 약자로 우리말로는 “적대적 생성 신경망”이라고 번역되는 AI기술 중 하나입니다. GAN은 실제에 가까운 이미지나 사람이 쓴 것과 같은 글 등 여러 가짜 데이터들을 생성하는 모델입니다. “적대적 생성 신경망”이라는 이름에서 알 수 있듯 GAN은 서로 다른 두 개의 네트워크를 적대적으로(adversarial) 학습시키며 실제 데이터와 비슷한 데이터를 생성(generative)해내는 모델이며 이렇게 생성된 데이터에 정해진 label값이 없기 때문에 비지도 학습 기반 생성모델로 분류됩니다. 개념 GAN은 Generator(G,생성모델/생성기)와 Discriminator(D,판별모델/판별기)라는 서로 다른 2개의 네트워크로 이루어져 있으며 이 두..