DataScience
영상 요약해주는 Vision Transformer 모델
영상처리/기초 2023. 2. 26. 21:34

22분 짜리 영상을 1분으로 요약하는 ViT모델 데이터 데이터 분야 - AI 데이터찾기 - AI-Hub (aihub.or.kr) AI-Hub 샘플 데이터 ? ※샘플데이터는 데이터의 이해를 돕기 위해 별도로 가공하여 제공하는 정보로써 원본 데이터와 차이가 있을 수 있으며, 데이터에 따라서 민감한 정보는 일부 마스킹(*) 처리가 되 aihub.or.kr 학습모델 영상요약모델 - Google Drive 영상요약모델 - Google Drive 이 폴더에 파일이 없습니다.이 폴더에 파일을 추가하려면 로그인하세요. drive.google.com run import torch from training.summary.datamodule import SummaryDataset from transformers import..

article thumbnail
Vision Transformer(ViT) 리뷰
영상처리/기초 2023. 2. 26. 21:00

Transformer 기존 sequence transduction model들은 인코더와 디코더를 포함한 복잡한 recurrent 나 cnn에 기반함 가장 성능이 좋은 모델 또한 attention mechanism으로 인코더와 디코더를 연결한 구조임 "Transformer" : 온전히 attention mechanism에만 기반한 구조. (recurrence 나 convolution은 사용하지 않음) - 더 parallelizable하고, 훨씬 적은 학습 시간이 걸림 Vision Transformer Transformer 가 원래는 언어 모델인데 언어모델에 이미지를 분할해서 input으로 넣어준게 Vision Transformer입니다. 줄여서 ViT라고 합니다. ViT의 특징 - 기존 CNN 기반 SO..

article thumbnail
OTT 컨텐츠를 시즌제 하는이유(더글로리, 카지노, 미끼, 아일랜드)
이슈 2023. 2. 23. 12:11

더글로리와 카지노를 재밌게 보고있는데 갑자기 중간에 파트가 끝나서 다음파트 공개는 2주~1달 뒤 라고 공지를 합니다. 저는 한주마다 나오는 드라마, 웹툰 기다리는게 싫어서 웬만하면 완결이 나온후 한번에 몰아보는 스타일 입니다. 그래서 이런 상황은 기다리다 지치고 파트1내용도 까먹습니다. 아무리 생각해도 왜 나누는지, 무슨 이점이 있는지 이해가 되지 않아 찾아봤습니다. 결론은 인기있는 컨텐츠 공개날짜에 맞춰 한달치 구독료만 내면 작품을 전부 감상하고 이탈하는 것을 방지하기 위함이라고 합니다. 컨텐츠에 맞게 한달만 구독하고 빠지는 경우가 얼마나 많길래 이러는걸까요. 넷플릭스 , 디즈니+ 등 OTT 파트 나누기(시즌제) 인기 넷플릭스, 디즈니플러스, 티빙 등 OTT 콘텐츠업계에 최근 '파트 나누기' 열풍이 불..

article thumbnail
multilabel vs multiclass 차이
파이썬/Tensorflow,Pytorch 2023. 2. 22. 09:47

다중 클래스, 다중 레이블 다중 클래스 분류는 두 개 이상의 클래스가 있는 분류 작업을 의미합니다. 예를 들어 오렌지, 사과 또는 배일 수 있는 과일 이미지 집합을 분류하는 것과 같은 작업입니다. 다중 클래스 분류는 각 샘플이 하나의 레이블에만 할당된다고 가정합니다. 즉, 과일은 사과일 수도 있고 배일 수도 있지만 동시에 두 가지 모두일 수는 없습니다. 다중의 class가 존재할 수 있는 output에서, 하나를 선택하는 것입니다. categorical_crossentropy를 활용 다중 레이블 분류는 각 샘플에 대상 레이블 세트를 할당합니다. 다중의 정답이 동시에 존재할 수 있는 것입니다. 이는 문서와 관련된 주제와 같이 상호 배타적이지 않은 데이터 포인트의 속성을 예측하는 것으로 생각할 수 있습니다...

article thumbnail
스타벅스 22일부터 아메리카노 2500원 1999이벤트
이슈 2023. 2. 21. 10:21

스타벅스는 '스타벅스 리워드' 회원 1,000만 명 돌파를 기념해 오는 22일부터 24일 3일 동안 오후 2시부터 오후 5시 사이 카페 아메리카노 톨 사이즈를 1999년 1호점(이대점) 오픈 당시 숏 사이즈 가격인 2500원 제공하는 행사를 진행합니다. 한편 직원들 입장은 스타벅스가 '리워드 회원 1천만명 돌파'를 기념해 마련한 '응답하라 1999' 행사를 앞두고, 파트너(직원)들의 불만 섞인 목소리가 나오고 있다. 20일 식·음료 업계에 따르면, 이번 행사가 공지되자 매장 근무 직원들 사이에는 볼멘소리가 흘러나오고 있다. 서울의 한 스타벅스 매장에서 근무하는 A씨는 "행사 시간 대 근무에 들어가는 직원은 화장실 갈 시간도 없이 커피를 내려야 하는 상황이 될 것"이라며 "일은 몇 배 많아지는데, 수당은 ..

article thumbnail
GAN(Generative Adversarial Networks)
영상처리/기초 2023. 2. 15. 13:05

GAN은 Generative Adversarial Networks의 약자로 우리말로는 “적대적 생성 신경망”이라고 번역되는 AI기술 중 하나입니다. GAN은 실제에 가까운 이미지나 사람이 쓴 것과 같은 글 등 여러 가짜 데이터들을 생성하는 모델입니다. “적대적 생성 신경망”이라는 이름에서 알 수 있듯 GAN은 서로 다른 두 개의 네트워크를 적대적으로(adversarial) 학습시키며 실제 데이터와 비슷한 데이터를 생성(generative)해내는 모델이며 이렇게 생성된 데이터에 정해진 label값이 없기 때문에 비지도 학습 기반 생성모델로 분류됩니다. 개념 GAN은 Generator(G,생성모델/생성기)와 Discriminator(D,판별모델/판별기)라는 서로 다른 2개의 네트워크로 이루어져 있으며 이 두..

article thumbnail
AI번역기 DeepL 드디어 한국어 서비스 오픈
컴퓨터 2023. 2. 13. 12:11

DeepL 한국어 서비스 오픈 DeepL Translator는 2017년 8월에 출시되었으며 Cologne 에 기반을 둔 DeepL SE 가 소유한 신경망 기계 번역 서비스 입니다. 번역 시스템은 Linguee 내에서 처음 개발되었으며 엔티티 DeepL 로 시작되었습니다 . 처음에는 7개의 유럽 언어 간 번역을 제공했으며 점차 확장되어 31개 언어를 지원했습니다. 1월 31일 드디어 한국어 서비스가 런칭 됐습니다. 사람처럼 들리는 AI 번역 파파고, 구글과 같은 기존 번역기의 한계는 문맥을 정확하게 잡아내지 못하고, 특유의 기계 번역체에서 벗어나지 못한다는 것이었다. Linguee 데이터베이스 로 훈련된 컨볼루션 신경망 (CNN) 과 함께 독점 알고리즘을 사용합니다 . 개발자에 따르면 이 서비스는 더 새..