DataScience
TTS 응용 사례
음성 합성 2023. 8. 5. 14:04

교육 텍스트를 읽기 어려운 경우, 음성으로 듣고 학습할 수 있도록 도와줍니다. 또한, 외국어 학습에도 활용될 수 있습니다. 텍스트를 입력하여 음성으로 듣고 발음을 연습할 수 있습니다. 음성 컨텐츠 게임에서 NPC의 목소리를 생성하거나, 영화에서 배경음과 대사를 더빙하는 데 사용할 수 있습니다. https://search.bilibili.com/all?vt=34305959&keyword=vits&from_source=webtop_search&spm_id_from=333.788&search_source=5 음성 인터페이스 스마트폰, 스마트 홈 장치와 같은 음성 인터페이스 기술에 사용되어, 사용자들이 음성으로 기기와 상호작용할 수 있도록 합니다. https://www.youtube.com/shorts/Ykxh..

article thumbnail
Text to Speech (TTS) 각종 모델
음성 합성 2023. 7. 21. 16:02

Text Analysis 문자 텍스트를 언어학적 특징을 추출합니다. 딥러닝 기반 음성합성에서는 이부분이 많이 간편해 졌고 text analysis부분을 별도로 취급하지 않고 간단한 전처리 정도로 생각합니다. 1. Text Normalization 약자나 숫자로 되어 있는 부분을 발음나는대로 바꿔줍니다. 2. Word Segmentation 중국어나 한국어 같은 문자 기반 언어에 필요한 기술입니다. 가방을 하나의 단어로 볼것인지 아니면 가, 방 이라고 볼것인지 문맥을 보고 결정합니다. 3. Part of Speech Tagging 동사,명사,전치사, 조사 등 품사를 분석하는 기술, 4. Prosody Prediction 텍스트를 보고 강세, 톤, 길이를 예측합니다. 5. Grapheme to Phoneme..

article thumbnail
음성합성 Text-to-Speech(TTS) 역사
음성 합성 2023. 7. 20. 13:28

글을 입력하면 텍스트를 목소리로 읽어주는 기술로 보편적으로 음성합성(text to speech)의 약자인 TTS로 불립니다. 최근에는 딥러닝 기반의 음성 합성 기술이 발전하면서 딥러닝 모델을 사용하여 자연스러운 음성을 생성할 수 있습니다. TTS의 역사 1. Articulatory Synthesis (조음 합성) 인간의 성대 모델(입술, 혀, 성대)과 그 안에서 일어나는 조음 과정을 기반으로 음성을 합성하는 컴퓨터 기술, 혀, 턱, 입술과 같은 음성 조음기의 위치를 수정하는 것으로 공기의 흐름을 디지털 방식으로 시뮬레이션하여 만들어집니다. 2. formant Synthesis (포만트 합성) 음성 샘플을 사용하지 않고 주파수 변조나 Physical Modelling과 같은 기술을 이용하여 소리를 생성하는..