군대에서 기가지니라는 인공지능 스피커를 처음 사용하였습니다. 최근에 인공지능 스피커에 대하여 관심을 가지기 시작하였는데 여기에서 핵심기술이 텍스트와 음성 간의 관계라고 생각합니다. 두 관계를 해결해야지 사람과 기계가 소통할 수 있기 때문입니다. 그래서 이번에는 사람과 기계가 소통하는 방법 TTS와 STT에 대하여 알아보겠습니다. STT (Speech to Text) "기가지니?"라고 우리가 말하면 기가지니는 "네?"라고 반응합니다. 어떻게 기가지니라고 말하는 것을 컴퓨터가 알아들었을까요? 이것은 STT라는 기술을 이용하여 음성을 분석하여 텍스트로 바꾸어 주기 때문입니다. 발음마다 매질이 달라 일일이 분석하여 해당 소리를 낼 수도 있지만 해당 과정은 몹시 어렵습니다. 그래서 파이썬에 패키지를 이용하려고 합..