센터프로젝트
PROJECTS
매력적인 AI소리를 찾아서: 음향-인지과학적 연구
- 연구참여 교수: 송지은
- 프로젝트 기간: 2022. 11. 01 ~ 2023. 10. 31 (12개월) - 2차년도
- 프로젝트 목표 : 합성음성(Synthetic speech)의 선호도를 정량화하고 이에 미치는 음향 요소를 규명하여, 음성합성 품질의 객관적 평가 토대 마련
-
AI 소리 서비스에서 사용되는 합성음성의 선호도 및 듣기 노력을 지각 실험을 통해 측정
-
합성음성의 선호도 및 듣기 노력엥 영향을 미치는 음향 및 음성 요소를 통계적으로 규명
합성음의 선호도 평가에 미치는 음향요소 규명-
1차 년도
실제 자유발화 중심
-
2차 년도
“합성음”에 적용
-
객관적인 평가 방법 구축
MOS(Mean Opinion Score)
방식의 한계 극복 -
합성음 개발 기반 마련
-
음향 특징과 듣기노력의 관계
합성음 듣기 피로도를 최소화
-
- 프로젝트 수행 방법 : 합성음성의 선호도 및 듣기노력 측정과 음향 요소 추출 방법
-
KT AI 음성서비스(예. AI통화비서)에서 사용되는 합성음을 추출하여 이에 대한 음향 분석(예. 목소리 특징, 조음 속도, 모음 산포도) 및 지각 실험을 실시함.
-
1차년도에 개발된 음향 분석 및 지각 실험 방법론을 합성음 연구에 확장
-
통계 분석(Principal Component Analysis 등)을 통해 합성음의 선호도 혹은 듣기 피로도에 기여하는 음향 요소 규명, 이를 통한 합성음의 객관적 품질 평가 시도 및 기준 마련
-
KT 음성합성팀과의 적극적인 협력을 통해 합성음 품질 개선에 기여하는 음향-인지과학적 연구 실시
-