디지털인문사회과학센터

센터프로젝트

PROJECTS

매력적인 AI소리를 찾아서: 음향-인지과학적 연구

연구참여 교수: 송지은
프로젝트 기간: 2022. 11. 01 ~ 2023. 10. 31 (12개월) - 2차년도
프로젝트 목표 : 합성음성(Synthetic speech)의 선호도를 정량화하고 이에 미치는 음향 요소를 규명하여, 음성합성 품질의 객관적 평가 토대 마련
- AI 소리 서비스에서 사용되는 합성음성의 선호도 및 듣기 노력을 지각 실험을 통해 측정
- 합성음성의 선호도 및 듣기 노력엥 영향을 미치는 음향 및 음성 요소를 통계적으로 규명
합성음의 선호도 평가에 미치는 음향요소 규명

1차 년도
실제 자유발화 중심

2차 년도
“합성음”에 적용

객관적인 평가 방법 구축
MOS(Mean Opinion Score)
방식의 한계 극복

합성음 개발 기반 마련

음향 특징과 듣기노력의 관계
합성음 듣기 피로도를 최소화
프로젝트 수행 방법 : 합성음성의 선호도 및 듣기노력 측정과 음향 요소 추출 방법
- KT AI 음성서비스(예. AI통화비서)에서 사용되는 합성음을 추출하여 이에 대한 음향 분석(예. 목소리 특징, 조음 속도, 모음 산포도) 및 지각 실험을 실시함.
- 1차년도에 개발된 음향 분석 및 지각 실험 방법론을 합성음 연구에 확장
- 통계 분석(Principal Component Analysis 등)을 통해 합성음의 선호도 혹은 듣기 피로도에 기여하는 음향 요소 규명, 이를 통한 합성음의 객관적 품질 평가 시도 및 기준 마련
- KT 음성합성팀과의 적극적인 협력을 통해 합성음 품질 개선에 기여하는 음향-인지과학적 연구 실시