센터프로젝트

매력적인 AI소리를 찾아서: 음향-인지과학적 연구

  • 연구참여 교수: 송지은
  • 프로젝트 기간: 2022. 11. 01 ~ 2023. 10. 31 (12개월) - 2차년도
  • 프로젝트 목표 : 합성음성(Synthetic speech)의 선호도를 정량화하고 이에 미치는 음향 요소를 규명하여, 음성합성 품질의 객관적 평가 토대 마련
    • AI 소리 서비스에서 사용되는 합성음성의 선호도 및 듣기 노력을 지각 실험을 통해 측정

    • 합성음성의 선호도 및 듣기 노력엥 영향을 미치는 음향 및 음성 요소를 통계적으로 규명

    합성음의 선호도 평가에 미치는 음향요소 규명
    • 1차 년도

      실제 자유발화 중심

    • 2차 년도

      “합성음”에 적용

    • 객관적인 평가 방법 구축

      MOS(Mean Opinion Score)
      방식의 한계 극복

    • 합성음 개발 기반 마련
    • 음향 특징과 듣기노력의 관계

      합성음 듣기 피로도를 최소화

  • 프로젝트 수행 방법 : 합성음성의 선호도 및 듣기노력 측정과 음향 요소 추출 방법
    • KT AI 음성서비스(예. AI통화비서)에서 사용되는 합성음을 추출하여 이에 대한 음향 분석(예. 목소리 특징, 조음 속도, 모음 산포도) 및 지각 실험을 실시함.

    • 1차년도에 개발된 음향 분석 및 지각 실험 방법론을 합성음 연구에 확장

    • 통계 분석(Principal Component Analysis 등)을 통해 합성음의 선호도 혹은 듣기 피로도에 기여하는 음향 요소 규명, 이를 통한 합성음의 객관적 품질 평가 시도 및 기준 마련

    • KT 음성합성팀과의 적극적인 협력을 통해 합성음 품질 개선에 기여하는 음향-인지과학적 연구 실시