과학

오픈AI, 사람 목소리 복제 가능한 AI 모델 ‘보이스 엔진’ 출시


  • 우예진 기자
    • 기사
    • 프린트하기
    • 크게
    • 작게

    입력 : 2024-03-31 11:46:11

    오픈AI가 15초 분량의 음성 샘플로 사람의 목소리를 복제할 수 있는 AI 모델 보이스 엔진(Voice Engine)을 발표했다고 CNBC가 29일(현지시간) 보도했다. 15초의 음성 샘플로 감성 및 용도에 맞춰서 원래 말하는 사람과 비슷한 음성을 생성할 수 있다고 한다.

    오픈AI는 2022년 말부터 보이스 엔진을 개발해 왔으며, 복제된 음성이 악용될 우려가 있어 현재는 소규모 테스트에 집중하고 있다고 한다.

    테스트에 참여한 파트너들은 다양한 결과물을 선보였다. 교육 테크놀로지 기업 에이지오브러닝(Age of Learning)은 사전 복제된 음성으로 보이스 엔진과 GPT-4의 생물학이나 과학, 수학, 물리학 등의 답변을 제작해 선보였다.

    ▲ 오픈AI 로고 © 연합뉴스

    헤이젠(HeyGen)에서는 콘텐츠 번역에 보이스 엔진을 활용했다. 영어로 말한 화자의 음성을 스페인어, 중국어(베이징어), 독일어, 프랑스어, 일본어 등으로 번역했다. 또, 발성 장애가 생긴 사람의 이전 목소리를 재현할 수 있다.

    오픈AI는 보이스 엔진 상용화에 앞서 보안 문제 해결에 몰두하고 있으며, 해당 문제 해결 전까지 상용화 계획은 없다고 밝혔다. 보안 해결 방법으로는 생성된 음성에 전자 워터마크를 부여하는 것 외에 원래 화자의 사용 허용 의사 확인 방법, 유명인 소리 복제 방지 기술 등이 마련되어야 한다. 

    또한 은행 계좌나 기밀정보에 대한 보안 대책 마련 및 개인 목소리 사용을 보호하는 정책 검토, 일반인의 이해, 출처 확인 기술 등의 준비도 필요한 상황이다.


    베타뉴스 우예진 기자 (leejik@betanews.net)
    Copyrights ⓒ BetaNews.net