Story/효성

‘씃(STT) 하면 톡?’ 소리로 그리는 소통의 세계

효성blog 2024. 10. 15. 16:02

 

 

“마음과 마음을 연결해 주는 대화, 그 안에 행복이 있다.”

 

씃하면 톡? AI 기술이 하루하루 발전해 가면서 더욱 편리해지고 간단해지고 있는데요. 오늘은 그 중에서도 소리로 소통의 세계를 그려나가는 AI기술, STT에 대해 소개해드릴게요.

 

 

 

일상에서 나누는 대화, 단순히 언어를 주고받는 것이 아니라 마음속 깊은 의미를 보여주는 소중한 순간입니다. 하지만 서로 무슨 말을 하고 있는지 알지 못해 답답할 때가 더러 있는데요. 특히 감정을 드러내지 않은 텍스트형 대화는 깔끔하게 정리되지 않은 마음은 정확하게 표현하기 어렵습니다.

 

4차 산업혁명이 한참 진행 중인 현재, 우리에게 AI는 매우 친숙한 기술입니다. 게다가 딥러닝으로 매일매일 한계치를 갈아치우는 기술력으로 AI는 단순히 반복되는 작업부터 상대의 마음까지 읽어 사람들과 소통하고 있습니다. 영상을 텍스트로, 텍스트를 다시 음성으로, 현재는 음성을 텍스트로 바꾸는 STT 기술까지 발전하고 있는데요. STT 기술은 사람의 음성에서 텍스트 추출 뿐만 아니라 텍스트 감정 인식으로 감정까지도 분석할 수 있는 혁신 기술입니다. 빠르게 전환하는 STT 기술로 찰나의 감정이나 생각까지 분석할 수 있어 깊이 있는 소통까지 가능해졌습니다.

 

*텍스트 감정 인식은 자연어 처리(NLP)의 중요한 목표 중 하나로, 문장에서 감정을 추출하는 기술입니다. 초기 대화형 AI는 전통적인 알고리즘을 활용해 감성 사전을 사용하거나 텍스트의 특정 특징을 분석하여 감정을 분류합니다.

 

소리의 감정까지 담아낸 STT 기술은 소통의 방식까지 변화하게 만들 수 있다는 의미에서 업계는 물론 대중들도 크게 기대하고 있습니다.

 

 

대화형 AI 기술의 현재는

 

스마트 기기 보급률이 세계 일위인 대한민국은 산업 전반에서 대화형 AI를 많이 사용하고 있습니다. 게다가 코로나 팬데믹 이후 노동 환경이 변화해 대다수 플랫폼에서 STT 기술을 기반으로 한 대화형 AI가 활용되고 있습니다.

 

매사추세츠 공과대학교(MIT)의 과학 및 기술 저널에 따르면 최근 대화형 AI 모델은 인간의 감정을 정교하게 분석할 수 있을 정도로 발전했습니다. 단순히 감정을 분류하는 것을 넘어서 복잡하고 정교한 감정 상태까지 인식하며 표현하는 능력을 말하는데요. 특히 대화형 AI는 사용하는 사람의 감정과 요구를 실시간으로 감지해야 하므로 그 상황에 맞는 반응 기술이 강화되어야 합니다.

 

현재 대화형 AI 기술은 텍스트와 음성, 영상까지 입력된 데이터를 동시에 분석해 감정을 이해한 멀티모달(Multimodal) AI가 주목받고 있습니다.

 

* 멀티모달은 여러 데이터, 즉 텍스트와 이미지, 음성과 영상 등 다양한 정보를 동시에 분석하고 이해하는 기술을 의미

 

이 기술은 감정을 정확하게 인식하기 때문에 인간과 원활한 상호작용이 가능합니다. 감정까지 인식하는 대화형 AI는 건강을 위한 헬스케어, 교육, 고객 서비스 등 여러 분야에 활용될 전망이고요. 실제 여러 연구 논문에서 사용자의 진심까지 읽는 대화형 AI가 우울증을 앓는 사람에게 희망을 주기도 하고, 학업에 지친 학생에게 위로와 동기부여까지 해 더 열심히 공부하도록 돕는 사례가 발표되고 있습니다.

 

 

국내로 뻗어나가는 STT 기술

 

그럼, 현재 국내에서 STT 기술 기반 대화형 AI 서비스가 어떤 방식으로 활용되고 있는지 살펴보겠습니다.

 

플랫폼 다각화 전략을 추진하고 있는 국내 대형 홈쇼핑은 유튜브 쇼핑 기능을 새롭게 도입했습니다. 기존 쇼핑몰에서 노출된 제품 홍보와 구매를 위한 팝업 등 다양한 기능에 STT 기술을 기반으로 한 하이라이트 영상을 생성한 숏 폼 콘텐츠가 큰 호응을 일으켰습니다. 제품을 설명하는 쇼호스트의 핵심 멘트를 텍스트로 전환해 이미지를 더해 편집한 영상인데요. 다양한 상품을 1분 하이라이트 영상으로 제작된 방식인데, 자동으로 편집되니 제품 홍보에 혁신 기술이라는 평가가 자자합니다.

 

식당이나 카페 등에서 흔히 볼 수 있는 키오스크, 화면에서 메뉴와 토핑을 고르고 계산하는 것이 기본 방식인데요. 최근 ‘2024 월드 IT 쇼(WIS2024)’에서는 대화형 AI로 비서 서비스를 지향하는 ‘AI 휴먼 키오스크’가 등장했습니다. 사용자의 음성 질문을 AI 휴먼 키오스크는 음성으로 답변해 보는 이들을 놀랍게 했습니다. 변환 과정을 간단하게 살펴보면, 먼저 STT 기술을 내재한 키오스크가 사용자의 말을 듣고 텍스트로 변환해 의미를 파악(TA)합니다. 그 후 AI 휴먼 키오스크의 답변을 TTS 기술로 다시 사용자에게 음성으로 전달하는 것이죠. 게다가 키오스크 내 버추얼 인간이 아닌 실존 인물 혹은 인기 캐릭터까지 구현되어 광고 효과는 물론 단방향이 아닌 쌍방향으로 소통할 수 있어 키오스크 사용에 어려움을 겪는 분들도 편하게 이용할 수 있습니다. 

 

여기서 잠깐, 용어 정리

* STT(Speech To Text) : 음성을 텍스트로 변환하는 기술

* TA(Text Analytics) : 텍스트 분석 기술

* TTS(Text To Speech) : 텍스트를 음성으로 변환하는 기술

 

대화하는 AI 휴먼 키오스크가 우리 주변 음식점이나 카페에 본격적으로 자리 잡는다면 음식이나 음료를 주문하는 풍경도 많이 바뀔 수 있겠죠!

 

AI 휴먼 키오스크 : “안녕하세요! 오늘 특별 메뉴는 매콤한 떡볶이에 모듬 튀김인데, 고객님 마음속에는 칼칼한 김치찌개에 어묵탕이 자리 잡고 있죠? 비 오는 날이니까요.”

단골고객 : “하하. 맞아요. 떡볶이도 좋은데 오늘은 김치찌개네요. 어묵탕도 먹고 싶지만 배가 부를 것 같아서요. 부탁 할께요.”

AI 휴먼 키오스크 : 주문 완료! 맛있는 식사 하세요.

 

 

STT와 TTS 기술을 결합해 음성과 텍스트 등 다양한 방식으로 소통하는 게임업체도 있는데요. 비전과 애니메이션 기술로 외형과 동작까지 완벽하게 구현해 대화형 AI는 챗 GPT 수준의 언어모델 적용과 자연어 처리까지 가능해 이용자들이 원활하게 소통하며 게임할 수 있게 돕습니다. 게다가 스스로 게임을 이해하며 해결하는 능력까지 부여되어 이용자들의 큰 호응을 받고 있습니다.

 

 

효성의 STT 기술은

 

효성은 빅데이터와 AI 기술을 결합해 최적의 고객 응대를 위한 지능형 AI 고객 센터를 운영하고 있습니다. 실시간 필요한 지식과 제품 정보를 스크립트 형태로 제공해 각종 안내 서비스까지 가능해 고객과 더불어 직원들도 편리하고 효율적인 업무 환경을 지원하고 있습니다.

 

평소 감정노동에 시달리는 고객 센터 직원들의 어려움과 답답한 고객의 마음까지 헤아리고 싶은 효성은 고객의 다양한 요청사항을 실시간으로 텍스트로 변환하고 분석할 수 있는 VOC 솔루션을 개발했습니다.

 

효성의 고객 센터는 상담사와 고객이 나눈 대화가 실시간 텍스트로 변환돼 기록되고 있으므로 고객의 음성에서 이슈를 파악하고 시스템들과 연동해 이슈들을 해결할 수 있습니다. 가령 “지난달 청구 요금이 이상해요” 라는 고객님의 문의에 효성은 상담사에게 KMS(지식정보시스템)에서 요금관련 정보를 어떻게 찾는지를 자동으로 찾아내어 상담사에게 보여주고, 상담사는 빠르게 고객 응대를 할 수 있도록 도와 줄 수 있습니다. 

 

실시간으로 기록된 대화 데이터 분석으로 고객의 감정 상태와 문제가 무엇인지, 얼마나 자주 이런 문제가 발생하는지를 빠르게 파악할 수 있습니다. KMS, APP 시스템에 적용해 고객의 불만을 정확하게 확인하고 동일한 문제에 대비할 수 있도록 합니다. 물론 STT 기술로 여러 작업을 동시에 수행할 수 있는 상담원은 신속하고 정확한 해결로 행복한 상담업무를 진행할 수 있습니다.

 

다시 말해서 효성의 STT 기반 고객 센터는 대화 내용 분석으로 도출한 인사이트를 통해 불만은 빠르게 해결하고 정확하고 신속한 상담으로 고객과 상담사 모두를 건강하게 한 서비스라 자부합니다.

 

더불어 STT 기술로 누적된 정보는 상담 품질을 모니터링하고 수준을 평가하는데도 매우 유용한 자료인데요. 모든 통화 내용이 텍스트로 변환되기에 관리자는 물론 상담사까지도 내용을 검토해 혹여 발생한 실수를 고칠 수 있고 우수 사례는 교육자료로 활용할 수 있습니다.

 

고객의 소중한 목소리를 듣는 고객 센터, 효성은 STT 기술 기반 대화형 AI 프로그램으로 고객에게는 감동, 상담사에게는 행복한 환경을 제공하기 위해 노력하고 있습니다. 실제 많은 직원분이 상담 프로그램으로 고객의 마음을 더 잘 헤아릴 수 있어 업무 환경이 개선되었다며 만족해했습니다.

 


 

대화를 하면 할수록 답답해 스트레스받는 상담 과정이 아닌 마음과 마음을 이어주는 소통의 다리가 되겠다는 다짐과 함께 STT 기술 기반 효성의 혁신적 변화를 기대해 주세요.