KT는 AI원팀의 산학연 공동연구를 통해 4종의 AI 기술을 개발했다고 14일 밝혔다. 4종의 기술은 ▲로봇 실내 공간지능 기술 ▲로봇 소셜 인터랙션 기술 ▲보이스 클로닝 기술 ▲한국어 E2E 음성인식 트랜스퍼 러닝 기술로 KT AI 사업 및 서비스에 적용될 예정이다.
‘로봇 실내 공간지능’ 기술은 KT와 명현 KAIST 교수가 함께 개발했다. 로봇이 실내 공간의 사물을 식별하고 사물의 위치를 기억하는 기술이다. 로봇이 공간 내에서 특정 사람이나 사물 등 객체의 종류와 위치를 인식해 3D 지도를 생성하고, 실시간 업데이트가 가능하다. AI원팀은 이 알고리즘을 바탕으로 실내 자율주행에 접목하는 2차년도 연구를 지속해 KT의 로봇 실내 자율 주행 정밀도를 끌어올릴 계획이다.
‘로봇 소셜 인터랙션(Robot Social Interaction)’ 기술은 KT와 윤성의 KAIST 교수 연구진이 함께 개발했다. 사용자의 얼굴 및 행동을 인식한 후, 로봇이 수행할 행동을 추천하는 알고리즘을 구현했다. KT 로봇은 향후 개별 알고리즘을 연결해 로봇의 개인화된 상호작용을 구현할 계획이다.
이번 연구에서는 커스텀 보이스 학습에 필요한 녹음 시간을 기존 30분에서 3분으로 단축했다. KT는 이 기술을 기가지니, AI통화비서, AI 로봇, AI 교육 등에 도입해 ‘커스텀 개인화 TTS 서비스’를 상용화할 예정이다.
‘한국어 End-to-End 음성인식 트랜스퍼 러닝(Transfer Learning)’ 기술은 KT와 장준혁 한양대 교수가 개발했다. 기존 최고 성능을 내는 딥러닝 음성인식 모델 대비 에러율을 13.7% 감소시켜 세계 최고 수준의 음성인식 성능을 검증했다. 또한 모델을 처음부터 다시 학습하는 것이 아닌 기존 모델을 재사용하는 방식으로 소량의 도메인 데이터를 활용한 음성인식 개선이 가능해졌다.
정은경 기자 ek7869@fntimes.com
[관련기사]
가장 핫한 경제 소식! 한국금융신문의 ‘추천뉴스’를 받아보세요~
데일리 금융경제뉴스 Copyright ⓒ 한국금융신문 & FNTIMES.com
저작권법에 의거 상업적 목적의 무단 전재, 복사, 배포 금지