목소리만으로 인지장애를 판별해내는 인공지능

우리 대학 공과대학 컴퓨터공학과 김은이 교수와 건국대병원 이비인후-두경부외과 신정은 교수 연구팀이 1분 내외의 목소리만으로 인지장애 여부를 판별할 수 있는 AI를 개발했다. 해당 연구는 신호 처리 분야의 최고 권위 학회 ‘ICASSP’에서 개최한 ‘The MADReSS Challenge 2023’ 세계 대회에서 1위를 차지했다. 연구팀이 개발한 AI의 알츠하이머 질환 인식 정확도가 87%를 기록하며 우승을 거뒀다. AI가 질병을 인식한다는 것은 요즘의 우리에게 크게 놀라운 일은 아니다. 챗GPT처럼 간단한 제시어만 있다면 내가 원하는 글을 바로 만들어주는 인공지능 시대까지 다다르며 이를 이용한 ‘편리성’이 그 어느 때보다 강조되는 요즘이다. 우리 대학 연구팀이 개발한 인공지능은 1분 이내의 목소리로 인지장애 여부를 판별해 개개인의 ‘뇌기능 관리’가 더욱 편리해졌다. 과거 병원에 방문해 진료를 보고 관리해야 했던 뇌 건강이 이제는 간단한 대화 속의 음성으로 관리가 가능해지면서 현대인의 편리한 건강생활이 가능해진 것이다. 신 교수는 “알츠하이머에 대한 치료제가 없는 현실에서 가장 중요한 것은 예방”이라고 강조했다. 이어 연구팀이 개발한 AI의 도움을 받아 쉽고 간편하게 본인의 뇌 기능을 음성으로 확인하고 알츠하이머 전 단계인 난청, 인지장애의 여부를 확인할 수 있게 된 것이 건강관리에 있어 큰 편리성을 가지고 올 것이라 전했다.

인지장애 여부, 어떻게 판별해왔나?

서울아산병원의 질환백과에 따르면, 인지 장애란 △기억력 △주의력 △판단력 등이 저하된 상태를 의미한다. 인지 장애의 정도는 경미한 경우에서 심한 경우까지 다양하다. 인지 기능 장애가 심해 일상 및 사회생활에 지장을 주는 경우를 치매라고 한다. 경도 인지 장애는 동일 연령대에 비해 인지 기능이 떨어지지만, 일상생활 수행 능력은 남아 있어 치매보다는 경미한 인지 장애의 상태를 의미한다.

인지장애 여부를 확인하는 방법은 크게 △설문지 △MRI △바이오마커 세 가지로 나뉜다. MRI와 바이오마커를 통한 인지 장애 판별은 인지 장애가 일정 정도 진행이 된 다음에야 뒤늦게 MRI 상의 변화나 바이오마커가 뚜렷하게 발견되는 경우가 많았다. 설문지 검사는 앞선 두 방법과 다르게 언제든 검사를 진행해 인지 장애 여부를 판별할 수 있다. 하지만 응답자의 교육적 수준 등에 따라 환자의 실제 상태와 맞지 않는 결과가 나올 수 있다는 단점이 있었다. 이번 연구는 학자들이 사용하는 언어의 의미를 배제하고 음성의 음향학적 특성을 위주로 분석해 인지 장애 여부를 판별할 수 있다는 점에서 의의가 있다. 목소리만으로 판별이 진행돼, 피검사자의 △교육 기간 △교육 수준 △언어 능력 등에서 발생할 수 있는 차이를 검사 과정에서 배제할 수 있기 때문이다.

음향학적 특성으로 인지장애 여부를 판별하는 AI 기술

서로 다른 나라의 언어는 필연적으로 다른 음향학적 특성을 지니고 있다. 예를 들어 일본인의 경우 받침이 들어간 발음을 제대로 구사할 수 없다. 일본어의 언어적 특성상 받침을 말할 수 있는 경험이 없고 때문에 자연스레 받침과 관련된 발음은 퇴화하는 것이다. 이와 같은 국가별 언어의 특성을 반영해 알츠하이머를 판단하는 것이 일반적인 방법이었다. 병원에 온 환자의 알츠하이머 진단 방법은 MRI를 찍거나 설문조사를 하는 것이 일반적이지만 과정이 오래 걸리며 특히나 설문조사의 경우 진단율이 70프로에도 미치지 못해 환자의 상태를 정확하게 판별할 수 없다는 단점이 있었다. 단점을 극복하고 짧게는 30초 길게는 1분 30초의 목소리만 듣고도 해당 환자가 알츠하이머인지 아닌지 판별하는 역할을 AI가 하게 됐다. 더욱 주목할만한 점은 ‘언어’에 관계없이 그저 목소리의 음향학적 특징만으로 질환을 식별한다는 것이다.

이 연구에서 인지 장애 판별의 매개가 되는 ‘음향학적 특성’은 어떤 것일까? 이비인후과 영역에서는 jitter, shimmer, 발성지속시간(phonation time) 등의 의학적으로 의미있는 음향학적 특성들이 있다. 신정은 교수는 “말의 속도가 느려지거나 단어와 단어 사이의 간격이 길어지는 것, ‘음..’, ‘아..’ 등 의미 없는 소리가 말하는 사이에 들어가는 횟수와 길이, 띄어 말하기에 있어 어색한 정도가 정상인과 인지 장애 환자 사이에 매우 쉽게 구별되는 패턴을 보인다”고 전했다.

이런 음향학적 특징은 곧 ‘신호 처리 특징’이다. 정상인의 대화는 그 과정에서 쉬는 구간인 ‘포즈’가 있고 대부분 균일하게 패턴을 만들며 나타난다. 그러나 알츠하이머 환자의 경우 포즈가 지나치게 많아지고 일정하지 않은 모습을 보인다. 연구팀이 개발한 AI는 주어진 1분가량의 목소리 속 ‘포즈’를 신호로 삼아 △전처리 △특징 추출 △인식 과정을 거친다. AI가 질환을 인식하는 과정에 대해 김은이 교수는 “첫 번째 과정에서 신호 처리 AI 기술을 활용해 신호를 처리하고 이후 특징을 추출하고 마지막으로 인식기를 돌려 신호의 종류를 분류하거나 예측하는 순서로 진행된다”고 설명했다.

이번 연구에서 신호 처리 기술뿐만 아니라 또 하나 중요했던 것은 ‘데이터의 질’이다. 앞서 말했듯 실험에 참여하는 사람들의 교육 수준과 개개인의 언어 능력에 따라 데이터의 순도가 완전히 뒤바뀔 수 있기 때문이다. 신정은 교수는 “일반적인 AI는 좋은 데이터인지 아닌지 판별하는 능력이 현저히 떨어진다”며 문제를 해결하기 위해 “추가적으로 대화형 AI를 개발해 데이터의 오염을 배제했다”고 전했다.

‘치매 없는 세상’을 향해

뇌기능의 퇴행은 정상 상태에서 노인성 난청으로, 그 이후 인지장애로, 마지막에는 치매로 진행된다. 모든 노인성 난청 환자가 인지장애나 치매로 질환이 발전되는 것은 아니다. 하지만 난청이 있는 환자들은 그렇지 않은 환자들보다 인지장애로 넘어갈 확률이 2배~5배 높아지고, 인지장애가 발생하면 70%가 넘는 환자들이 치매로 발전하게 된다. 신정은 교수는 “치매로 가기 전에 많은 단계를 거치게 되지만, 이는 치매로 진행되는 것을 막을 기회가 그만큼 많이 있다는 것을 뜻하기도 한다”고 전했다. 치매는 치료제가 없어 예방이 가장 중요하다. 이런 현실에서, AI의 도움을 받아 쉽고 간편하게 본인의 뇌기능을 음성으로 확인한다면 치매 전 단계인 난청이나 인지장애 여부를 쉽게 확인할 수 있다. 이를 통해 치매가 생길 확률을 사전에 예측하고 이에 상응하는 예방 대응을 할 수 있도록 하는 것이 이번 연구의 목적이다.

병원에서 검사를 거쳤던 기존의 판별검사와 달리 스마트 디바이스 등을 통해 매일 본인의 상태를 검진하고, 필요한 대응과 관리를 받는 것은 삶의 질에 있어 많은 변화를 가져올 것으로 보인다. 특히나 연구팀이 개발한 AI는 기존 AI들과 달리 환자들이 사용하는 단어나 언어의 의미를 배제하고 음성의 음향학적 특성을 위주로 분석하여 얻은 결과라서 더욱 그 의미가 크다. 김은이 교수는 “알츠하이머 질환은 환자뿐만 아니라 가족들도 함께 고통을 짊어지고 있다”며 “연구팀이 개발한 AI를 통해 누구나 쉽고 저렴한 비용으로 질환을 주시한다면 환자뿐만 아니라 주변 사람들의 삶의 질까지도 훨씬 높일 수 있다고 생각한다”고 전했다.

앞으로 또 어떤 발전을 예상할 수 있을까?

김은이 교수는 “현재의 기술은 청각적 영역을 연구하고 있지만 다음에는 영상적 영역 또한 포함해 더욱 정확도를 높이고 싶다”고 말하며 알츠하이머뿐만 아니라 파킨슨과 같은 다른 질환에도 적용될 있는 기술의 발전을 강조했다. 신정은 교수는 또한 치매라는 질환에 대해 “나 자신을 잃어버리는 병”이라 일컬으며 비슷한 맥락에서 우울증 질환에 관심을 갖게 됐다고 말했다. 이어 “우리나라 특성상 본인의 감정을 말하는 것을 힘들어하고 그로 인해 안타까운 일들이 일어난 것을 봤었다”며 “현재의 연구를 계속 확장 시켜서 우울증을 진단할 수 있는 장치를 만들어 모두가 행복할 수 있는 세상을 만들어 보고 싶다”고 전했다.

상단영역

본문영역

목소리만으로 인지장애를 판별해내는 인공지능

관련기사

개의 댓글

댓글 정렬

내 댓글 모음