트랜스포머를 이용한 폐음 분류
연도 : 2023
vol / no : 2 / 4
현대사회는 환경적 요인으로 폐 건강에 대한 관심이 많다. 더욱 COVID-19는 폐 질환을 증가시켰고, 페 질환으로 인해 건강한 삶을 잃는 경우도 많아졌다. 폐 질환의 조기 발견은 무엇보다 중요하다. 침습적 방법이 아닌 음성데이터를 이용하여 폐 질환의 정상과 비정상을 분류 할 수 있는 연구를 설계하였다. 연구에 사용된 데이터는 ICBHI에서 제공하는 폐음 데이터로 6898개의 호흡주기로 구성되었으며 1864개는 탁탁소리, 886개는 쌕쌕거리는 소리, 506개의 탁탁거리는 소리와 쌕쌕거리는 소리를 다가지고 있는 데이터를 사용하였다. 폐음데이터를 정상과 비정상으로 분류하기 위해 전처리 과정으로 MFCC로 특징을 추출하고 트랜스포머 모델을 사용하였다. 트랜스포머 모델은 기존의 음성데이터 처리에 많이 사용하던 RNN, LSTM모델의 단점을 보완하는 모델이다.
Modern society is very interested in lung health due to environmental factor. Furthermore, COVID-19 increased lung diseases, and more cases of losing healthy lives to lung diseases, Early detection of lung diseases is of paramount importance. This paper was conducted to classify normal and abnormalities of lung diseases using voice data, not invasive methods. The data used in the study were lung sound data provided by iCBHI, which consisted of 6898 respiratory cycles, and data including 1864 crackles, 886 wheezing, 506 crackles and wheezing were used. In order to classify lung sound data into normal and abnormal, features were etracted with MFCC through a preprocessing process and the Transformer model was used. The Transformer model is a model that complements the shortcomings of the RNN and LSTM models, which are widely used for processing exiting voice data.
본 게시물에는 총 1개의 첨부파일이 존재합니다.