Purpose
This study aimed to evaluate the validity and reliability of the Korean version of Menopause-Specific Quality of Life (MENQOL).
Methods
The MENQOL was translated into Korean according to algorithm of linguistic validation process. A total of 308 menopausal womenwere recruited and assessed using the Korean version of MENQOL (MENQOL-K), the World Health Organization Quality of Life BriefVersion (WHOQOL-BREF), and Center for Epidemiological Studies Depression Scale (CES-D-K). In estimating reliability, internal consistencyreliability coefficients were calculated. Validity was evaluated through criterion validity and construct validity with confirmatory factor analysesusing SPSS 23.0 and AMOS 25.0 software.
Results
In item analyses, the “increased facial hair” symptom was excluded because of thelow contribution of MENQOL-K. The confirmatory factor analysis supported good fit and reliable scores for MENQOL-K model, and thefour-factor structure was validated (x2=553.28, p <.001, NC=1.84, RMSEA=.05, AGIF=.85, AIC=765.28). The MENQOL-K consists of 28 itemsin 4 domains, including vasomotor (3 items), psychosocial (7 items), physical (15 items), and sexual subscales (3 items). There was an acceptablecriterion validity with moderately significant correlation between MENQOL-K and WHOQOL-BREF. The Cronbach’s a for the 4subsacles ranged from .80 to .93.
Conclusion
The MENQOL-K is a valid and reliable scale to measure condition-specific quality of life forperimenopausal and postmenopausal women. It can be used to assess the impact of menopausal symptoms on the quality of life of Koreanwomen in clinical trials.
This study aimed to evaluate the validity and reliability of the Korean version of Menopause-Specific Quality of Life (MENQOL).
The MENQOL was translated into Korean according to algorithm of linguistic validation process. A total of 308 menopausal women were recruited and assessed using the Korean version of MENQOL (MENQOL-K), the World Health Organization Quality of Life Brief Version (WHOQOL-BREF), and Center for Epidemiological Studies Depression Scale (CES-D-K). In estimating reliability, internal consistency reliability coefficients were calculated. Validity was evaluated through criterion validity and construct validity with confirmatory factor analyses using SPSS 23.0 and AMOS 25.0 software.
In item analyses, the “increased facial hair” symptom was excluded because of the low contribution of MENQOL-K. The confirmatory factor analysis supported good fit and reliable scores for MENQOL-K model, and the four-factor structure was validated (χ2=553.28, p<.001, NC=1.84, RMSEA=.05, AGIF=.85, AIC=765.28). The MENQOL-K consists of 28 items in 4 domains, including vasomotor (3 items), psychosocial (7 items), physical (15 items), and sexual subscales (3 items). There was an acceptable criterion validity with moderately significant correlation between MENQOL-K and WHOQOL-BREF. The Cronbach's α for the 4 subsacles ranged from .80 to .93.
The MENQOL-K is a valid and reliable scale to measure condition-specific quality of life for perimenopausal and postmenopausal women. It can be used to assess the impact of menopausal symptoms on the quality of life of Korean women in clinical trials.
여성은 생애 주기에서 남성과 달리 월경, 임신, 출산 및 폐경 등의 다양한 생리적·신체적 변화의 과정을 경험한다. 이 중 폐경은 난소의 난포 활동의 감소로 생식능력이 끝남을 알리는 신호인 동시에 노화의 시작을 의미하는 정상적인 생리학적 사건이다[1, 2]. 대부분 여성은 약 40~58세에 월경이 불규칙해지다가 완전히 중지되며[3] 폐경 후 상태로 인생의 1/3~1/2을 살아가게 된다.
폐경기 여성들은 에스트로젠 수치가 감소하면서 안면홍조, 야간 발한 등과 같은 혈관운동 증상, 통증, 수면장애, 심장질환, 기억력 저하, 요실금 등과 같은 신체적 증상, 우울, 피로, 신경질 등과 같은 심리적 증상, 질 건조감, 성욕감퇴 등과 같은 성적 증상 등을 경험한다[2]. 이러한 증상은 폐경이 되기 약 5년 전부터 시작하여 폐경 후 7년까지 지속하는데 50~80%의 중년 여성들은 적어도 하나 이상의 증상을 경험한다[1, 4]. 대부분 증상이 생명을 위협할 정도는 아니지만, 일부 여성에서 폐경 증상들이 일상생활을 방해하여 삶의 질을 저하할 수 있다[1, 3, 4]. 특히 노화, 생식능력 상실, 외모의 변화와 폐경으로 인해 유발될 수 있는 골다공증, 심혈관질환과 같은 만성질환에 대해 걱정이 많은 여성은 폐경을 비관적으로 지각한다. 이러한 비관적인 태도는 폐경 이행기에 대처능력을 저하하고 적응을 방해하여 삶의 질에 부정적인 영향을 미친다[4, 5].
이와 반대로 중년 여성에게 폐경은 단순히 노년기에 접어든다는 신호가 아니라 월경으로부터의 자유, 경험이 풍부해졌다는 자각, 삶의 문제에 대처할 수 있다는 자신감 및 만족감 등과 같은 긍정적인 삶의 변화로 인식되기도 한다[2]. 이 시기에 중년 여성은 어머니와 아내의 역할에서 벗어나 내적인 자신을 찾고 이전 삶과는 다른 새로운 삶을 지향하기도 하고 자신이 추구하는 자유를 누리고자 인생을 재정립하려고도 한다[6]. 그러므로 폐경을 노화로 인한 자연스러운 현상이며 인생에서 누구나 접하는 하나의 사건으로 받아들이고 지속해서 건강한 삶을 영위하기 위해 폐경에 능동적으로 대처하고 삶의 질에 악영향을 미칠 수 있는 폐경 증상을 스스로 조절하고 관리하는 것이 중요하다[2, 7].
개인이 현재 경험하고 있는 특정 상태와 치료로 인해 영향을 받을 수 있는 신체적, 정서적, 사회적 측면을 모두 파악하는 삶의 질을 상태-특이적 삶의 질(condition-specific quality of life)이라고 한다[8]. 특정 상태는 개인의 삶의 질에 영향을 미치며, 비록 치료적 목적은 달성되었을지라도 이 때문에 삶의 질은 저하될 수 있으므로 질병 상태와 치료 효과를 평가하기 위해서는 전반적 삶의 질보다는 상태-특이적 삶의 질을 필수적으로 측정해야 한다[9]. 이와 같은 맥락에서, 폐경기 여성은 폐경으로의 이환이라는 독특한 상황을 경험하게 되므로, 개인이 경험하는 폐경 증상이 삶의 질에 미치는 영향 정도를 평가하기 위해서는 폐경 증상 관련 삶의 질을 측정하는 것이 건강관리의 중요한 결과 척도가 된다[9, 10].
선행연구에서 폐경기 여성의 삶의 질을 측정하기 위해 가장 많이 사용되고 있는 측정도구인 폐경 특이형 삶의 질(Menopause-Specific Quality of Life [MENQOL])은 폐경 증상 관련 삶의 질을 평가하기 위해 1996년도에 Hildtich 등[9]에 의해 캐나다에서 개발되었으며 안면타당도, 내용타당도, 판별타당도가 검증된 도구이다[4]. 이후 2005년 Lewis 등[11]이 MENQOL의 문항 6번 ‘experiencing poor memory’를 ‘poor memory’로, 문항 18번 ‘feeling lack of energy’를 ‘lack of energy’로, 문항 19번 ‘drying skin’을 ‘dry skin’으로 문장을 간결하게 만들고, 성파트너가 없는 여성을 고려하여 문항 2 8번 ‘vaginal dryness during intercourse’를 ‘vaginal dryness’로 수정한 도구가 사용되고 있다. MENQOL의 고유한 가정은 폐경 증상은 개인의 정서적, 신체적, 사회적 삶을 악화시키므로 치료 결정과 함께 삶의 질을 중요하게 고려해야 한다는 것이다[9]. MENQOL은 폐경기 여성 자신에게 중요한 증상과 경험에 대한 의견을 바탕으로 개발되었기 때문에 혈관운동 및 신체영역 뿐만 아니라 폐경 증상으로 인해 경험하는 성생활영역과 심리사회영역이 모두 포함되어 있어 다른 질문지보다 광범위한 폐경 증상을 확인하는데 용이하다[10].
또한, 임상적으로 경험하는 증상의 횟수와 강도보다는 증상의 유무를 기록하고 해당 증상이 삶에서 얼마나 신경 쓰이게 하는지를 대상자가 직접 작성토록 하는 환자보고평가(patient-reported outcomes)로 폐경 증상이 삶의 질에 미치는 정도를 평가하는 데 적절한 도구이다[9, 10]. 이에 MENQOL은 핀란드어, 이탈리아어, 폴란드어, 덴마크어, 노르웨이어, 독일어, 스페인어, 멕시코어, 일본어 등 19개 이상의 언어로 번역되어[12] 전 세계적으로 사용되고 있다[10]. 또한, MENQOL은 자연 폐경 여성뿐 아니라 당뇨[13], 유방암과 자궁암 등과 같이 질병과 치료로 인해 인공 폐경 된 여성의 삶의 질을 측정하기 위해 사용되고 있다[10, 14].
폐경기 여성이 자각하는 폐경 증상과 관련된 삶의 질은 여성이 사는 환경적, 사회적, 문화적 상황에 따라 다르다[2, 15]. 예를 들어 중국어판 MENQOL의 타당도와 신뢰도를 검증한 연구에서[16] ‘얼굴에 털이 남’ 문항은 유럽이나 미국과는 달리 중국 폐경기 여성의 삶의 질을 설명하지 못하는 것으로 확인되어 제거되었다. 따라서 MENQOL을 문화적 맥락 내에서 이해하면서 원도구와 같은 개념으로 번역하여 도구를 완성하고, 번역된 도구의 타당도와 신뢰도 검증을 한 후 사용해야 한다[10]. 하지만 우리나라는 MENQOL을 다수의 연구에서 사용하였지만 연구자들이 직접 원도구를 번역하여 타당도를 검증하지 않고 사용하거나[17, 18], 선행연구에서 타당도 검증없이 사용한 도구를 그대로 사용하고 있거나[19, 20], 원도구에 대한 설명만 기술하고 있다[21]는 제한점을 가진다. 이에 본 연구는 국내 폐경기 여성의 삶의 질 측정을 위하여 한국어판 MENQOL의 신뢰도와 타당도를 검증하고자 시도되었다.
본 연구는 폐경기 여성의 삶의 질을 측정하기 위한 한국어판 MENQOL의 타당도와 신뢰도를 검증하는 방법론적 연구이다.
본 연구의 대상자는 서울, 수원 및 천안에 거주하는 여성 중에 생식 노화 단계 연구 10차 보고서(Stages of Reproductive Aging Workshop +10 Expert Report) [22]의 최신 폐경 단계 정의를 반영하여 선정하였다. 여성호르몬이 변화하여 폐경 증상이 나타나거나 지속하는 시기인 폐경 이행 전기(early menopausal transition; 최근 월경 10주기 이내에 월경주기 간격이 7일 이상 차이 나는 주기가 적어도 2번 이상 있었던 경우)와 후기(late menopausal transition; 최근 60일 이상 지속하는 무월경 경험), 폐경기(postmenopause; 1년 이상 무월경)에 속하는 대상자를 임의표출하였다. 나이는 평균 폐경이 50세 전·후[4]이고 폐경 증상이 약 폐경 전 5년부터 시작하여 폐경 후 6년까지 지속한다는 점[1, 22]을 고려하여 45세에서 59세로 하였다. 대상자 중 약물, 수술이나 치료(항암요법 등)로 폐경이 된 여성, 폐경기가 6년 이상 된 여성, 호르몬 대체요법을 받은 여성, 이전에 정신과적 진단을 받은 과거력이 있는 여성은 제외하였다. 본 연구의 대상자 수는 360명이었으며, 확인적 요인분석을 위해서는 표본 크기가 최소한 300명이어야 한다는[23]점과 설문지 탈락률 20%를 고려하여 산출하였다. 회수된 설문지 중 응답이 미비한 설문지 등 52부를 제외한 308부를 최종분석에 사용하였다.
폐경 특이형 삶의 질은 1996년 Hilditch 등[9]이 개발하고 2005년 Lewis 등[11]이 수정한 MENQOL을 Mapi Research Trust [12]로부터 도구사용과 번역에 대한 승인을 받은 후 번역한 한국어판 MENQOL을 사용하여 측정하였다. 본 도구는 29개 항목으로 구성된 도구로 각 항목은 지난 일주일 동안 경험한 폐경 증상의 4가지 영역인 혈관운동영역(3문항), 심리사회영역(7문항), 신체영역(16문항), 성생활영역(3문항)을 평가한다. 특정 증상과 관련된 항목은 현재 존재하거나, 존재하지 않는 것으로 평가되며, 존재할 경우 ‘0점=전혀 신경 쓰이지 않음’에서 ‘6점=지극히 신경 쓰임’으로 평가한다. 분석을 위해 응답자의 답변을 분석 점수로 변환한다. 즉, 응답자의 답변 ‘아니오’는 ‘1’로, ‘0’은 ‘2’로, ‘1’은 ‘3’으로, ‘2’는 ‘4’로, ‘3’은 ‘5’로, ‘4’는 ‘6’으로, ‘5’는 ‘7’로, ‘6’은 ‘8’로 변환한다. 각 영역에 포함된 문항의 분석 점수의 합계를 해당 영역 내의 문항수로 나누어 각 하위 영역에 대한 평균값으로 점수화한다. 각 영역의 점수범위는 1~8점이 되고 점수가 높을수록 폐경 특이형 삶의 질이 나쁜 것으로 해석한다. 개발 당시 Cronbach's α 값은 .81~.89이었으며[9] 본 연구에서의 Cronbach's α 값은 .80~.92였다.
한국어판 MENQOL의 준거타당도를 검증하기 위해 삶의 질 간편형 척도(The World Health Organization Quality of Life Brief Version [WHOQOL-BREF])를 사용하였다. WHOQOL-BREF는 전 세계적으로 삶의 질을 측정하기 위해 사용되고 있는 타당도와 신뢰도가 확립된 도구이다[24]. WHOQOL-BREF는 세계보건기구(World Health Organization [WHO])에서 삶의 질을 평가하기 위해 개발한 WHOQOL의 간략화 버전으로[24], 본 연구에서는 WHO로부터 도구사용에 대한 허락을 받은 후 한국어판 WHOQOL-BREF 질문지를 메일로 전달받아 사용하였다. 본 도구는 26개의 문항으로 구성되어 있으며 신체적 건강(physical health), 심리적(psychological), 사회적 관계(social relationships), 환경(environment) 영역으로 나뉜다. 각 문항은 5개의 보기 중 하나를 답하게 되어있으며, ‘매우 나쁨-매우 좋음’, ‘매우 불만족-매우 만족’, ‘전혀 아니다-매우 많이 그렇다’, ‘전혀 아니다-전적으로 그렇다’, ‘전혀 아니다-항상 그렇다’의 보기들이 제시되어 있다. 각 문항은 영역별로 삶의 질에 대해 긍정적 혹은 부정적 방향성을 가지고 있어 가장 부정적인 답변을 1점, 가장 긍정적인 답변을 5점으로 채점한다. 본 연구에서는 WHO에서 권고한 채점 방식 중 전체 평균값을 이용하였고[24] 점수가 높을수록 삶의 질이 좋은 것으로 해석한다. WHOQOL-BREF의 개발 당시 Cronbach's α 값은 .84이었으며[24], 본 연구에서의 Cronbach's α 값은 .89이었다.
폐경기에 접어든 중년 여성 중 45.1%가 우울을 경험하고 있으며 [19] 폐경 증상과는 중정도의 정적 상관관계가 있는 것으로 보고된다[13, 19]. 이에 본 연구에서는 한국어판 MENQOL의 수렴 타당도를 검증하기 위해 Radloff [25]가 개발하고 Cho와 Kim [26]이 번역한 한국어판 역학연구 우울 척도(Korean version of Center for Epidemiological Studies Depression Scale [CES-D-K])를 Mapi Research Trust로부터 사용에 대한 허락을 받은 후 다운로드(https://eprovide.mapi-
도구의 번역과정은 MENQOL을 관리하는 Mapi Research Trust로부터 번역과 사용에 대한 승인을 받은 후 Mapi Research Trust에서 권고한 MENQOL의 언어적 타당성 과정 절차(algorithm of the linguistic validation process of the MENQOL)에 따라 진행하였다[12]. 언어적 타당성 과정이란 원도구를 다른 언어로 번역할 때 원도구와 개념적으로 동등한 언어이면서 문화적 맥락과도 일치하고 사용자들이 이해하기 쉬운 언어로 번역하는 과정을 말하며 총 4단계로 이루어진다.
1단계에서는 한국어가 모국어이면서 영어에 능통하고 서로 알지 못하는 두 번역가에게 MENQOL에 대한 기본적인 설명과 한국어판 MENQOL의 개발 목적 등을 설명하고 Mapi Research Trust에서 제공한 개념에 대한 설명과 번역 방법을 참고하여 의역하지 않고 원본의 해석에 충실하게 번역을 하도록 의뢰하였다. 그리고 폐경관련 연구 경험이 있는 간호학과 교수 1인과 도구 번역의 경험이 많은 연구자가 두 개의 번역 안에 대한 3차례의 검토 후 원도구와 개념적으로 동등하고 국내 폐경 여성이 쉽게 이해할 수 있는 단어나 어휘를 선택하여 version 1을 만들었다(Phase 1: forward translation step). 2단계에서는 한국어로 번역된 version 1을 영어에 능통하고 한국어가 모국어이며 원도구를 모르는 전문 번역가 2인에게 역번역을 의뢰하였으며 역번역된 내용을 연구자가 통합하였다. 다음으로 연구자와 원도구의 개발자와 함께 한국어로 번역된 도구와 영어로 역번역된 도구를 검토한 후 version 1을 수정하여 version 2를 만들었다(Phase 2: backward translation step). 이 과정에서 차이가 나는 문항은 번역 과정과 역번역 과정을 다시 검토하여 내용과 의미에서 일치되는 문항은 수용하고 문화적 차이로 나타난 문항은 다른 번역이 가능한지를 토의 후 조정하거나 내용을 구체화하여 대상자가 질문을 더 명확하고 쉽게 이해할 수 있도록 하였다. 3단계는 국내의 폐경기 여성이 번역된 version 2를 수용하고 이해할 수 있는지를 확인하는 대상자 검증 단계이다. 먼저 한국어가 모국어인 폐경기 여성 5명에게 version 2를 배부하여 개별적으로 작성하게 하였다. 작성 후 개별 면담을 하여 질문을 이해하는데 어려움은 없는지와 문항에 대해 해석을 하도록 하였으며, 혹시 어려움이 있다면 다른 단어나 어휘가 있는지 제시하도록 하였다. 5명 모두 모든 문항을 원도구와 같은 개념으로 명확하게 이해하여 수정 없이 version 3을 완성하였다(Phase 3: patient testing). 마지막 4단계는 version 3의 교정 단계이다. 타자, 철자 혹은 문법적으로 오류가 있는지 국어 국문학자에게 의뢰하여 최종 한국어판 MENQOL을 완성하였다(Phase 4: proofreading).
자료수집 전 연구자가 소속된 기관의 기관연구윤리심의위원회에서 연구승인(IRB No. AJIRB-SBR-SUR-18-181)을 받았다. 연구진행 기간은 2018년 9월부터 2019년 6월까지이었으며 자료수집은 서울, 수원 및 천안지역 주민센터를 방문하는 여성들을 대상으로 연구보조원이 연구목적을 설명하여 동의를 구하고 연구 참여에 동의한 대상자만을 대상으로 연구보조원이 직접 설문조사를 하였다. 또한, 익명성 보장, 참여를 원하지 않으면 언제든지 철회할 수 있으며 연구목적 이외의 다른 목적으로 사용되지 않을 것에 관해 설명하였으며 본 연구에 참여한 대상자에게는 소정의 답례품을 제공하였다.
수집된 자료는 IBM SPSS 23.0과 AMOS 25.0 통계 프로그램을 사용하여 분석하였다. 연구 대상자의 인구사회학적 특성은 기술통계로 분석하였으며, 문항의 개념에 대한 기여도를 확인하기 위해 폐경증상 빈도, 각 문항의 평균점수, 문항 간 상관관계(inter-item correlation), 문항과 하부요인 간 상관관계(item-domain correlation), 요인적재량(factor loading)을 이용하여 문항분석을 시행하였다. MENQOL은 여러 언어권에서 탐색적 요인분석과 확인적 요인분석을 통하여 원도구와 같이 구성타당도가 검증된 도구이다[10, 13, 16, 27, 28]. 이미 구성타당도가 확인된 도구를 다른 인구집단에서도 각 항목이 해당하는 요인에 속하는지 아닌지를 평가하는 상황에서는 확인적 요인분석이 적절한 것으로 보고되고 있다[29]. 이에 본 연구에서는 구성타당도 검증을 위해 확인적 요인분석(Confirmatory factor analysis)을 시행하였으며 모델의 적합도는 절대적합도 지수(Absolute fit index), 상대적합도 지수 Relative fit index), 간명적합도 지수(Parsimonious fit index)로 평가하였다. 절대적합도 지수는 문항구성의 적합도 분석을 위해 수집된 자료와 연구모델이 부합되는 정도를 절대적으로 평가하는 것으로 χ2 통계량(자유도, p 값), Normed χ2 통계량(Normed chi-square [NC]), 근사 오차평균자승의 이중근(Root mean squared error of approximation [RMSEA]), 조정적합지수(Adjusted goodness of fit index [AGFI])로 확인했다. 상대적합도 지수는 연구자의 구조방정식모델과 변수 간 상관을 설정하지 않은 모델(영모델)을 비교하여 얼마나 정확하게 측정되었는지를 나타내는 것으로 표준 적합지수(Normed fit index [NFI])와 비교 적합지수(Comparative fit index [CFI])로 확인하였다. 또한 간명적합도 지수는 두 모델을 비교해서 어떤 모델이 더 적합한지를 비교 평가하는 것으로 Akaike 정보지수(Akaike information criterion [AIC])로 확인하였다. 각 지수들이 적합하다고 평가되는 기준을 살펴보면, χ2 통계량을 이용하는 경우 χ2 통계량이 적을수록 p값이 커지게 되는데 .05보다 크면 일반적으로 적합도가 높은 것으로 받아들이고 있다. 그러나 표본 수에 민감하여 표본의 크기가 커질수록 χ2 통계량은 커지게 되므로 비록 통계적으로 유의하게 나타나더라도 반드시 적합도가 낮다고 할 수 없다. 이를 보완하기 위해 사용하는 지표로서 χ2 통계량을 자유도로 나눈 NC가 3.0 이하이면 적합한 것으로 받아들여진다. RMSEA는 .05 미만이면 매우 양호하고 .05~.08 이하이면 적합한 수준으로 받아들여질 수 있다. AGFI, NFI와 CFI는 .90 이상이면 매우 양호하고 .70~.90이면 적합한 수준으로 평가할 수 있고 AIC는 작을수록 적합도가 좋으며 높은 간명도를 가진 모델로 평가한다[30]. 또한 잠재요인과 구성변수들과의 관계를 확인하기 위해 유의성(Critical ratio [C.R.])을 확인하였다.
문항의 집중타당도(Convergent validity)와 판별타당도(Discriminant validity)를 검증하기 위해 표준화 요인부하량(Standardized estimates, β), 개념신뢰도(Construct reliability [CR]), 평균분산 추출지수(Average variance extracted [AVE]), 잠재요인 간 상관계수의 제곱(R2)을 확인하였다. 한국어판 MENQOL 측정도구의 수렴타당도와 준거타당도 검증은 개념 간의 상관을 확인하기 위해 Pearson's correlation으로 분석하였다. 상관계수가 .30~.50 미만이면 약한 상관관계, .50~.70이면 중정도의 상관관계, .70보다 크면 강한 상관관계로 해석하였다[31]. 집단비교법은 t-test를 이용하여 분석하였고 도구의 신뢰도는 Cronbach's α로 내적 일관성을 확인하였으며 .70에서 .80 미만이면 충분하고, .80 이상이면 매우 높은 것으로 평가하였다[23].
본 연구 대상자의 평균 나이는 53.7 (±2.97)세로 ‘45~49세’가 19.1%, ‘50~54세’ 49.4%, ‘55~59세’ 31.5%이었다. 현재 배우자가 ‘있다’고 응답한 대상자는 85.7%이었으며 종교가 있는 대상자는 57.1%이었다. 교육수준은 ‘고등학교 졸업’이 50.3%로 가장 많았고 현재 정규직 직업을 가진 대상자가 49.1%, 가정주부 36.0%, 시간제 근로자 14.9%이었다. 지각된 경제 수준은 ‘중’ 59.4%, ‘상’ 23.7%, ‘하’ 16.9% 순이었다. 지각된 건강상태에 대한 질문에 ‘보통이다’ 53.9%, ‘좋다’ 39.0%, ‘나쁘다’ 7.1% 순이었으며, 분만 경험이 있는 대상자는 94.2%이었다. 폐경기 대상자는 6 9.8%로 폐경 이행기 30.2%보다 많았다. 폐경기 대상자의 마지막 월경연령의 범위는 45~58세이었으며 평균 나이는 50.9 (±2.44)세이었다(Table 1).
Table 1
Soci-Demographic Characteristics of Participants (N=308)
MENQOL로 측정한 대상자의 폐경 증상 빈도를 살펴보면 문항별 증상이 ‘있다’고 응답한 경우는 16.9~81.5%로, 문항 13번 ‘피로하거나 지친 느낌’이 81.5%로 가장 많았고 문항 6번 ‘기억력 저하’가 80.2%, 문항 17번 ‘지구력 감퇴’ 72.7%, 문항 16번 ‘체력 감퇴’ 72.4%, 문항 12번 ‘근육과 관절의 통증’ 71.1% 순이었으며, 문항 21번 ‘얼굴에 털이 남’은 16.9%로 가장 낮았다(Table 2).
Table 2
Prevalence of Menopausal Symptoms and Item Analyses of the Korean Version of the MENQOL (29 items) (N=308)
문항분석 결과를 살펴보면, 각 문항의 평균점수는 1.38~4.09점으로 문항 13번 ‘피로하거나 지친 느낌’이 4.09점으로 가장 높았으며 문항 21번 ‘얼굴에 털이 남’이 1.38점으로 가장 낮았다. 요인적재량은 .50 이상이 바람직하고 .40은 최소 권장값인데[30] 문항별로 요인적 재량을 분석한 결과, 27개의 문항이 .40 이상을 충족했으며 문항 21번 ‘얼굴에 털이 남’과 25번 ‘잦은 소변’이 각각 .32, .35로 최소 권장값을 충족하지 못하였다. 문항과 하부요인과의 상관계수를 살펴보면, 혈관운동영역은 .84~.85, 심리사회영역은 .69~.86, 신체영역은 .42~.85, 성생활영역은 .87~.93이었다. 신체영역의 문항 21번 ‘얼굴에 털이 남’(r=.42)을 제외한 모든 문항이 자신이 속한 하부요인에서 중정도 이상의 상관관계를 보였으며 다른 하부요인보다 더 높은 상관관계가 있는 것으로 나타났다(Table 2).
한국어판 MENQOL의 구성타당도를 검증하기 위해 확인적 요인 분석을 시행한 결과는 Table 3과 같다. 본 연구에서는 한국어판 MENQOL의 29문항, 4개 요인으로 구성된 모델 1과 문항 21번을 제외한 28문항, 4개 요인으로 구성된 모델 2의 적합도를 비교하였다. 문항 21번 ‘얼굴에 털이 남’은 문항분석에서 요인적재량(.32)과 신체 영역과의 상관관계(r=.42)가 낮고 문항 간 상관관계(r=.16~.33)도 선정기준인 .30 미만[30]인 경우가 90.0%이었다. 따라서 문항 21번은 한국 여성의 폐경기 삶의 질 개념에 기여도가 낮은 문항으로 판단하였다. 모델 1의 적합도를 분석한 결과 χ2 통계량은 589.47(df=327, p<.001)로 나타났으나 NC가 1.80으로 3.0보다 작고 모델 적합지수인 RMSEA=.05, AGIF=.85, NFI=.90, CFI=.95로 기준을 충족하였다. 문항 21번을 제외한 모델 2의 적합도를 살펴보면 χ2 통계량이 553.28 (df=300, p<.001)로 나타났으나 NC가 1.84이었으며 RMSEA=.05, AGIF=.85, NFI=.91, CFI=.96으로 상대 적합도 지수가 모델 1보다 약간 상승하여 모델 2의 적합도도 좋은 것으로 확인되었다. 두 모델의 간명 적합도 지수인 AIC가 805.47에서 765.28로 감소하여 모델 2의 모형이 더 간명한 것으로 나타났다. 모델 2의 요인별 문항과의 관계에서 유의성(C.R.) 값은 8.17~21.09로 유의수준 .05기준에서 1.96 이상으로 모든 요인들이 구성변수들로부터 유의하게 설명되고 있는 것으로 나타나 4개 요인, 28개의 문항으로 구성된 한국어판 MENQOL (이하 MENQOL-K로 표기)을 최종 도구로 채택하였다(Table 4, Appendix 1).
Table 3
Comparison of Model Fit of the Korean Version of the MENQOL (N=308)
Table 4
Parameter Estimates and Analyses of Convergent and Discriminant Validity of the Korean Version of the MENQOL-K (28 items) (N=308)
확인적 요인분석을 통하여 최종 채택된 MENQOL-K의 문항 집중타당도와 판별타당도 검증결과는 Table 4와 같다. 문항의 집중타당도를 확보하기 위해서는 표준화 요인부하량(β)은 최소 기준인 .50 이상, 개념신뢰도(CR)는 .70 이상 그리고 .95 이하, 평균분산추출지수(AVE)는 .50 이상이 바람직하다[31]. 본 연구결과 모든 문항의 β 값은 .50~.91, CR은 .88~.95, AVE는 .59~.85로 확보기준을 모두 충족하였으므로 한국 여성의 폐경 증상관련 삶의 질을 측정하고자 하는 문항의 집중타당도가 검증되었다. 문항의 판별타당도는 두 하부요인 AVE 값이 요인 간의 상관계수(r)의 제곱(R2)보다 모두 크면 판별타당도가 있는 것으로 판단한다[31]. 본 연구에서는 요인 3의 AVE 값(.59)이 요인 2와 3 간의 상관계수(r=.78)의 제곱(R2=.61)보다 낮은 것으로 나타나 판별타당도를 확보하지 못하였다.
MENQOL-K 측정도구의 수렴타당도를 확인하고자 CES-D-K로 측정한 우울과의 상관관계를 분석하였다. 그 결과 모든 하위영역과 중정도의 정적 상관관계(r=.43~.68, p<.001)가 있는 것으로 나타나 수렴타당도가 확보되었다(Table 5).
Table 5
Correlations among the Korean Version of the MENQOL-K, WHOQOL-BREF and CES-D-K (N=308)
집단비교 타당도(Known-Group Validity)를 검증하기 위해 폐경이행기와 폐경기 여성의 MENQOL-K의 평균점수를 비교하였다. 그 결과 각각 혈관운동영역에서 2.40±1.47점과 3.05±1.89점(t=−3.27, p=.001), 심리사회영역에서 2.55±1.19점과 3.09±1.61점(t=−3.31, p=.001), 신체영역에서 2 .63±1.07점과 3.25±1.41점(t=−4.16, p<.0001), 성생활영역에서 2.68±1.93점과 3.82±2.08점(t=−4.49, p<.001)으로 폐경기 여성의 평균점수가 폐경 이행기 여성보다 모든 영역에서 통계적으로 유의하게 높았다. 따라서 폐경기 여성의 삶의 질이 폐경 이행기 여성보다 낮은 것으로 나타나 집단비교 타당도가 확보되었다.
MENQOL-K 측정도구의 준거타당도 중 동시타당도를 검증하기 위해 삶의 질 측정 도구 한국어판 WHOQOL-BREF와의 상관관계를 분석하였다. 그 결 과 모든 하 위요인에서 한 국어판 W HOQOL-BREF와는 유의한 부적 상관관계(r=−.35~−.54, p<.001)가 있는 것으로 나타나 준거타당도가 확보되었다(Table 5).
타당도를 확보한 최종 MENQOL-K 측정도구는 혈관운동영역 3문항, 심리사회영역 7문항, 신체영역 15문항, 성생활영역 3문항으로 구성되었다. 하위영역별 점수는 성생활영역 3.48±2.10, 신체영역 3.06±1.34, 심리사회영역 2.93±1.51, 혈관운동영역 2.85±1.79 순이었다. Cronbach's α 값은 신체영역 .93, 심리사회영역 .89, 성생활영역 .89, 혈관운동영역 .80 순으로 매우 높은 신뢰도를 보였다(Table 4).
MENQOL은 한국을 비롯하여 전 세계적으로 폐경기 여성의 혈관 운동영역, 심리사회영역, 신체영역, 성생활영역에서 폐경 증상으로 인한 상태-특이적 삶의 질을 평가하기 위하여 사용되는 환자보고평가 도구이다[9]. 우리나라의 경우 여러 선행연구에서 MENQOL을 한국어로 번역하여 사용하고 있으나 아직까지 타당도와 신뢰도가 검증되지 않은 실정이다. 이에 본 연구에서는 Mapi Research Trust에서 권고한 MENQOL의 언어적 타당성 과정 절차에 따라 국내 폐경기 여성들이 질문의 내용을 쉽고 명확하게 이해할 수 있는 MENQOL-K를 완성하고 신뢰도와 타당도를 검증하였다.
MENQOL은 선행연구에서 이미 혈관운동영역, 심리사회영역, 신체영역, 성생활영역으로 구성타당도가 검증된 도구[9, 13, 16, 27, 28]이므로 한국어판 MENQOL의 각 문항이 해당영역에 적절하게 포함되었는지 확인하기 위한 확인적 요인분석을 시행하였다[29]. 확인적 요인분석을 하기 전에 문항분석을 실시한 결과 문항 21번 ‘얼굴에 털이남’은 기여도가 낮은 것으로 나타났다. 이에 문항 21번을 제외한 28개 문항으로 구성된 모델과 29개의 문항 모델을 비교하여 적합도와 신뢰도가 상승한 28개 문항을 최종 도구로 선택하였다. 이러한 결과는 지역사회에 거주하는 중국인 여성[16]과 대만의 유방암환자[28]를 대상으로 한 선행연구에서 문항 21번을 제외하고 요인분석을 시행하여 4요인 28문항으로 수정한 결과와 비슷하다. 그러나 미국 여성을 대상으로 타당도를 확인한 연구에서는 문항 21번을 폐경기 여성의 삶의 질에 영향을 미치는 주요 증상으로 확인하면서 원도구와 같은 29문항으로 도구의 타당도를 검증한 결과와는 차이가 있다[32].
이러한 차이는 생문화적 차이에 기인한 것으로 본 연구에서 제외한 문항인 ‘얼굴에 털이 남’ 증상을 보면 본 연구 대상자의 16.9%만이 증상이 있다고 응답하였으며 평균점수는 1.38점이었다. 중국, 대만, 터키, 인도 등 아시아 여성을 대상으로 한 선행연구에서도 발생률 7.9~28.3%로 보고되며[5, 16, 28, 33], 대만 여성을 대상으로 한 연구에서 보고된 평균점수도 0.18점[28]으로 매우 낮다. 이와는 상반되게 아랍에서는 ‘얼굴에 털이 남’ 증상의 발생률은 44.3% [34]로 높고 미국과 인도에서 시행한 연구에서 제시된 평균점수도 각각 2.67점[35]과 3.10점[5]으로 높게 보고되고 있다. 이처럼 폐경 증상은 인종과 나라별로 발생률과 삶의 질에 미치는 영향 정도가 다르다는 점을 고려할 때, 각 나라의 폐경 특성에 맞추어 MENQOL의 타당도를 확인하고 사용하는 것이 적절하다[10]. 그러므로 문항분석과 구성타당도 검증을 통하여 ‘얼굴에 털이 남’을 제거한 28문항 MENQOL-K는 한국 여성의 폐경 증상으로 인한 삶의 질을 측정하는 데 적합하다고 사료된다.
본 연구에서는 문항의 집중타당도와 판별타당도, 도구의 수렴타당도 그리고 추가적으로 집단비교 타당도를 검증하여 구성타당도를 검증하였다. 문항의 집중타당도를 검증한 결과 모든 문항의 내용들이 하부요인의 개념을 일관되게 측정하고 있다는 것을 확인하였다. 그러나 판별타당도를 검증한 결과 신체영역과 심리사회영역이 독립적이지 않은 것으로 나타났다. MENQOL의 개발 당시와 선행연구에서 문항 판별타당도를 검증한 결과가 없어 비교가 어렵지만, Nie 등[16]의 연구에서도 두 요인의 상관관계가 .82로 높게 나타났다는 점을 고려할 때 신체영역과 심리사회영역의 판별타당도가 확보되지 않았을 것으로 보인다. 많은 선행연구에서 폐경으로 인한 체력감퇴, 피로하거나 지친 느낌, 통증 등과 같은 신체적 증상은 중년여성의 역할 기능을 저하시켜 우울과 불안이나 긴장감 등과 같은 심리적 증상을 유발하거나 악화시키는 영향요인으로 알려져 있으며, 폐경기 여성의 심리적 치료를 위한 권고사항에도 신체적 치료와 병행해야함을 강조하고 있다[36]. 이러한 이유로 두 영역의 판별타당도가 검증되지 않은 것으로 판단된다. 그러나 이와 같이 도구의 판별타당성이 부족한 경우 이론적 기틀에 따라 개발된 도구의 구성요인을 구분하여 측정하기 어렵고 연구결과에 대한 신뢰가 낮아질 수 있다[37]. 그러므로 추후 반복연구 혹은 탐색적 요인분석을 통하여 MENQOL-K의 요인 구조를 재검토하고 교차 적재되어있는 문항을 확인한 후 각 영역으로 구별하여 측정하도록 문항을 수정하는 과정이 요구된다[30, 37]. 또한, 문항의 판별타당도가 검증되기 전까지는 MENQOL-K의 결과 해석 시 심리사회영역과 신체영역별 점수를 구별하여 해석하지 않을 것을 권장한다.
추가로 구성타당도를 높이기 위해 폐경 이행기 여성과 폐경기 여성의 MENQOL-K 점수를 비교하는 집단비교 타당도 검증을 시행하였다. 폐경 증상은 성호르몬인 에스트라디올(estradiol)이 감소하여 혈관운동 증상이 나타나기 시작하는 폐경 이행기를 거쳐 생식능력 상실 및 난소기능의 노화가 진행된 폐경기로 갈수록 혈관운동 증상이나 비뇨생식관련 신체 증상이 더 다양하고 심각해진다[22]. 많은 선행연구들에서도[3, 5, 22, 38, 39] 폐경기 여성의 폐경 증상이나 폐경증상으로 인한 삶의 질 저하가 폐경 이행기 여성보다 심한 것으로 나타났다. 본 연구에서도 모든 영역에서 폐경기 여성의 삶의 질이 폐경 이행기 여성보다 낮은 것으로 나타나 타당도가 검증되었다.
다음으로 도구의 수렴타당도를 검증하기 위해 MENQOL-K의 하위영역과 CES-D-K로 측정한 우울과의 상관관계를 확인한 결과 .45에서 .68의 중정도의 상관관계가 있는 것으로 나타났다. 이는 폐경 증상으로 인한 고통 정도가 증가할수록 우울이 증가한다고 보고한 선행연구결과[13, 14]와 유사하다. 폐경 증상으로 저하된 삶의 질은 우울 수준을 높여 폐경기 적응을 방해하므로[19] 폐경 증상으로 인한 삶의 질 수준을 확인하여 필요한 중재를 적극적으로 제공한다면 우울을 예방할 수 있을 것이다.
도구의 준거타당도를 검증하기 위해 MENQOL-K 측정도구와 한국어판 WHOQOL-BREF을 이용하여 측정한 삶의 질 점수와의 상관관계를 분석한 결과 −.35~−.54로 중국 여성을 대상으로 한 연구에서 보고한 −.58~−.87 [40]보다는 낮았으나 폐경 증상으로 인해 괴로울수록 신체적, 심리적, 사회적, 영적 영역 등 다차원적 삶의 질이 저하되는 것으로 확인되어 준거타당도가 검증되었다. 따라서 MENQOL-K는 폐경 증상 정도와 전반적인 삶의 질을 함께 측정할 수 있는 상태-특이적 삶의 질 측정도구임을 확인하였다. 이는 MENQOL의 가장 큰 강점으로 최근 많은 중재연구에서 폐경 증상보다는 삶의 질에 초점을 두고 혈관운동, 신체, 심리사회, 성생활영역의 다양한 증상과 관련된 삶의 질을 자세하게 측정할 수 있는 MENQOL을 환자보고평가 측정도구로 사용하고 있다[10].
MENQOL-K의 신뢰도 검증을 위해 내적일관성을 확인한 결과 Cronbach's α 값은 혈관운동영역, 심리사회영역, 신체영역, 성생활영역에서 각각 .80, .89, .93, .89로 원도구의 .82, .81, .87, .89 [9]와 유사하게 모든 영역에서 골고루 높았다. 본 연구에서는 신체영역의 21번 문항을 제외하여 16문항에서 15문항으로 축소하였음에도 불구하고 신뢰도가 .92에서 .93으로 상승하였다. 따 라서 한 국어판 MENQOL-K는 한국 여성의 폐경기 증상으로 인한 모든 영역의 상태-특이적 삶의 질을 측정하는데 신뢰도가 우수한 도구로 평가할 수 있다.
영역별 점수를 살펴보면 성생활영역의 평균점수가 3.48점으로 가장 높았는데 이는 중국[16], 대만[28], 캐나다[14]의 폐경기 여성들이 ‘성욕감퇴’, ‘질 건조증’, ‘애정표현이나 성관계 회피’와 같은 성생활 문제로 인해 가장 많이 힘들어한다는 선행연구결과와 일치한다. 성생활 문제와 관련된 삶의 질은 폐경 후기로 갈수록 급격하게 저하되므로[3] 폐경 이행기 초반부터 성생활 문제를 다룰 수 있는 중재 프로그램이 필요하다. 문항별로 살펴보면 ‘피로하고 지친 느낌’과 ‘기억력 저하’가 있다고 응답한 대상자가 각각 81.5%, 80.2%로 가장 많았으며, 평균점수도 4.09점, 3.84점으로 가장 높았다. 이 두 증상은 대만, 인도, 중국, 영국, 호주, 미국의 여성을 대상으로 한 선행연구에서도[5, 13, 16, 28, 35] 발생률이 각각 72.0~93.8%, 77.6~94.4%이고 평균점수도 2.97~4.21점, 3.08~4.17점으로 높아 전 세계적으로 폐경기 여성의 삶의 질을 위협하는 증상으로 보고되고 있다.
특히, 폐경기의 중년 여성의 ‘피로와 지친 느낌’은 폐경 증상, 자아존중감 저하, 가사노동, 가족 내 역할수행 등으로 가중되는데, 이러한 피로가 호전되지 않고 축적되면 우울과 만성질환으로 진행될 수 있다[41]. 따라서 폐경기 여성의 피로를 관리하기 위해서는 폐경 증상관리와 함께 가족기능을 강화하고, 자아존중감을 향상시킬 수 있는 다양한 전략이 필요하다. 본 연구에서 두 번째로 발생률이 높았던 ‘기억력 저하’는 폐경이 되면서 뇌 혈류를 증가시키고 뇌 조직의 신경보호 기능을 하는 에스트로젠의 감소로 학습하고 기억하는 기능을 하는 해마의 신경이 변성되어 나타나는 인지기능 저하 증상이다[42]. 인지기능 저하는 일상생활, 학습, 업무처리 등을 어렵게 하여 대인관계 및 사회생활을 위축시키는 등 삶의 전반에 부정적인 영향을 미치며 폐경 증상은 인지기능을 더욱 악화시킨다. 따라서 폐경기 여성의 기억력 향상을 위해서는 폐경 증상 중재와 동시에 인지기능 증진 프로그램이 적용되어야 할 것이다.
본 연구에서 타당도와 신뢰도가 검증된 MENQOL-K는 폐경 증상과 관련된 삶의 질을 측정하는데 유용하게 사용될 수 있을 것으로 기대된다. 하지만 본 연구는 몇 가지 한계점을 가지고 있다. 첫째, 본 연구의 대상자는 국내에서 비교적 큰 도시인 서울, 수원 및 천안 지역에 거주하는 여성을 임의모집하였다. 따라서 본 연구결과를 한국 폐경기 여성에 일반화할 때 주의가 필요하며 추후에는 다양한 지역사회에 있는 폐경기 여성을 대상으로 한 반복연구가 요구된다. 둘째, 본 연구에서 사용된 측정도구는 지난 1주일간의 사건을 회상하여 작성하는 자가측정 설문지로 과거를 완벽하게 회상하지 못하거나 문화적 차이에 의한 편향으로 체계적 오류가 있을 수 있다.
본 연구는 폐경 특이형 삶의 질 측정도구인 MENQOL-K의 타당도와 신뢰도를 검증한 방법론적 연구로 MENQOL-K는 국내에서 사용하기에 타당하고 신뢰할 수 있는 도구임을 확인하였다. MENQOL-K는 원도구에서 ‘얼굴에 털이 많이 남’ 1문항을 제외하여 혈관운동영역(3문항), 심리사회영역(7문항), 신체영역(15문항), 성생활 영역(3문항)으로 4요인, 28문항으로 구성되었다. 또한, 준거타당도 검증을 통해 국내 폐경기 여성의 삶의 질을 함께 측정할 수 있는 상태-특이적 삶의 질 측정도구임을 확인하였다. 따라서 MENQOL-K는 폐경기 여성의 삶의 질을 향상시키기 위한 중재 프로그램의 효과를 평가하고 임상현장에서 폐경 증상에 따른 삶의 질을 측정할 수 있는 환자보고평가 측정도구로 사용될 수 있을 것이다.
본 연구는 2015년도 정부(교육부)의 재원으로 한국연구재단 기초연구 사업(과제번호. NRF-2015R1D1A1A01061101) 및 2018학년도 아주대학교 대학원 간호학과 지원에 의해 수행되었음.
This research was supported by the Basic Science Research Program through the National Research Foundation of Korea (NRF) funded by the Ministry of Education in 2015 (No. NRF-2015R1D1A1A01061101) and the Department of Nursing, Graduate School, Ajou University in 2018.
CONFLICTS OF INTEREST:The authors declared no conflict of interest.
AUTHOR CONTRIBUTIONS:
Conceptualization or/and Methodology: Park JH & Jung YM.
Data curation or/and Analysis: Park JH & Jung YM.
Funding acquisition: Park JH.
Investigation: Park JH & Bae SH & Jung YM.
Project administration or/and Supervision: Park JH.
Resources or/and Software: Park JH & Jung YM.
Validation: Park JH & Jung YM.
Visualization: Park JH & Jung YM.
Writing original draft or/and Review & editing: Park JH & Bae SH & Jung YM.