Purpose
This study evaluated the internal structure (structural validity, internal consistency, and measurement invariance) of the Health-Related Quality of Life Instrument with Eight Items (HINT-8), developed to measure Korean people’s health-related quality of life.
Methods
A secondary analysis was conducted using data from the Korea National Health and Nutrition Examination Survey, involving 6,167 adults aged over 18 years. The structural validity of the HINT-8 was assessed using exploratory graph analysis and confirmatory factor analysis. Internal consistency and measurement invariance were analyzed using McDonald’s omega (ω) and multigroup confirmatory factor analysis, respectively.
Results
The HINT-8 had a single dimension and good internal consistency (ω = .804). The one-dimension HINT-8 ex-hibited matric invariance but not scalar invariance across sociodemographic groups (sex, age, education, and marital status). Further, it exhibited scalar or partial scalar invariance across medical condition groups (hypertension, diabetes, depressive symptoms, and cancer).
Conclusion
The study finds that the HINT-8 demonstrated satisfactory structural validity and internal consistency, indicating its suitability for practice and research. However, the HINT-8 scores cannot be compared across different groups regarding sex, age, education, and marital status, as the interpretation varies within each sociodemographic category. Conversely, interpretation of the HINT-8 is consistent for individuals with and without hypertension, diabetes, depressive symptom, and cancer.
This study evaluated the internal structure (structural validity, internal consistency, and measurement invariance) of the Health-Related Quality of Life Instrument with Eight Items (HINT-8), developed to measure Korean people’s health-related quality of life.
A secondary analysis was conducted using data from the Korea National Health and Nutrition Examination Survey, involving 6,167 adults aged over 18 years. The structural validity of the HINT-8 was assessed using exploratory graph analysis and confirmatory factor analysis. Internal consistency and measurement invariance were analyzed using McDonald’s omega (ω) and multigroup confirmatory factor analysis, respectively.
The HINT-8 had a single dimension and good internal consistency (ω = .804). The one-dimension HINT-8 exhibited matric invariance but not scalar invariance across sociodemographic groups (sex, age, education, and marital status). Further, it exhibited scalar or partial scalar invariance across medical condition groups (hypertension, diabetes, depressive symptoms, and cancer).
The study finds that the HINT-8 demonstrated satisfactory structural validity and internal consistency, indicating its suitability for practice and research. However, the HINT-8 scores cannot be compared across different groups regarding sex, age, education, and marital status, as the interpretation varies within each sociodemographic category. Conversely, interpretation of the HINT-8 is consistent for individuals with and without hypertension, diabetes, depressive symptom, and cancer.
삶의 질(quality of life)이란 단어는 1960년대 미국에서 “삶(life)”과 “질(quality)”이라는 두 용어를 접목해서 처음으로 사용하기 시작했고, 이는 다차원적 개념으로 건강을 비롯한 직업, 거주, 이웃, 문화, 가치, 및 영성 영역을 포함한다[1]. 이후 1980년대부터는 광범위한 삶의 질 영역 중에서 건강과 연루된 속성들을 “건강 관련 삶의 질(health-related quality of life [HRQOL])”이라고 부르고, 주로 치료 및 중재 효과에 대한 결과지표로 사용해오고 있다[2].
HRQOL 측정은 일반형과 특이형으로 분류된다. 일반형은 다양한 인구집단에 사용하기 위해서 개발된 것으로, 일반인구집단의 HRQOL 또는 일반인구집단과 특정 질병 집단을 비교하고자 할 때 사용된다, 특이형은 어떤 특정 질병 및 조건을 가진 집단의 HRQOL을 측정하기 위해 개발된 것이다[2]. 따라서 관심 대상자에 따라 적합한 HRQOL 도구를 선정해서 사용한다.
일반형 HRQOL에는 비선호도기반의 건강 프로파일 도구(non preference-based health profile instrument)와 선호도기반의 건강 프로파일 도구(preference-based health profile instrument)가 있다. 비선호도기반 건강 프로파일 도구에서는 세부영역(하부척도)에 있는 문항에 응답한 점수를 사용해서 영역별로 점수를 산출한다[3]. 대표적 도구로는 Short Form 36-item Health Survey Questionnaire (SF-36)가 있다[4]. 선호도기반 도구에서는 기술된 항목에 응답하게 하고, 평가자의 선호도를 바탕으로 항목별 질 가중치를 구해서 0 (죽음)과 1 (완전한 건강상태)의 연속성 사이의 단일 건강 지수(index)를 산출한다. 이렇게 산출된 지수는 일반인구집단의 HRQOL 비교, 경제성 평가 및 건강수명 평가에 활용할 수 있는 장점이 있지만, HRQOL 변화를 감지하는 민감성이 떨어지기 때문에 임상시험 결과지표로 사용하기 어렵다는 단점도 가지고 있다[2]. European Quality of Life 5 Dimensions (EQ-5D)는 선호도기반 형태의 대표적 HRQOL 도구라고 할 수 있다[5]. EQ-5D는 운동능력, 자가관리, 일상활동, 통증/불편, 불안/우울에 대한 5개 문항을 가지고 있으며, 각 문항에 따른 응답 수준은 3개로 이루어져 있다(EQ-5D 3 Levels [EQ-5D-3L]). 이후에 모든 문항에서 천장효과(ceiling effect)가 나타난다는 문제점을 보완하기 위해서, 응답 수준이 5개로 수정된 EQ-5D-5L이 발표되었다[6].
EQ-5D-3L은 2005년부터 한국의 일반인구집단을 대상으로 실시되는 국민건강영양조사에 도입돼서 HRQOL 측정에 활용되고 있다. 하지만 천장효과 발생과 한국인에 적용하기에는 문화적 차이가 있을 수 있다는 우려가 제시되어서, 그 대안으로 선호도 기반의 일반형 HRQOL 측정도구인 “한국형 삶의 질 측정도구(health-related quality of life instrument with 8-items [HINT-8])”이 개발되었다[7, 8].
HINT-8 개발과정을 살펴보면, 문헌 고찰을 통해 기존에 사용되고 있는 일반형 HRQOL 측정도구를 도출하고, 도출된 도구의 유사한 문항을 묶어서 문항별로 분류하였다. 이외에 건강 의미와 EQ-5D 및 SF-36에 관한 반구조화된 질문지를 가지고 6명의 일반인(30~40대의 4년제 대학졸업 이상의 학력을 가진 사무직)을 대상으로 포커스그룹 토의 결과 및 전문가 자문회의를 거쳐서 총 30개 문항을 선출하였다. 이후, 탐색적 요인분석(exploratory factor analysis [EFA])을 통해 6개 영역(요인)을 도출하였다. 그리고 문항을 예측변수로 놓고 건강상태에 관한 100 mm visual analog scale (VAS) 및 이분형(“좋음”과 “좋지 않음”)의 자가 건강평가(self-rated health)를 종속변수로 다중 및 로지스틱 회귀분석을 실시하였고, 종속변수를 설명하는 데 기여한 8문항을 최종 선정하였다: 요인1 (“계단 오르기” 및 “통증”), 요인2 (“기운”), 요인3 (“일하기”), 요인4 (“우울”), 요인5 (“기억” 및 “잠자기”), 요인6 (“행복”). 그리고 6개 요인에 속했던 8개의 문항 중에서, “계단 오르기”, “통증”, “기운” 문항을 묶어서 신체적 영역, “일하기”를 사회적 영역, “우울”, “기억”, “수면”을 묶어서 정신적 영역, “행복”을 긍정적 영역으로 명명하였다. 각 문항은 4개의 응답 수준으로 구성되어 있고, 응답에 대한 회상 기간(recall period)은 1주다[7]. 이후 HINT-8에 대한 한국인의 선호도를 도출해서 질 가중치 예측모형을 구축하고, 이를 통해 HINT-8 지수를 산출한다. HINT-8 지수는 가장 나쁜 상태 .132부터 가장 좋은 상태 1로 나타났다[8].
최근에 선호도기반 HRQOL 도구의 전제조건으로서, 도구가 측정하고자 하는 것을 정확히 측정할 수 있는지에 대한 타당성 확보의 중요성이 재조명되고 있다. 즉, 도구의 심리계량적 내적구조(구성타당도, 내적 일관성 및 측정동일성)가 만족하였는지 확인한 후에, 선호도 기반의 항목별 질 가중치를 반영한 지수를 도출해야 한다는 것이다[9]. EQ-5D의 경우를 보더라도, 최근에 운동능력, 자가관리, 일상활동, 통증/불편, 및 불안/우울의 5문항에 대한 심리계량적 내적구조에 대한 연구결과들이 보고되고 있다[9, 10, 11].
HINT-8의 경우, 한국 노인, 당뇨병 및 유방암 환자를 대상으로 실시된 소수의 연구에서 측정-재측정 신뢰도, 수렴타당도 및 집합타당도가 보고되었다[12, 13, 14], 하지만 구성타당도나 측정동일성과 관련된 심리계량적 내적구조에 대한 연구는 찾아볼 수 없다. HINT-8 개발 당시에 EFA가 시행됐지만[7], 이 방법은 도구의 차원에 대한 아이디어가 없는 경우 단순히 사전 탐색의 목적으로 시행되는 것이며, 실증적 구성타당도 검증방법으로 사용되는 것은 확정적 요인분석(confirmatory factor analysis [CFA]) 또는 문항반응이론(item response theory)이 적용되어야 할 필요가 있다[15]. 이외에도, 위에서 언급된 것처럼 HINT-8 원도구가 개발될 때[7, 8], EFA에 의해 도출된 6개의 요인이 어떻게 4개의 요인으로 축소되었는지에 대한 것뿐만 아니라, 특정 요인에 적재된 문항이 어떻게 다른 요인의 문항으로 재편성되었는지에 대한 실증적 근거를 찾아볼 수 없다.
HINT-8의 측정동일성 검증은 집단 간의 HINT-8 점수의 비교 가능성을 확인하는데 중요한 의미가 있다. 예를 들어, 당뇨병이 있는 노인을 대상으로 성별, 연령(65세 미만과 이상) 및 학력 수준 등에 따라 HINT-8의 평균점수의 차이를 분석한 결과, 여성, 고령일수록, 초등/중학교 졸업의 학력을 가진 노인일수록 HINT-8의 점수가 높은 것으로 나타났다[16]. 하지만 HINT-8이 인구사회학적 집단에 따라 측정동일성이 성립한다는 근거가 부재하기 때문에, 이 연구결과가 HINT-8로 측정된 집단 간의 평균점수가 HRQOL의 참 점수의 차이인지 아니면 각기 다른 집단에 속한 노인들이 HINT-8 문항의 의미를 다르게 인식함으로 발생한 바이어스의 결과인지 알 수 없다. 따라서 집단 간의 HRQOL 점수를 비교하기 위해서는 측정동일성 검증이 필요하다.
HINT-8의 심리계량적 내적구조 평가 중에서, 내적일관성 검증 결과로 Cronbach’s alpha (.821)가 보고되었다[17]. 하지만, 가장 보편적으로 사용해왔던 Cronbach’s alpha는 정확성의 문제로 인해서, 최근에는 McDonald’s omega (ω) 분석이 권장되고 있다[18]. 그러므로 HINT-8의 내적일관성을 ω를 적용해서 분석해 볼 필요가 있다. 따라서 HINT-8 지수에 대한 신용성 확보를 위해서라도, 전제조건인 심리계량적 내적구조에 대해 평가해볼 필요가 있다.
본 연구의 목적은 HINT-8의 심리계량적 내적구조(구성타당도, 내적일관성, 및 측정동일성)를 평가하는 것이다.
HINT-8의 구성타당도, 내적일관성 및 측정동일성을 검증하기 위해서 국민건강영양조사 이차자료를 사용한 심리계량적 연구다.
본 연구에서는 국민건강영양조사 8기 1차년도(Korea National Health and Nutrition Examination Survey VIII-1 [KNHANES VIII-1]) 자료가 활용되었다[19]. 국민건강영양조사 8기 1차년도 조사에는 전국 192개 조사구로부터 총 7,096명이 건강설문조사 및 검진조사에 참여하였다. 이 중에서 19세 이상과 HINT-8 문항 수에 최소 80% 이상 응답한 6,167명을 최종분석 대상자로 하였다. 본 연구는 HINT-8에 대한 심리계량적 연구이므로 복합표본 가중치는 고려되지 않았다.
HINT-8은 일반형 건강관련 삶의 질 측정 도구로 신체적, 사회적, 정신적 및 긍정적 영역에 걸쳐 총 8개의 문항으로 구성되어 있다(계단 오르기, 통증, 기운, 일하기, 우울, 기억, 잠자기 및 행복). 지난 1주일 동안의 건강상태에 대한 질문에 4개 수준의 응답 중에서 하나를 선택하는 것이다[7]. 예를 들어, 계단 오르기 문항에 대한 응답으로 어려움이 “전혀 없었다 = 1”, “약간 있었다 = 2”, “많이 있었다 = 3”, “오를 수 없었다 = 4” 중에서 하나를 선택하며, 우울 문항에서는 “전혀 우울하지 않았다 = 1”, “가끔 우울했다 = 2”, “자주 우울했다 = 3 ”, “ 항상 우울했다 = 4” 중에서 하나를 선택한다[7].
측정동일성평가를 위한 인구사회학적 변수로 국민건강영양조사 자료 중에서 성별, 나이, 교육, 결혼상태를 사용하였다. 나이는 65세 미만과 이상으로 구분하였고, 교육은 중학교 졸업 이하, 고등학교 졸업 및 대학교 졸업 이상으로 분류하였고, 결혼상태는 결혼, 이혼/사별/별거 및 미혼으로 분류하였다[19].
당뇨병, 심장혈관 질환, 신장 질환, 우울증, 관절염 및 암 유무는 HRQOL과 관련이 있다[20]. 따라서 이러한 만성질환 유병여부를 측정동일성 평가를 위한 연구변수로 정하고, 국민건강영양조사의 검진자료 및 건강설문조사 자료를 사용하였다.
고혈압 및 당뇨병 유병여부는 검진자료를 사용하였다. 고혈압 유병여부는 고혈압, 고혈압 전단계 및 정상 집단으로 분류되었다. 수축기압이 140 mmhg 이상 또는 이완기압이 90 mmhg 이상 또는 고혈압 약물을 복용하는 사람은 고혈압으로 정의하고, 고혈압 전단계는 수축기 혈압이 120 mmhg 이상~140 mmhg 미만이고 이완기 혈압이 80 mmhg 이상~90 mmhg 미만을 의미하며, 정상은 수축기 혈압이 120 mmhg 미만이고 이완기 혈압이 80 mmhg 미만을 말한다.
당뇨병 유병여부는 당뇨병, 당뇨병 전단계 및 정상 집단으로 분류되었다. 당뇨병은 공복혈당 126 mg/dL 이상이거나, 의사진단을 받았거나 혈당강하제 복용 또는 인슐린 주사를 사용하거나, 당화혈색소 6.5% 이상으로 정의되었다. 당뇨병 전단계는 공복혈당 100~125 mg/dL 또는 당화혈색소가 5.7~6.4%인 경우를 말한다. 정상은 공복혈당 100 mg/dL 미만 또는 당화혈색소 5.7% 미만을 의미한다.
우울증, 관절염 및 암 유병여부는 건강설문조사 자료를 사용하였다. 질병에 대한 의사진단을 받았는지에 따라 ‘있음’과 ‘없음’ 집단으로 분류되었다.
자료분석은 IBM SPSS Statistics version 26, AMOS version 25 (IBM Corp., Armonk, NY, USA) 및 R 프로그램을 사용하였다. 구성타당도 교차검증을 위해서 SPSS에 있는 무작위 할당기능을 이용해서 전체 표본을 두 개의 하부표본으로 분류했다. 하부표본 1 (n = 3,102)은 HINT-8을 구성하는 차원의 수를 탐색할 목적으로 심리계량적 네트워크(psychometric network) 방법인 탐색적 그래픽분석(exploratory graphic analysis [EGA])에 사용하였다[21]. EGA를 위해 EGAnet 패키지를 활용하였으며, 사용된 추정방법은 graphical least absolute shrinkage and selection operator (GLASSO)였고, 문항의 클러스터 확인을 위해서 louvain algorithm을 사용하였다. 또한, 차원의 수와 차원에 속하는 문항의 반복 가능성(replicability)을 파악하기 위해서 붓스트랩 1,000번을 적용한 bootEGA를 사용하였다[22].
하부표본 2 (n = 3,065)는 EGA에 의해 도출된 측정모형이 적합한지를 검증하기 위한 CFA에 사용하였다. CFA를 수행하기 위해서는 자료가 다변량 정규성을 만족해야 한다. 하지만 CFA에 사용된 본 연구 자료는 다변량 정규성(Mardia’s coefficient > 5.00)을 만족하지 못했기 때문에, 대안 방법으로 붓스트랩(1,000 resampling)을 사용하였다[23]. 측정모델의 적합도 평가는 comparative fit index (CFI), root-mean-square error of approximation (RMSEA) 및 standardized root-mean-square residual (SRMR)을 이용하였다. CFI .95 이상은 좋은 적합도, .90~.95는 수용할 수 있는 적합도를 의미하며, RMSEA와 SRMR .05 미만은 좋은 적합도, .05~.08은 수용할 수 있는 적합도를 의미한다[24, 25]. 측정모델의 수정은 수정지수(modification index)를 사용해서 요인 내 문항의 측정오차상관을 한 쌍씩 허용하면서 CFA를 수행하였다. 만약 수정모델의 CFI 값이 이전 모델의 CFI 값보다 .01 이상 증가하면, 수정모델은 유의미하게 향상되었다고 보았다[23].
HINT-8의 내적일관성 및 측정동일성 검증은 전체 자료를 사용해서 분석했다. 내적일관성 검증은 ω > .70을 사용하였다[18]. 측정동일성 검증은 다집단 요인분석(multigroup confirmatory factor analysis [MGCFA])으로 실시하였다. MGCFA는 제약 수준에 따라 4단계의 위계적 모델로 이루어진다[26]: 형태동일성(configural invariance), 매트릭동일성(matric invariance), 스칼라동일성(scalar invariance) 및 오차분산동일성(error variance invariance). 형태동일성은 집단별로 같은 관측변수(문항)가 같은 잠재변수에 적재된다는 것이며, 매트릭동일성은 집단 간에 요인계수가 동일하다는 것을 의미한다. 스칼라동일성은 'BA매트릭동일성의 조건에 문항의 절편(intercept)을 동일하게 제약한 것이며, 오차분산동일성은 스칼라동일성의 조건에 문항의 측정오차분산을 같게 제약한 것을 말한다. 하지만 마지막 단계인 오차분산동일성은 제약이 매우 엄격하므로 현실적으로 달성되기 어렵다[27]. 따라서 본 연구에서는 오차분산동일성을 분석에서 제외했다. 측정동일성의 평가는 이전 단계의 제약모델과 비교해서 CFI 값의 차이가 .01보다 적을 때, 해당 단계의 제약모델을 수용하였다[28]. 측정동일성이 만족하지 않았을 때, 각 문항에 등가된 제약을 풀어가면서 시행하는 후진(backward) 방식으로 부분 측정동일성을 분석하였다.
국민건강영양조사 8기 1차년도 조사는 한국질병관리청 연구윤리기관으로부터 승인을 받은 것이며(2018-01-03-C-A) 2022년 대중에게 공개된 자료다. 본 이차자료분석 연구는 아주대학병원 연구윤리위원회(Institutional Review Board)로부터 심의면제를 받았다(AJOUIRB-EX-2023-005).
전체 연구대상자에서 여자는 55.7%를 차지하였으며, 65세 이상의 노인은 26.5%, 배우자와 같이 사는 기혼자는 68.5%, 대학교 이상의 학력을 가진 사람은 27.1%였다. 고혈압 환자는 32.7%, 당뇨병 환자는 13.5%였으며, 우울증, 관절염, 암을 진단받은 적이 있는 사람은 각각 4.6%, 12.6%, 5.7%였다(Table 1).
Table 1
Sociodemographic and Medical Information of the HINT-8
하부표본 1을 사용한 EGA 결과(Figure 1), 노드(nodes or items)는 모두 같은 색으로 나타나서 HINT-8은 단일차원(single dimension or community)으로 구성되어 있다는 것을 의미한다. 노드를 연결하고 있는 에지(edges or links)의 가중치 중에서 문항 5(“우울”)와 8(“행복”)의 관계가 가장 강하게 나타났다. bootEGA 결과, 100%에서 차원의 수가 하나로 나타났기 때문에, 도출된 단일차원은 안정(stable)하다고 할 수 있다. 각 문항이 도출된 차원에 속할 비율은 모두 1로써 수용기준 .80보다 높아서 문항의 안전성도 만족했다[29].
Figure 1
The orange node with the number 1 at the right side represents that eight items (orange nodes) belong to single dimension.
Dimensional structure of the HINT-8 using exploratory graph analysis.
Item 1 = Climbing stairs; Item 2 = Pain; Item 3 = Energy (Vitality); Item 4 = Working; Item 5 = Depression; Item 6 = Memory; Item 7 = Sleep; Item 8 = Happiness; HINT-8 = Health-Related Quality of Life Instrument with 8-Items.
EGA에서 도출된 8개의 문항으로 구성된 단일차원의 측정모델을 검증하기 위해, 하부표본 2를 사용해서 CFA를 수행하였다. 그 결과 초기모델의 적합도 지수는 χ2 = 692.109 (p < .001), CFI = .897, SRMR = .053, RMSEA = .097로 부분적으로 만족하였다. 따라서 모델수정을 단계적으로 실시하였다(Table 2). 수정모델 2의 적합도 지수는 모두 만족되었으며, 수정모델 1의 CFI 값과 비교했을 때 그 차이가 수용치 .01 이상이었으므로 모델이 의미 있게 향상되었다[23]. 하지만 문항 8(“행복”)의 요인적재 값이 .449로 나타나서 이 문항을 삭제한 수정모델 3을 분석하였다. 그 결과 수정모델 3의 지수도 모두 적합하게 나타났다. 하지만, 수정모델 2의 CFI 값과 차이가 없었다(Change in CFI compared with the previous model [ΔCFI] = .000). 즉, 모형이 향상되지 않아서 문항 8을 유지하고 수정모델 2를 최종 측정모델로 정했다(Figure 2).
Figure 2
Confirmatory factor analysis model of the HINT-8 with subsample 2.
HINT-8 = Health-Related Quality of Life Instrument with 8-Items; Item 1 = Climbing stairs; Item 2 = Pain; Item 3 = Energy (Vitality); Item 4 = Working; Item 5 = Depression; Item 6 = Memory; Item 7 = Sleep; Item 8 = Happiness; e = Measurement error.
Table 2
Summary of Fit Indices in Confirmatory Factor Analysis of the HINT-8 with Subsample 2
전체 및 하부 1과 2 표본에서 HINT-8 내적일관성을 분석하기 위해서 ω를 계산한 결과 .804, .812, 및 .797로 모두 수용기준 .70 이상을 만족했다.
먼저 HINT-8 단일차원 측정모델이 전체 표본에서도 적합한지 분석한 결과, χ2 = 585.171 (p < .001), CFI = .952, SRMR = .038, RMSEA = 0.071 (90% confidence interval = .067~.077)로 적합하였다. 요인적재량은 모두 유의하였고 문항 8 (.465)을 제외하고 모두 .50 이상(.719~.512)였다. 다음으로 인구사회학적 및 유병 집단에 걸쳐서 HINT-8의 측정동일성 검증을 시행하였다(Table 3). 성별에 따라 HINT-8의 형태 및 매트릭동일성이 충족하였다. 즉, 집단 간에 동일한 관측변수(문항)가 같은 잠재변수에 적재되었고, 집단에 걸쳐서 문항의 요인계수가 같았다. 하지만 문항의 절편(intercept)까지 같도록 제약한 스칼라동일성은 충족하지 않았다(ΔCFI = .031). 그래서 남·여 집단 간에 문항 절편의 등가 제약을 풀어가면서 분석하였다. 그 결과 문항 6(“기억”)과 8(“행복”)을 제외한 모든 문항의 절편을 자유롭게 했을 때, 부분 스칼라동일성이 충족했다(ΔCFI = .006). 하지만 Steenkamp와 Baumgartner [30]는 부분 측정동일성에서 잠재변수(요인)에 속한 문항 수의 반 이상의 파라미터(요인계수 또는 절편)가 같아야 한다고 했다. 이런 관점에서, 성별 집단은 매트릭동일성까지 충족되었다고 볼 수 있다.
Table 3
Measurement Invariance of the HINT-8 across Sociodemographic and Chronic Disease Groups
HINT-8은 65세 미만과 이상의 두 집단에 걸쳐서 형태 및 매트릭동일성을 충족했다. 하지만 스칼라동일성 모형의 CFI 값이 .857로 수용치 이하였기 때문에 더 이상의 분석을 진행하지 않았다. 교육집단(중학교 졸업 이하, 고등학교 졸업, 대학교 졸업 이상)에 따른 측정동일성 결과에서도 나이 집단에서와 같은 현상이 나타났다. 결혼상태 집단(결혼, 이혼/사별/별거, 미혼)에 따른 HINT-8 측정동일성 결과에서는 문항 6(“기억”), 7(“잠자기”) 요인계수에 가한 제약을 자유롭게 했을 때, 부분 매트릭동일성이 충족했다.
고혈압 유병 집단(정상, 전단계, 고혈압)과 관련해서, HINT-8 문항 1 (“계단 오르기”), 2 (“통증”), 4 (“일하기”), 6 (“기억”) 절편의 등가 제약 해제 후에 부분 스칼라동일성이 충족했다. 당뇨병 유병 집단(정상, 전단계, 당뇨병)에서는 문항 1 (“계단 오르기”), 2 (“통증”), 4 (“일하기”), 8 (“행복”) 절편의 등가 제약 해제 후에, 부분 스칼라동일성이 충족되었다. 우울증 유무 집단에서도 문항 4 (“일하기”), 5 (“우울”), 7 (“잠자기”) 절편을 자유롭게 한 상태에서 부분 스칼라동일성이 충족되었다. 관절염 유무 집단에 따른 측정동일성 분석에서는 매트릭동일성까지만 충족되었다. 반면, 암 유무 집단에 걸친 분석결과에서는 HTNT-8의 형태, 매트릭 및 스칼라동일성 모두가 만족하였다.
한국 국민건강영양조사 8기 1차년도 자료를 이용해서 한국인 삶의 질 측정도구로 개발된 HINT-8의 심리계량적 내적구조를 검증하였다. 첫 번째로 HINT-8을 구성하는 차원의 수와 각 차원에 속하는 문항을 검증하였고, 두 번째로 차원(하부척도)을 구성하는 문항들이 자신이 속한 차원을 어느 정도 측정하는지를 파악하였다. 마지막으로 HINT-8 구성이 인구사회학적 및 만성질환 유병 집단에 걸쳐서 동일한지 살펴보았다.
본 연구에서 구성타당도 검증을 EGA와 CFA를 통한 교차 타당도 접근법을 사용해서 분석한 결과, 8개 문항이 하나의 차원에 속하는 단일차원으로 나타났다. 이와 같은 방법을 사용해서 EQ-5D-3L 및 EQ-5D–5L 구성타당도를 검증한 연구가 있다[9, 11]. 그 결과, 5개 문항 중에서 일상활동, 자가관리, 운동능력 문항이 하나의 하부척도로 그리고 나머지 통증과 불안/우울 문항이 다른 하부척도로 구성된 2개의 차원을 가진 도구로 나타났다. 국제적으로 HRQOL 개념은 주관성 및 다차원성이란 속성을 가진다는 전문가 합의가 이루어진 상태다[2, 31]. 따라서 자가보고형의 EQ-5D는 이에 부합한다고 할 수 있다. 이에 반해 HINT-8은 왜 단일차원인지, 그 이유를 살펴볼 필요가 있다.
첫 번째 이유는 문화적 이슈와 관련된 것일 수 있다. 처음에 HINT-8 개발 목적 중의 하나가 한국문화를 반영하는 일반형 HRQOL 도구가 필요하다는 것이었다[7]. 문화적 영향을 받을 가능성이 많은 개념을 측정하는 도구를 개발할 때, 보통은 질적연구(예를 들어, 현상학연구, 근거이론연구, 심층면접)를 통해서 특정 문화권에 사는 사람이 경험하는 속성(attributes)을 도출하고 이를 근거로 문항을 작성하는 기법을 사용한다. HINT-8의 경우는 주로 기존에 사용되고 있는 34개의 도구를 수집해서, 여기에 포함된 단어를 선정하고 일방향의 전진(forward) 방식으로 한국어로 번역한 후, 유사단어끼리 묶고 정리하는 방법을 사용하였다. 게다가, 수집된 도구 중에는 한국에서 개발된 도구는 1개였고, 나머지는 주로 영어로 쓰인 도구였다(프랑스, 중국, 일본에서 개발된 도구 하나씩 포함). 이처럼 외국(주로 서구) 문화권에서 개발된 도구를 기반으로 도구를 개발했을 때, 과연 새로 개발된 HINT-8에 한국 문화에서 거주하는 사람들이 느끼고 생각하는 고유한 특성이 충분히 반영됐는지 의문이다.
두 번째 이유는 HINT-8에 서로 다른 차원을 이어주는 어떤 문항이 있어서 마치 하나의 차원으로 구성된 것처럼 보이게 했을 가능성이 있다. 3번 문항 “기운”이 여기에 해당할 수 있다. 이 문항은 외국 도구의 “vitality”에서 가져온 것으로 “활기”로 번역되었다가 “기운”으로 수정된 것이다[7]. 사람이 느끼는 활력(subjective vitality)이란 정서적 안녕과 신체적 건강 모두에 관여하는 개념이다[32]. 이런 관점에서 볼 때, 3번 문항이 HINT-8의 신체적 및 정신적 영역을 연계하는 작용을 하는 문항일 가능성이 크다.
본 연구의 구성타당도 검증에 활용된 CFA 분석과정에서, HINT-8에 “행복” 문항이 포함되거나 삭제되어도 측정모형이 적합한 것으로 나타났다. 이는 아마도 행복은 HRQOL 개념과 밀접하지만 상위 개념일 수 있기 때문이다. 한국인에게 행복이란 개인이 사는 사회적 관계망 내에서 생활 범위에 포함된 의식주, 자산, 일, 여가, 교육, 건강, 안전 등에 대해 부여된 의미를 말하는데, 여기서 “의미”는 긍정적 행복인 즐거움, 평안, 만족, 자유 등으로 표현되거나, 부정적 행복(불행)인 우울, 불안, 고통, 디스트레스, 슬픔, 걱정 등으로 나타난다[33]. 즉, 한국인은 행복을 건강보다 광범위한 개념으로 인지하며, 우울은 행복의 부정적 표현 중에 하나라고 생각한다. 이를 대변하듯이 본 연구의 EGA 결과에서도 행복과 우울 문항의 관계가 가장 강하게 나타났으며, CFA 분석에서는 “행복” 문항이 없어도 측정모형 적합도가 만족하였다. 즉, 우울은 행복의 하위 속성이므로 행복과 밀접한 관련성을 가지고 있지만, 건강이라는 제한된 틀에서 보면 이미 “우울”이라는 하위 속성이 존재하므로 건강이라는 테두리 밖의 광범위한 상위 개념인 “행복”에 관한 문항이 있던 또는 없던 간에 상관없음을 실증적으로 나타낸 것이라고 할 수 있다. 따라서 향후 HINT-8이 측정하고자 하는 것이 정확히 무엇인지에 대한 개념적 정의를 분명히 해서, 이 도구가 측정하는 개념의 범위가 건강 및 HRQOL의 범위를 넘은 행복과 같은 광범위한 개념까지도 포함하는지를 규명할 필요가 있다. 실무적 측면에서 볼 때는 가능하면 문항의 수가 적은 측정도구의 사용 가능성이 크다. 따라서 “행복” 문항을 삭제한 7문항만으로도 HRQOL을 측정하기에 충분한지 연구해 볼 필요가 있다.
내적일관성이란 문항 간의 상호관련성 정도를 의미한다[34]. 내적일관성은 구성타당도에 의해 차원(dimension or subscale)이 결정된 후에, 각 차원에 대해서 내적일관성을 검증해야 한다[35]. HINT-8는 단일차원이므로 나타났기 때문에 8문항 전체에 대한 내적일관성을 ω로 평가한 결과 만족하는 것으로 나타났다.
측정동일성은 구성개념(모델 형태, 요인계수, 문항 절편, 문항의 오차분산)이 집단에 걸쳐서 같은지를 보기 위한 것이다[34]. 따라서 측정동일성이 만족하지 않았다는 것은 문항들이 각 집단에서 다르게 작용한다는 것을 의미한다. 본 연구에 포함된 인구 사회학적 변수인 성별, 나이, 교육 및 결혼상태 집단에 따른 HINT-8의 측정동일성 결과, 모두 매트릭동일성 단계까지만 만족했다. 즉, 각 문항이 잠재변수인 HRQOL에 기여한 정도가 집단별로 유사했다. 하지만 스칼라동일성이 만족하지 못했기 때문에, 성별, 나이, 교육, 결혼상태의 집단 간에 잠재변수인 HINT-8 점수를 비교하는 것은 무의미하다. 이는 마치 사과를 오렌지에 비교하는 것과 같다. 기존에 수행된 연구를 살펴보면, 집합타당도(known-groups validity)를 검증하기 위해서 성별, 나이, 교육, 결혼상태 집단에 따라 HINT-8 점수(지수)를 비교하였다[7, 12, 14]. 이처럼 스칼라동일성이 만족치 않음에도 불구하고 그룹 간 평균을 비교한 연구결과는 측정 바이어스로 인해 신뢰하기 어렵다.
암 유병 집단과 관련해서는 HINT-8의 스칼라동질성이 만족하였기 때문에, 향후 암 유무에 따른 HINT-8 평균 비교가 가능하다. 반면, 고혈압, 당뇨병 및 우울증 유병 집단에 따른 HINT-8의 측정동일성 검증 결과, 3~4개 문항의 절편을 자유롭게 했을 때 부분 스칼라동일성이 만족했다. 따라서 유병 집단에 따른 HINT-8 평균 비교는 가능하지만, 제약을 가하지 않은 문항에 대한 해석에 주의가 필요하다. 이런 문항들 중에서 공통으로 나타난 문항이 “일하기”이다. HINT-8 개발 초기 전문가 자문을 통해서, “일하기” 문항은 HRQOL의 사회적 영역의 속성으로 분류되었다. 자문 후 시행된 EFA 결과를 보면, “일하기” 문항은 신체적 및 사회적 영역 모두에 유의미하게 교차 적재되었었다[7]. 이는 응답자 시각에서는 “일하기”를 신체/사회적 영역 모두와 관련 있다고 생각한다는 것이다. 이런 개발자와 응답자 입장의 차이는 문항이 전달하는 뜻이 모호해서 기인됐을 가능성이 있다. 개발자의 의도대로 “일하기” 문항이 사회적 영역에만 해당한 것이라면, 부연 설명을 추가해서 의미전달을 명확하게 할 필요가 있다. EQ-5D의 유사문항 “usual activities (e.g. work, study, housework, family or leisure activities)”를 보면, 일상활동에 관한 사례를 제시해서 전달하는 의미의 혼동을 방지하고 있다. 이처럼 HINT-8의 “일하기” 단어의 의미를 구체화할 필요가 있다.
본 연구의 장점은 한국형 삶의 질 측정도구인 HINT-8의 심리계량적 내적구조에 대한 평가가 처음이었다는 것이다. 두 번째 장점은 사용된 분석방법이다. 측정도구를 구성한 차원의 수를 탐색할 때 전통적으로 EFA를 많이 사용하는데, 본 연구에서는 최근 시뮬레이션을 통해 EFA보다 더 민감한 방법이라고 확인된 EGA를 사용하였다[21]. 내적일관성 검증방법으로 가장 자주 사용되는 것은 Cronbach’s alpha이지만 이 방법은 tau equivalence(모든 문항에 걸쳐서 요인 부하량이 같다는 것) 가정을 위배한다는 단점을 가지고 있다[15]. 본 연구에서는 이러한 가정의 적용이 필요하지 않은 ω를 사용하였다.
단점으로는 이차자료를 사용한 연구였기 때문에 HINT-8의 구성타당도, 내적일관성 및 측정동일성 이외의 다른 심리계량적 속성에 대해 검증을 하지 못했다. 따라서 향후 전향적 연구를 통해서 다른 속성들에 대해 검증해 볼 것을 권한다. 또한, 만성질환 유병 집단에 따른 측정동일성 검증에서는 통계분석에 요구되는 표본 크기를 만족했던 일부 만성질환만을 포함하였다. 표본 크기가 충분하다면, 향후 천식, 뇌졸중 및 신장질환 같은 다른 유병 집단에 따른 측정동일성도 분석해볼 것을 제안한다.
국민건강영양조사 자료를 이용해서 한국형 삶의 질을 측정하기 위해 개발된 HINT-8의 심리계량적 내적구조인 구성타당도, 내적일관성 및 측정동일성을 검증하였다. HINT-8은 문항 모두가 하나의 잠재변수에 속하는 단일차원으로 나타났으며, 내적일관성이 만족하였기 때문에 앞으로 HINT-8 총점을 사용할 수 있다. 측정동일성 검증에서는 인구사회학적 집단에 따라 HINT-8의 의미가 같지 않은 것으로 나타났다. 하지만 고혈압, 당뇨병, 우울증, 암 유병 집단에 따라서는 (부분)스칼라동일성이 만족했기 때문에 실무나 연구에서 집단 간에 HINT-8 평균 비교가 가능하다. HINT-8 측정의 정확성을 높이기 위해 일부 문항(행복, 기운, 및 일하기)에 대한 개념적 의미 확인 및 내용에 관한 탐색적 연구가 보강되어야 할 필요가 있다.
CONFLICTS OF INTEREST:The author declared no conflict of interest.
AUTHOR CONTRIBUTIONS:
Conceptualization or/and Methodology: Lee EH.
Data curation or/and Analysis: Lee EH.
Funding acquisition: None.
Investigation: None.
Project administration or/and Supervision: Lee EH.
Resources or/and Software: Lee EH.
Validation: Lee EH.
Visualization: Lee EH.
Writing original draft or/and Review & editing: Lee EH.
None.
Data are available in the public repository as described below: Korea National Health & Nutrition Examination Survey data (KNHANES; kdca.go.kr).