1. 키워드 분석
본 연구의 자료수집 기간 동안 ‘코로나 + 간호사’, ‘우한 폐렴+간호사’ 키워드로 검색된 뉴스 기사는 총 3,537건으로 캠페인 시행 전, 후 각각 2,301건, 1,236건이었다. 전체 데이터 수집 기간과 캠페인 시행 전, 후 기간에 검색 키워드인 ‘코로나’, ‘우한’, ‘폐렴’, ‘간호사’ 단어를 제외하고 TF-IDF를 기준으로 상위 30개의 키워드 분석 결과는 Table 1과 같다.
Table 1
Top 30 Keywords of News Articles
전체 수집 기간 동안 전처리 과정 이후 추출된 키워드는 22,900개였고, 검색 키워드인 ‘코로나’, ‘우한’, ‘폐렴’, ‘간호사’ 단어를 제외한 상위 30개 키워드는 ‘대구’, ‘확진자’, ‘환자’, ‘확진’, ‘병원’, ‘중국’, ‘의료’, ‘감염’, ‘마스크’, ‘검사’ 등의 순으로 나타났다. 캠페인 시행 전, 후 키워드를 비교해보면, 캠페인 시행 전 상위 키워드로는 ‘대구’, ‘중국’, ‘신천지’, ‘환자’, ‘확진자’, ‘마스크’, ‘병원’, ‘정부’, ‘사람’, ‘검사’ 등, 캠페인 시행 후에는 ‘확진’, ‘병원’, ‘환자’, ‘의료’, ‘감염’, ‘학생’, ‘학교’, ‘방역’, ‘대구’, ‘등교’ 등의 단어가 포함되었다(Table 1).
2. 토픽 모델링
본 연구에서 R program을 이용하여 정량적 방법으로 perplexity 수치를 계산한 결과, 캠페인 시행 전 기간에 토픽 개수 2~16개에 대한 perplexity는 최소 949.915에서 최대 964.595로 나타났다. 같은 방법으로 캠페인 시행 후 기간에 perplexity는 최소 1,154.270에서 최대 1,184.650으로 도출되었다. 본 연구에서는 정량적 수치인 perplexity 결과를 참고하여 전문가 그룹의 논의를 통해 주제의 맥락과 구성의 판별성을 가장 의미 있게 해석 가능한 수준에서 캠페인 시행 전 기간 perplexity 값이 가장 최소인 주제 개수 5개(perplexity=949.915)와 캠페인 시행 후 기간 perplexity 값이 두 번째로 낮았던 주제 개수 4개(perplexity=1,159.883)를 토픽 개수로 선정하였다. 토픽 모델링의 시각화와 해석에 대한 선행연구 결과를 참고하여[30] 선정된 토픽 개수를 R program의 LDAvis package를 이용하여 토픽을 구성하는 키워드들이 주제의 범주를 명확히 나타낸다고 판단된 λ값 0.6을 설정한 다음, 토픽 모델링을 시각화하였다. 시각화한 결과, 토픽 지도에서 토픽 원 간의 거리가 명확히 확보되고 독립적인 것을 확인하였다(Figure 1).
토픽의 비중과 구성된 주요 키워드는 Table 2와 같고, 캠페인 시행 전 기간 주요 토픽으로는 ‘팬데믹’, ‘의료인 감염’, ‘국내감염’, ‘의료자원’, ‘해외 교민 국내 이송’, 캠페인 시행 후 기간에는 ‘팬데믹’, ‘국내감염’, ‘의료자원’, ‘덕분에 챌린지’가 도출되었다. 캠페인 시행 전, 후 변화로 캠페인 시행 전 주요 토픽이었던 ‘의료인 감염’, ‘해외 교민 국내 이송’은 캠페인 시행 이후 주요 토픽에서 사라졌으며, ‘덕분에 챌린지’ 토픽이 새롭게 나타났다.
Table 2
Major Topics of News Articles before and after the Campaign
캠페인 시행 전, 후 변화된 토픽을 살펴보면, 캠페인 시행 이전 기간에 ‘의료인 감염’ 토픽은 두 번째로 높은 비중(20.1%)을 보였으며 주요 키워드는 ‘병원’, ‘확진’, ‘감염’, ‘격리’, ‘폐쇄’, ‘직원’, ‘접촉’, ‘요양’, ‘간호사’ 등이 포함되었고, 가장 낮은 비중(16.4%)을 보인 ‘해외 교민 국내 이송’ 토픽을 구성하는 키워드는 ‘교민’, ‘지원’, ‘시설’, ‘전세기’, ‘귀국’ 등이었다. 캠페인 시행 이후 기간에 새롭게 출현한 ‘덕분에 챌린지’ 토픽의 비중은 17.6%이었고, 주요 키워드는 ‘캠페인’, ‘영웅’, ‘응원’, ‘극복’, ‘감사’, ‘마음’ 등이 나타났다.
동일한 이름으로 명명된 토픽의 비중과 키워드들의 변화를 비교한 결과, 첫째, ‘팬데믹’과 관련된 토픽은 캠페인 시행 전, 후 기간 동안 모두 가장 큰 비중을 차지하고 있고, 주요 키워드는 캠페인 시행 전 ‘중국’, ‘미국’, ‘세계’, ‘이탈리아’, ‘일본’, ‘유럽’ 등으로 COVID-19의 확산 국가명에서, 캠페인 시행 후 주요 키워드는 ‘정부’, ‘사회’, ‘보건’, ‘원격’, ‘경제’, ‘건강’, ‘교육’, ‘협력’ 등으로 차이가 있었다. 둘째, ‘국내감염’ 토픽은 캠페인 시행 이전 19.8%, 이후 28.0%로 각각 3순위, 2순위의 비중을 보여주고 있고, 캠페인 시행 전 주요 키워드는 ‘대구’, ‘신천지’, ‘교회’, ‘경북’, ‘청도’ 등의 단어에서, 캠페인 시행 후 ‘학교’, ‘클럽’, ‘이태원’, ‘서울’, ‘부산’, ‘전파’ 등으로 차이를 보였다. 마지막으로 ‘의료자원’ 토픽은 캠페인 시행 전, 후 기간 비중으로 19.7%, 23.6%로, 캠페인 시행 전 주요 키워드는 ‘간호사’, ‘의사’, ‘인력’, ‘방호복’, ‘부족’, ‘마스크’ 등의 단어가 도출되었으며, 캠페인 시행 후에는 ‘방호복’과 ‘마스크’는 사라지고, ‘진료’, ‘간호’, ‘전담’이 새로운 키워드로 도출되었으며, ‘간호사’, ‘의사’, ‘인력’, ‘부족’ 등의 키워드는 계속적으로 출현하였다.
3. 캠페인 시행 전, 후 주요 토픽의 키워드 네트워크 분석: ‘의료인 감염’, ‘덕분에 챌린지’ 토픽
R program에서 상관계수 0.2 이상을 적용하여 토픽별 키워드 간 동시 출현 관계를 네트워크 맵으로 구현한 결과, 캠페인 시행 후 사라진 ‘의료인 감염’ 토픽에서 ‘병원’, ‘확진’, ‘감염’, ‘격리’, ‘폐쇄’, ‘직원’, ‘접촉’, ‘요양’, ‘간호사’ 등의 키워드는 ‘업무’, ‘밀접’, ‘전면’, ‘조치’, ‘집단’, ‘발생’, ‘의료진’, ‘종사자’, ‘무더기’ 등의 키워드와 상관성이 있었다(Figure 2).
캠페인 시행 이후 새롭게 도출된 ‘덕분에 챌린지’ 토픽은 ‘캠페인’, ‘영웅’, ‘응원’, ‘극복’, ‘감사’, ‘마음’ 등의 키워드로 구성되었으며, ‘간호사’ 키워드가 ‘희생’을 매개로 ‘두려움’, ‘감염’, ‘근무’, ‘격리’, ‘확진’ 등의 키워드와 상관성이 있었다(Figure 3).