[심층-도시계획 진단] 26. 소셜빅데이터 기반 수요자 인식에 따른 섬 관광 향유형태 유형화 및 특성 분석
토픽별 네트워크 분석을 통한 섬 향유 형태 파악... 특정 소셜미디어 플랫폼과 텍스트 기반 분석에만 의존해 한계
배웅규 전문위원
2025-08-16
최근 들어 섬이 제공하는 다원적 가치와 독특한 매력에 대한 관심이 높아지면서 섬에 대한 국민 인식이 변화하고 있다. 과거에는 섬이 고립된 지역이라는 인식이 강했으나 환경적⋅문화적 다양성에 대한 관심과 여가 활동의 수요가 커지면서 섬이 새로운 경험을 제공하는 관광지로 주목을 받고 있다.

이와 같이 섬은 현대 사회의 변화된 여가 트렌드와 맞물려 국민에게 문화적, 생태적 가치가 결합된 공간으로 재조명되고 있음에 따라 섬이 제공할 수 있는 기능과 역할이 더욱 부각되고 있다.

이에 따라 국민의 인식 변화와 수요 증가에 발맞춘 수요자 중심의 접근이 필요하며 관광객의 경험과 요구를 반영한 정책적 기반을 마련하는 데 필수적이다.

이번 회에는 '소셜빅데이터 기반 수요자 인식에 따른 섬 관광 향유형태 유형화 및 특성 분석'이라는 주제의 논문을 소개하고자 한다.

2024년 12월 한국경관학회, 제16권 제2호에 게재됐다. 이주경 서울대 환경계획연구소 객원연구원, 이성희 경기연구원 초빙연구원, 손용훈 서울대 환경대학원 환경설계학과 교수, 김용진 한국섬진흥원 부연구원이 완성했다.

◇ 소셜빅데이터를 활용해 국내 섬 관광에 대한 수요자 인식과 향유 형태를 유형화 추진

본 연구는 소셜빅데이터를 활용해 국내 섬 관광에 대한 수요자 인식과 향유 형태를 유형화하고 이에 따른 관광 행태 및 특성을 분석함으로써 섬 관광의 활성화와 지속 가능성에 기여할 수 있는 시사점을 제시한다.

특히 수요자 분석을 통해 이용자가 생각하는 각 섬의 특성을 이해함으로써 섬마다 지닌 독특한 자원과 가치를 효과적으로 발굴하고 전문가 중심이 아닌 수요자 인식에 기반한 섬 관광 자원 관리 방안을 마련하는 데 중요한 자료를 제공할 수 있다.

◇ 섬 관광 관련 소셜 빅데이터 수집 및 정제 후 LDA 토픽모델링 기법을 활용한 섬 관광자원 향유 형태 분석

첫째, 본 연구의 공간적 범위는 국내 섬 전체이며 수요자가 방문한 유인섬으로 한정했다. 단, 유인섬의 명칭이 텍스트 분석 과정에서 제외되지 않도록 전처리를 수행했다.

섬 명칭이 형태소로 분리되지 않고 동일한 이름을 지닌 섬 명칭을 처리하기 위해 국내 모든 유인섬 목록을 확인하고 ‘지역명+섬 명칭(ex, 신안군 비금도)’으로 고유어를 지정했다.

둘째, 데이터 수집 범위는 2022년 6월부터 2023년 5월까지 1년간 작성된 블로그 게시글로 설정했다. 이를 위해 파이썬(Python)을 활용한 웹 크롤러(Web Crawler)를 개발하여 데이터를 수집했다.

블로그 게시글 수집을 위해 설정된 검색어는 대중적으로 널리 사용되며, 다양한 섬 관광 활동을 포괄할 수 있는 ‘섬 여행’, ‘섬 캠핑’, ‘섬 백패킹 세 가지 키워드로 선정했다.

반면, ‘섬 관광’ 키워드는 홍보 게시글이 주를 이뤄 실제 섬 이용자의 인식을 분석하는 데 어려움이 있을 것으로 판단되어 제외됐다.

블로그 게시글은 자유로운 형식과 일상적인 어투로 작성된 비정형 데이터이므로 자연어 처리 및 텍스트 전처리 과정을 통해 정형화된 형태로 변환했다. 사용자 정의 사전을 활용해 데이터를 정제했다.

최종적으로 정제된 데이터는 텍스트마이닝에 활용되어 섬 관광수요자의 인식을 구체적으로 분석하는 데 기여했다.

셋째, 섬 관광자원의 향유 형태를 분석하기 위해 LDA(Latent Dirichlet Allocation) 토픽모델링 기법을 적용했다. 이를 통해 블로그 게시글에서 나타난 국내 섬 관광 수요를 분석하고 토픽별 응집성 분석을 통해 다양한 섬 관광의 향유 형태를 심층적으로 고찰했다.

LDA는 비지도 학습의 일환으로 텍스트 문서 집단 내에서 주제(Topic)를 찾아내고 각 문서와 단어를 특정 주제에 할당하는 확률 기반의 알고리즘이다.

이 기법을 통해 전체 문서에서 각 주제가 차지하는 비율과 주제를 구성하는 주요 단어들을 도출할 수 있다. 문서 내용을 쉽게 해석하고 주제와 관련된 유의미한 시사점을 도출할 수 있다.

본 연구에서는 c_v metric을 사용해 일관성 값을 계산했으며 alpha=0.02, beta=0.02 설정에서 14개의 토픽이 가장 높은 일관성 값으로 나타났다.

이에 따라 최종적으로 14개의 토픽을 최종적으로 선정하고 각 토픽에 해당하는 블로그 게시글을 검토해 적절한 주제를 명명했다.

본 연구에서는 응집성 분석으로 Modularity를 사용해 적절한 클러스터 수를 결정하고 각 토픽의 키워드 네트워크 맵을 작성했다.

네트워크 맵은 노드(Node)의 색상과 크기를 토픽 확률값(Topic Probability Value)을 기준으로 설정했다. 링크(Link)의 굵기는 키워드 간의 연결 강도(Weight)에 따라 표현했다.

이러한 시각적 표현을 통해 주요 키워드 간의 연결성과 구조적 패턴을 명확하게 파악할 수 있었다. 이를 바탕으로 각 토픽의 의미를 보다 심층적으로 해석했다.

토픽모델링을 활용한 수요자의 섬 관광자원 향유 형태의 유형화 및 토픽별 네트워크 분석을 통한 섬 향유 형태 파악

도출된 키워드 맵은 <그림 1>에 제시되었으며, 전체 토픽의 주제와 주요 키워드는 <표 1>에 요약돼 있다. 분석 결과, 토픽 특성에 따라 ‘주요 섬 여행지(T1, T9, T10, T11, T13)’, ‘섬과 관련된 활동(T2, T3, T4,T5, T17, T14)’, ‘일반 여행 활동(T6, T8)’의 3가지 유형으로 재분류했다.

▲ <그림 1> 토픽모델링 결과에 대한 키워드 맵


▲ <표 1> 전체 토픽의 형성 및 토픽별 주요 키워드

이 중 ‘섬과 관련된 활동’은 전체 문서의 48%로 가장 높은 비중을 차지했다. 이어서 ‘주요 섬 여행지’는 30%, ‘일반 여행 활동’은 22%의 비율을 점유했다.

토픽에서 나타나는 키워드 간의 상호 관계와 섬 관광 수요의 세부적인 양상을 파악하고자 응집성(Modularity) 분석을 활용해 <그림 2>와 같이 각 토픽을 네트워크 맵으로 시각화했다.

▲ <그림 2> 남해안 주요 섬 여행(T1) 키워드 네트워크 맵

네트워크 분석으로 도출된 토픽 내 세부 그룹들을 <표 2>와 같이 분석함으로써 주요 섬 여행지와 해당 섬에서 이뤄지는 활동을 연계해 해석하고 특정 섬에서 주로 발생하는 행태 및 상호 연계되어 인식되는 섬들을 파악했다.


▲ <표 2> 토픽별 네트워트 분석 결과

최종적으로 토픽을 ‘주요 섬 여행지’, ‘섬과 관련된 활동’, ‘일반 여행 활동’의 3개 유형으로 구분하여 섬 관광 향유 형태를 도출하고 국내 섬 관광의 전반적인 수요적특성을 분석했다.

본 연구에서는 각 토픽의 상위 100개 키워드를 추출해 섬과 관련된 키워드를 확률값 순으로 정리했다. <그림 3>과 같이 주요 섬의 위치를 3D 시각화로 표시했다.


▲ <그림 3> 토픽 확률값에 따른 토픽별 주요 섬 시각화


◇ 관광객들이 선호하는 활동 유형과 특성을 중심으로 관광자원 강화 및 관리 전략 수립

LDA 토픽모델링과 네트워크 분석을 결합하여 섬 관광의 주요 키워드 간 관계와 의미를 구조적으로 파악해 섬 관광 연구에 새로운 분석 틀을 제시했다.

또한 섬 관광객들이 블로그에 표현한 자연스러운 인식과 평가를 분석에 활용함으로써 섬 관광의 질적 측면을 반영했다.

이를 통해 섬 관광자원의 체험적 가치와 수요자의 관심도를 구체적으로 파악할 수 있는 방법론적 기여를 제공한다. 향후 데이터 기반의 섬 관광 연구가 보다 심층적이고 실증적인 방향으로 발전하는 데 기여할 수 있다.

특히 관광객들이 선호하는 활동 유형과 특성을 중심으로 관광자원을 강화하고 관리 전략을 수립할 수 있는 기초자료를 제공한다. 지역별 우선 개선 과제를 설정하는 데 중요한 기준으로 활용될 수 있다.

또한 섬과 본토 간 접근성을 고려한 통합적 관리 방안을 제안해 섬 관광의 지속 가능성을 높이기 위한 섬 지역의 접근성 강화와 항구를 거점으로 한 관광 네트워크 구축의 필요성을 정책적으로 뒷받침할 수 있다.

◇ 특정 소셜미디어 플랫폼과 텍스트 기반 분석에만 의존해 한계

본 연구는 섬 관광 수요와 향유 형태를 파악하는 데 의미 있는 시사점을 제공했으나 특정 소셜미디어 플랫폼과 텍스트 기반 분석에만 의존했다는 점에서 한계가 있다.

또한 LDA 토픽모델링 해석 과정에서 연구자의 주관이 개입될 여지가 있고 토픽 간 관계나 다층적 의미 분석에 한계가 존재한다.

아울러 국내 전체 섬을 대상으로 분석한 결과 특정 섬의 지역성이 충분히 드러나지 않아 각 섬이 가진 고유한 문화와 자원요소를 구체적으로 반영하지 못했다는 한계가 있다.

향후 연구에서는 다양한 소셜미디어 플랫폼의 데이터를 활용하고 지역성을 고려한 심층 분석을 통해 이러한 한계를 보완할 수 있을 것이다.

- 계속 -

▲ 배웅규 전문위원(중앙대 교수)
저작권자 © 엠아이앤뉴스, 무단전재 및 재배포 금지
관련 기사
산업 ·건설 분류 내의 이전기사