공유하기

닫기

  • 페이스북
  • 트위터
  • 네이버
    밴드
  • 네이버
    블로그

https://m.yeongnam.com/view.php?key=20150101.010080753400001

영남일보TV

[BIG data 세상 .1] 2014년 인터넷 속 대구 키워드

2015-01-01
[BIG data 세상 .1] 2014년 인터넷 속 대구 키워드
[BIG data 세상 .1] 2014년 인터넷 속 대구 키워드
2014년 분기별 ‘대구’와 연관된 네이버 검색어 빈도 그래프 <자료=더아이엠씨>

바야흐로 빅데이터(Big Data)의 시대다. 빅데이터는 지역별 통계 등 기존의 정형화된 데이터뿐만 아니라, SNS·포털사이트 등에서 실시간으로 생성되는 대용량의 데이터를 뜻한다. 광범위한 이런 데이터들은 그동안 단순 보관만 이뤄진 채 활용 폭이 제한됐다. 하지만 최근에는 정보처리기술의 발달과 정보의 개방에 따라 이를 분석·활용한 가치창출이 이뤄지고 있다. 빅데이터는 각종 분석을 통해 공공기관이나 기업의 생산성과 효율성을 높이는 정책 수립에 활용된다. 서울시는 심야시간 휴대전화 데이터의 위치정보를 활용해 심야버스 노선을 신설했으며, 외식업체들은 카드사들의 매입 현황을 분석해 마케팅 전략으로 활용한다.영남일보 역시 데이터 저널리즘(Data Journalism)의 시대에 발맞추기 위해 올해부터 빅데이터 분석에 나선다. 국내 최초로 빅데이터 솔루션을 개발·운영하고 있는 <주>더아이엠씨(대표 전채남)와 공동으로 사회 현상은 물론 경제·문화 등 지역과 관련된 주제를 중심으로 한 분석 자료를 부정기적으로 제공할 예정이다.

우리 사회에서 포털 사이트의 ‘검색어’는 다양한 의미를 지닌다. 단순히 궁금한 내용을 찾는 것 외에도 실시간 인기 검색어 순위를 통해 현재 누리꾼들의 주요 관심사를 알 수 있기 때문이다. 또 검색 시 함께 제시되는 연관 검색어는 사용자들의 검색 의도 및 사회적 트렌드의 핵심 내용을 파악할 수 있게 해준다. 이처럼 검색어는 현재나 과거의 이슈를 쉽게 분석할 수 있는 도구로 자리매김했다.

그렇다면 지난해 누리꾼들은 지역과 관련된 정보를 검색할 때 어떤 주제에 관심을 기울였을까. 단순 연관검색어 외에도 뉴스나 블로그 등에서 어떤 단어가 대구와 가장 많이 연관돼 쓰였는 지 온라인상 빅데이터 분석을 통해 알아봤다.


지역 자체 이슈 부족
끌고갈 역동성도 떨어져

1월·6월 화재 관련 관심 높고
김부겸 등 지역 정치인 보다
정당 관련 단어 노출 많아

세월·참사 등 전국적 키워드
상대적으로 순위 낮게 나와
지자체 움직임 다소 활발


◆ 지역적 이슈 만들지 못한 대구

[BIG data 세상 .1] 2014년 인터넷 속 대구 키워드

영남일보와 더아이엠씨는 지난해(2014년 1월1일부터 12월20일까지) 포털사이트 ‘네이버’에서 뉴스·블로그·웹·카페 등록글을 대상으로 ‘대구’와 함께 쓰인 단어를 분석했다. 수집데이터량은 총 163만8천341건으로 이 중 뉴스(58만2천121건)가 가장 많았고, 웹 35만4천건, 블로그 35만2천390건, 카페 34만9천830건 순이었다. 데이터 분석도구로는 더아이엠씨가 개발한 TextoM과 UcINET·NodeXL 등이 쓰였다.

조사 결과에서 대구는 지역과 연관된 뚜렷한 이슈를 만들어 내지 못하고 실시간 검색에서 화제가 된 뉴스나 선거 등 전국적인 이슈를 그대로 따라간 경향을 보인 것으로 나타났다.

다만, 가장 많은 데이터를 보유한 뉴스에서 ‘대구’ ‘대구시’ ‘기자’ 등 특별한 의미를 내포하지 않는 단어를 제외하고, 가장 빈도가 높은 단어는 ‘대구시장’<그래픽1> 이었다.

뉴스 분석중 대구와 연관된 인물은 ‘권영진’, 기업은 ‘대구은행’, 스포츠는 ‘대구FC’로 각각 1위를 차지했다.

◆ 화재가 화제

이외에도 지난해 1월 동성로와 6월 범어동 그랜드호텔의 화재 당시 실시간 인기검색어에 올랐던 ‘화재’ ‘대구화재’ 등도 많이 등장한 단어였다.

눈여겨봐야 할 점은 권영진 대구시장이 6.4 지방선거 당선 후에는 뉴스에서 노출이 급격히 줄었다는 점이다. 선거과정에서도 ‘출마’ ‘새누리’ ‘후보’ 등의 단어가 많이 등장했지만, 여당을 제외한 야당 관련 단어는 빈도가 크게 낮아 매달 50위까지 집계된 순위에 단 한번도 나타나지 않았다. 지난 대구시장선거에서 선전했던 김부겸 후보와 새정치민주연합과 관련된 단어도 별로 없었다.

결과적으로 이는 대구가 자체적으로 이슈를 만들고 이를 장기적으로 끌고 갈수 있는 역동성이 떨어진다는 해석을 가능케 한다.

◆ 타 지역과 다른 대구 정서

특이한 점은 지난해 4월 세월호 관련 단어로 ‘세월’과 ‘참사’가 나타나지만, 이 시기에 있었던 대구시의 화재사건보다도 순위가 낮았다는 것. 대구시와 세월호 참사가 큰 연관성이 없어서이기도 하지만, 세월호가 전국적인 이슈가 됐다는 점을 생각해보면 다른 지역 정서와 대구가 다소 거리를 두고 있었다는 추론도 가능하다.

지방선거 이후 지난 7월부터는 ‘개최’와 ‘대구시의회’ ‘협약’ ‘체결’ 등의 단어가 자주 나타나 지방자치단체의 움직임이 활발했던 것으로 추정됐다.

빅데이터 분석을 진행한 조인호 더아이엠씨 데이터사이언스연구소 이사는 “분석 중 가장 눈길을 끌었던 점은 권영진 시장의 뉴스 노출이 7월 부터 급격히 줄었다는 것”이라며 “예를 들어 경기도나 제주도의 경우, 도지사가 선거 후에도 다양한 정책들로 이슈를 만들어 내 꾸준히 시장이 상위 단어에 노출된다. 대구시장 역시 다양한 정책을 언급했겠지만, 결과적으로 이목을 집중시키는 데는 다소 실패했다는 것으로 보인다”고 설명했다.

또한 그는 “선거 후 당선자의 이름이 거의 나오지 않고 새누리당이 자주 언급된 것에 비춰 봤을 때, 결국 대구에서는 인물에 대한 관심보다는 정당이라는 정해진 프레임(Frame)에 따라 선거가 이뤄진 것”이라며 “김부겸 후보도 40%대 유의미한 지지율로 낙선했다고는 하지만 미디어 노출에는 실패한 듯 하다. 즉 김 후보가 사람들의 많은 관심을 받았을 것이란 생각이 착각이었을 수도 있다는 것”이라고 말했다.

정재훈기자 jjhoon@yeongnam.com

기자 이미지

정재훈 기자

서울본부 선임기자 정재훈입니다. 대통령실과 국회 여당을 출입하고 있습니다.
기사 전체보기

영남일보(www.yeongnam.com), 무단전재 및 수집, 재배포금지

경제 인기기사

영남일보TV

부동산

많이 본 뉴스