[빅데이터] 국내 정보 업로드, 월요일 가장 많고 토요일 최소…정보 건수 '트위터' 최다

빅데이터뉴스, 커뮤니티 SNS 뉴스 공공조직 등 12개 채널 대상 9월1~17일 빅데이터 분석

장순영 기자

2019-09-18 12:14:11

[빅데이터뉴스 장순영 기자]
대한민국 주요 채널에 오르는 정보량은 얼마나 될까. 또 어느 요일에 가장 많이 오르고 어느 채널에 가장 많이 업로드될까.

이같은 의문을 풀기위해 빅데이터뉴스가 국민들이 많이 이용하는 전체 채널을 대상으로 빅데이터 자료를 분석한 결과 1주일중 월요일에 가장 많은 정보가 업로드되고 채널별로는 트위터가 가장 많은 정보가 오르는 것으로 드러났다.

18일 빅데이터뉴스가 국내 전체 언론사 뉴스 사이트와 커뮤니티, 카페, 블로그, 트위터, 인스타그램, 유튜브(영상 제외), 페이스북, 카카오스토리, 지식인 및 주요 기업·단체와 정부·공공기관 사이트 등 12개 채널을 대상으로 분석한 결과 지난 1일부터 17일까지 17일간 총 6,432만4,452건이 업로드된 것으로 나타났다.

참고로 빅데이터는 '파이썬'과 'R프로그램', '자바스크립트' 등의 코딩 프로그램과 MYSQL, MariaDB 등의 프로그램을 이용해 자료를 수집한 후 엑셀과 통계학적인 접근으로 자료를 분석하는 과정을 거쳐 의미있는 정보가 산출된다.

빅데이터는 기본적으로 도메인 주소만 알면 수집 가능하며 락이 걸려있지 않는한 심지어 첨부파일 형식으로 게재된 정보(예컨대 금융감독원 공시사이트 실적자료)도 긁어올수 있어 전체 빅데이터를 수집하는 것도 어렵지 않다.

대한민국 전체 업로드 데이터량. 지난 9월1일부터 17일까지 17일간 뉴스 SNS 커뮤니티 카페 블로그 단체사이트 등에 총 6,432만,4,452건이 게재된 것으로 조사됐다.
대한민국 전체 업로드 데이터량. 지난 9월1일부터 17일까지 17일간 뉴스 SNS 커뮤니티 카페 블로그 단체사이트 등에 총 6,432만,4,452건이 게재된 것으로 조사됐다.

우선, 유형별로 채널별 정보량이 가장 많은 곳은 트위터였다.

트위터에 17일간 게재된 정보량은 총 3,521만여건으로 전체 54.7%에 달했다. 리트윗된 정보는 제외했기 때문에 리트윗 데이터까지 합치면 이보다 더 늘어날 것으로 보인다.

정보량 2위를 차지한 채널은 디시인사이드 뽐뿌 팍스넷등 커뮤니티 사이트로 806만여건이 게재됐으며 인스타그램이 695만여건으로 3위를 차지했다.

채널별 데이터 업로드량. 리트윗을 제외했음에도 불구하고 트위터가 54.7%로 압도적으로 많다.
채널별 데이터 업로드량. 리트윗을 제외했음에도 불구하고 트위터가 54.7%로 압도적으로 많다.

이밖에 카페 460만여건(7.2%), 블로그 446만여건(6.9%), 뉴스 288만여건(4.5%), 지식인 96만여건(1.5%), 유튜브(댓글과 제목만 검색하며 영상은 제외) 43만여건(0.7%), 페이스북 24만1,927건(0.4%), 기업단체 241,563건(0.4%), 정부공공기관 17만여건(0.3%), 카카오스토리 7만3,470건(0.1%) 순이었다.

요일별로는 월요일에 가장 많은 정보량이 올라왔으며 그 다음으론 일요일이었고 9월중 가장 정보량이 적은 요일은 추석 연휴 이틀을 제외하고는 토요일이었다.

먼저 9월1일부터 17일 사이 가장 많은 정보량이 오른 날은 월요일인 16일로 총 404만5,263건이 업로드됐다.

다음으로 역시 월요일인 지난 9일 403만1,677건이었으며 3위는 역시 월요일인 지난 2일 400만2,175건이었다.

월요일에 가장 많은 정보가 오르고 토요일에 가장 적은 정보가 업로드되는 것으로 나타났다(추석 연휴 제외).
월요일에 가장 많은 정보가 오르고 토요일에 가장 적은 정보가 업로드되는 것으로 나타났다(추석 연휴 제외).

4위는 일요일인 지난 1일로 총 393만4,533건이 게재됐으며 5위 역시 일요일인 지난 15일로 388만1,994건이 올라왔다.

6위도 일요일로 지난 8일 387만5,278건이었다.

최소 게재는 추석 당일인 13일로 343만4,308건이었으며 12일 343만6,036건으로 근소한 차이로 뒤를 이었다.

추석 연휴를 제외하고는 요일중에서는 토요일 정보량이 가장 적었다.

지난 14일 토요일엔 349만4,945건이 업로드됐으며 그 다음으로 지난 7일 토요일에 366만7,223건을 기록했다.

전체 게시글중 부정적인 느낌의 글이 긍정적인 느낌의 글보다 50%이상 많은 가운데 중립적인 글이 4건중 3꼴인 것으로 드러났다.
전체 게시글중 부정적인 느낌의 글이 긍정적인 느낌의 글보다 50%이상 많은 가운데 중립적인 글이 4건중 3꼴인 것으로 드러났다.

한편 전체 키워드중 긍정적인 성향의 글은 10명중 1명꼴인 9.8%에 그친데 비해 15.3%의 글은 부정적인 글이었다. 즉 부정적인 글이 긍정적인 글보다 50%이상 많은 셈이다. 가치 중립적인 글은 74.8% 였다.

전체 글중 가장 많이 오른 키워드는 '생각'이란 단어였으며 '못한다' '가격' '정보' '사랑' 등이 많이 올라 상당수 사람들이 자신에 대해 불만족하거나 경제 상황에 따른 가격고민, 남녀간 이성문제등에 여러 생각과 고민을 하고 있는 것으로 추론된다.

톱30 연관 키워드
톱30 연관 키워드

실제로 '못한다'란 키워드가 포함된 글이 56만8,408건으로 1위를 차지했으며 '모르다' 39만511건, '좋아하다' 33만4,674건, '문제' 31만5,212건 등이었다.

한편 최근 급상승중인 키워드는 '아빠' '바다' '아이돌' '동생' 등이었다.

아빠 키워드가 급상승한 요인은 드라마 영향인 것으로 보인다.

9월 키워드 톱10
9월 키워드 톱10

9월 급상승 키워드 톱10
9월 급상승 키워드 톱10


장순영 빅데이터뉴스 기자 news@thebigdata.co.kr
<저작권자 © 빅데이터뉴스, 무단 전재 및 재배포 금지>