Project »SNS사용자간다차원상호관계분석
SNS 사용자간 다차원 상호관계분석 ¶
- (이경민, 남궁현, 김웅희, 이강용, 김홍기, 2010)
- 한국 인터넷 정보학회 12권 2호
- keyword: social network service, web, twitter, social network analysis
짧은 생각이지만 내용에 비해 다소 많은 저자가 이 논문에 참여했다는 생각을 하게되었다. 저자중에는 아주대 학사 출신이 있어 반갑기도 했다. 사설은 접어두고, '사용자의 SNS 활동들로부터 다차원 상호관계로 사용자간 상호영향을 도출'하는 것이 이 연구의 요지이다.
이 글을 읽으며 가장 먼저 떠오른 질문은 '다차원 상호관계가 무엇을 말하는가?'였다. 찬찬히 읽어보면 이 연구에서 말하는 다차원 상호관계란 '친밀도 + 트윗에 사용한 용어의 유사도 + 팔로잉 맺은 사람들의 유사도'라는 것을 알 수 있다. 첫번째 차원인 친밀도는 주고받은 멘션과 리트윗 빈도를 지수화한 것이다. 지수에는 최근 주고받은 글일 수록 큰 값이 나타나도록 '시간' 요소를 반영하였고, 글이 누구에게서 누구에게로 향하는지 알 수 있도록 방향성을 갖게 하였다. 두번째 차원으로 각 사용자가 트윗에서 사용한 명사를 기준으로 얼마나 공통적인 단어를 갖고 있는지를 알려주는 유사도를 계산하였다. 마지막 세번째 차원은 관계 구조 유사도로 각 팔로잉 관계 중 어떤 사람을 공통적으로 갖고 있는지와 갖고 있지 않은가를 구하였다.
이 세 차원을 모두 더한 값, 즉 다차원 상호관계 값을 가지고 프로파일을 구축한다는 것이 이 연구의 또 다른 아이디어이다. 각 차원의 값은 0~1의 범위를 갖기 때문에 다차원 상호관계는 0~3의 값을 갖게 된다. 이 부분에 생긴 한가지 의문은 다차원 상호관계의 값이 3에 가깝거나 0에 가까우면 세 값이 모두 크거나 작기때문에 특징적인 모습이 나타날 것 같지만, 1.5와 같이 중간치 값들은 세 차원의 값이 꼭 0.5씩 나눠갖지 않기 때문에 해석하기 어려움이 있지 않을까 하는 점이다. 예를들어 친밀도, 용어유사도, 관계유사도 이 세차원이 순서대로 0.7, 0.7, 0.1인 경우와 0.1, 0.7, 0.7인 경우는 다차원 상호관계 값이 1.5로 같지만 그 속성은 같다고 볼 수 있을까?
마지막으로 앞서 설명한 '다차원 상호관계'로 실험을 진행하였다. 트위터 연구에서 모집단을 구성하는 일로 필자도 고민을 많이 했었기에 어떻게 실험 집단을 선별했는지 관심있게 보았다. 이 실험에서는 먼저 사용자 17명을 무작위로 선정하여 각 사용자의 2단계 팔로잉 관계에 있는 사용자 정보를 수집하였다. 다시말하면 친구의 친구까지의 관계를 모은 것이다. 이렇게 수집된 사용자 중에서 약 3달간 트윗을 많이 쓴 상위 천 명을 추려 관련 데이터를 모았다. 무엇이 모집단을 만드는 올바른 방법인지는 잘 모르겠지만, 다룰 수 있는 범위에서 연구를 진행하는 것이 중요하다는 점을 다시금 기억하게 된다. 실험결과는 뚜렷하게 의미있는 정보를 발견한 것 같지는 않다. 저자는 다차원 상호관계 값과 그 하위 세 개념을 이용해 직업군, 성별, 연령을 중심으로 비교해 봤지만 흥미로운 점은 없었다.
- 참고할 내용
- SNS안에서 친밀도에 영향을 주는 12개의 요소에 관한 참고문헌 => Yuan-yuan Yang, Su-fen Dong, Gui-fa Teng, Wei Yao, 'Research of Nodes Intimacy in SNS Networks', http://ieeexplore,.ieee.org, 2010
- 한 사용자 중심으로 형성된 사용자들의 관계분석 및 친밀도 정의 => 오정운, 윤성웅, 이상훈, Social Networks 사용자간 친밀도 산정, '08 한국컴퓨터종합 학술대회논문집, Vol35, No1(C), 2008