== 스케줄 ==
|||||| '''연구일정''' ||
||<|4>6월||2주||연구계획서 정리, 데이터 수집준비||
||3주||화이트리스팅 신청,데이터 수집 계획 검토, 프로그램 코딩||
||4주||프로그램 코딩||
||5주||데이터 수집 준비 완료, 화이트리스팅 등록||
||<|5>7월||1주||데이터 수집 시작, weilbull 분석 준비 ||
||2주||데이터 수집, weilbull 분석 준비 ||
||3주||데이터 수집, weilbull 분석 준비 완료 ||
||4주||데이터 수집 완료, weilbull 분석 준비 완료 ||
||5주||weilbull 분석을 통한 메시지 패턴 구하기 ||
== 연구 주제 ==
'''연구 주제''':: '뉴미디어 환경에서의 메시지 확산에 대한 탐구: 트위터 사례분석을 통한 마이크로블로그를 중심으로'
'''연구 주제''':: '뉴미디어 환경에서의 메시지 확산에 대한 탐구: 트위터 사례분석을 통한 마이크로블로그를 중심으로'
(쉽게말해 트위터에서 메시지가 어떻게 전파되는지 보고싶다!!)

-. 마이크로블로그에서 특정 주제에 관한 확산의 패턴과 특징에 관한 탐구
* Weibull distribustion에 따른 메시지 분류해 보고 그 특징과 의미를 찾아본다
* 기존의 확산연구와의 비교를 통해 마이크로블로그가 메시지 확산에 갖는 의미
* 마이크로블로그에서 특정 주제에 관한 확산의 패턴과 특징에 관한 탐구
a. Weibull distribustion에 따른 메시지 분류해 보고 그 특징과 의미를 찾아본다
a. 기존의 확산연구와의 비교를 통해 마이크로블로그가 메시지 확산에 갖는 의미
||||[ Weibull Distribustion]||
|| <그림1>람다값의 변화|| <그림2>누적그래프||
@@ -22,6 +33,9 @@
1. __장비 준비__
a. 석혜정 교수님 렌더링 컴퓨터 20대 사용 허락
a. 컴퓨터 운영체제 및 IP 확인하기
a. (PHP, APAHCE, Mysql) or (JAVA, Eclipse, Oracle)
a. [ Twitter Libraries]
a. TwitterLibraries
1. __API Documents__
a. [ Api Overview]
a. [ Wiki]
@@ -29,6 +43,7 @@
1. __White Listing 신청__
a. [ White Listing이란?]
a. [ 신청양식]
a. form attachment:whitelisting.png
1. __데이터 수집 사례__
a. [ 카이스트 연구1]
'''41.7 million user accounts''':: In order to collect user profiles, we began with Perez Hilton who has over one million followers and crawled breadth-first along the direction of follwers and followings. Twitter rate-limits 20,000 requests per hour per whitelisted IP. Using 20 machines with different IPs and self-requlating collection rate at 10,000 requests per hour. To crawl users not connected to the Giant Connected Component of the Twitter network, we additionally collected profiles of theose who refer to trending topics in their tweets from June to August. The final tally of user profiles we collected is 41.7 million.
@@ -42,10 +57,10 @@
1. __Some service?__
a. [ Streaming API]
==== 데이터 수집 순서 ====
1. 전체 사용자 기본 데이터 수집
2. 지역(미국,한국)에 따른 사용자 추출
3. 일정 기간 동안 한번도 글을 쓰지 않은 사용자 제거
4. 사용자 특성(팔로잉,팔로워)에 따른 사용자 집단 세분화
1. 전체 사용자 기본 데이터 수집=> Numeric ID
2. 지역(미국,한국)에 따른 사용자 추출 => Time_zone
3. 일정 기간 동안 한번도 글을 쓰지 않은 사용자 제거 => UserTimeLine Statuses
4. 사용자 특성(팔로잉,팔로워)에 따른 사용자 집단 세분화 => the number of Following and Follower,the daversity of Media Use

===== 사용자 수집 =====
@@ -114,23 +129,32 @@
- count. Optional. Specifies the number of retweets to retrieve. May not be greater than 100.
o Example:

a. 문제: 현재 retweets api를 이용해서는 최근 100개의 retweet만을 얻을 수 있다.
- [ 개발자포럼]
- [ REST-API-Changelog]
- [ RT이슈들]
- [ 트윗통계]
- => [ 차선책???] => ex.
- 차선책 tweet단위로 접근(문제는 수집하는 시간이 너무 길어진다는 것,시간이 길어지면 팔로잉,팔로워 수가 수집시점과 전파시점에 차이가 생길 수 있다는 것) => ex.
- attachment:RT.png
a. 대상:
- (데이터 수집일을 기준으로)수집 대상인 사용자들의 최근 한달동안 포스팅된 모든 글: 이때 리트윗한 글은 수집되지 않는다.
- 순수하게 포스팅된 글을 기준으로 리트윗한 글들을 찾아 포함시킨다.

a. 데이터베이스로 정리(msql)
|'''DB Table'''||||||||||||||| '''Tweet''' ||
|'''DB Table'''||||||||||||||| '''(A)Tweet''' ||
||Tweet ID||Created at||Media||User ID||Num_RT||Length_RT_Depth||Text||pattern||
|| || || || || || || || ||
|| || || || || || || || ||

|'''DB Table'''||||||||||| '''Re-Tweet''' ||
|'''DB Table'''||||||||||| '''(B)Re-Tweet''' ||
||Tweet ID||Created at||Media||User ID||From_Tweet ID||Current_RT_Depth||
|| || || || || || ||
|| || || || || || ||

|'''DB Table'''||||||||||||||||||| '''Tweets''' ||
||Tweet ID||Created at||Media||User ID||From_Tweet ID||From_User ID||Num_RT||Length_RT_Depth||Text||pattern||
|'''DB Table'''||||||||||||||||||| '''(A+B)Tweets''' ||
||Tweet ID||Created at||Media||User ID||From_Tweet ID||From_User ID||From_Source_Tweet ID||Text||Num_RT||pattern||
|| || || || || || || || || || ||
|| || || || || || || || || || ||

@@ -149,4 +173,50 @@
- '''id''':1478555574
- '''source''': twitter
- '''created_at''':Wed, 08 Apr 2009 19:22:10 +0000
===== Temp =====
a. Twitted message first (with trend)
a. Users with the messages
a. Trace their social networks
>> One of the biggest mistake companies and brands make about Twitter is that they think it is one more "shout channel" like TV and Radio and Magazine ads or Press Releases. Twitter is not that. Twitter is a "conversation channel", a place where you can find the audience relevant to you (and your company and products and services and jihad) and engage in a conversation with them. It is not pitching, it is enriching the value of the ecosystem by participating. from [ Social Media Analytics: Twitter: Quantitative & Qualitative Metrics ToughTwitter is amongst new media channels that are ]
== 참고문헌 ==
[ All about retweets]
[ How retweets spread]
[ Social Media Analytics: Twitter: Quantitative & Qualitative Metrics]
[[ISBN(0470529393)]] [[ISBN(0470562315)]]
[ Klout score], explanation
== 참고자료 ==
__Weibull distribution__
* [ frequently-asked-questions]
* [ 트위터API]
* | TweetStats;Trends관련 서비스
* |
* | Trendistic만든 곳의 홈페이지
* |
* | The 2009 Philippines Flood and Twitter:Trendistic데이터사용
* | Twitter Data 관련: Archivist 소개
* | Archivist 홈페이지 및 설치
* | Dipity소개@mashable
* |
* | 트위터 블로그
* | 트위터 Search 소개
* | 트위터 Search API
* | Twitter JAVA API
* | Twitter JAVA API 문서
== API USE ==

