반응형

8월의 마지막날 넉두에서 썼던 내용중에서 빅데이타와 인공 지능에 대한 글을 적어 봅니다. 


우선 트위터의 데이타를 수집하고 있습니다.


Java로 트위트 개발 사의 Stream API를 이용해서 수집하고 있습니다.


관심있는 주제가 포함되어 있을 때만 수집하도록 하고 있습니다.


9월 4일 부터 시작 했습니다.


구글에서 저렴한 VPS로 검색을 했을 때 나온 글들을 이용하여. VPS 구매했습니다.


저는 이 글을 http://dicer.tistory.com/235 을 참조했습니다. ^^;


지금은 1달라가 아니고 조금 더 됩니다. 1년에 15달라 입니다. 하지만, 10%할인 쿠폰을 이용해서 13.5 달라에 구매 하였습니다. 거의 1달라입니다. ^^;; 영어를 모르시면,  위글을 참조하시고, 영어가 조금 되시면, ^^;;


 

high performance ssd vps

위 배너를 누르셔서 RamNode에 가입 하시면 됩니다. 현재는 SSD10 이라는 코드를 넣으시면 10%가 할인이 됩니다.

저는 두대를 사용하고 있고, 다음달에 또한대를 더 구매할 생각입니다. ^^;;

한대는 15달라짜리 서비스를 사용하고 있구요.

한대는 월 5달라짜리를 사용하고 있습니다. 

데이타 베이스 서버로 사용하려고, 50GB 짜리를 구매했습니다.


그리고, yum을 이용해서 mysql과 apache php를 설치 했습니다.


마찬가지로 yum을 이용해서 jdk를 설치 했습니다.


5달라 자리 서버에 설치한 내용입니다.


1달라 짜리 서버에는 jdk만 yum으로 설치하고, 


기존에 만들어 둔 트위터 수집기를 업로드 했습니다 ^^;


그리고, 5달라짜리 서버에 mysql 스키마를 만들고,


수집을 시작 했습니다.


이게 첫날에 작업한 내용입니다. ^^;;


둘째 날에는 15달라 짜리 서버에다가 제가 만들어 둔 트위터 분석기를 깔았습니다.


데이터베이스에 있는 특정 글자를 읽어서 카운터를 구하는 프로그램 입니다. ^^;;


지금 현재까지 트위터 분석기와 수집기가 작업한 내용은 


트위터 분석 : 582,322/613,782


약 60만 여건의 트윗을 수집했고, 약 58만건을 제가 원하는 내용으로 분석을 했습니다.


분석 내용은 다음에 기회가 있으면 말씀 드리겠습니다.


다음 글에서는 인공지능을 위한 글을 포스팅 하겠습니다.



넉두리 ^^;;


뭔가 시작하니깐 다시 글이 써지는군요.


슬럼프를 국복하려면, 뭔가를 질러야 하나 봅니다. ^^;;




반응형

+ Recent posts