본문 바로가기

워드클라우드2

파이썬으로 허접 데이터마이닝 - 블로그 리서치용... 프롤로그 이 글을 쓰기까지 얼마나 긴 길을 돌아왔던가...네이버 본문까지 크롤링하는 법 알려주는 포스팅 발견해서 좋아하다가 블라킹 당하고 ㅜ 이 코드를 찾기까지도 우여곡절이 너무 많았는데...베끼는 주제에 말이 많다고 생각하겠지만 으...나같은 코알못에겐 베끼는 것도 너무 어렵더이다. 그래서 하다하다 안되서 허접코드로 좀이라도 블로그로 인사이트 얻을 때 내 노고를 덜 수 있는 것들로 이만 파이썬 공부를 잠정 중단하기로 했다. -_-; 다른 돌파구를 찾을 때까지... 섹션은 3가지로 나눠봤다. 네이버 API 활용해 키워드 기반으로 블로그 목록 가져오기 (제목, 글주소, 요약, 블로거명, 블로거주소, 게시일) 내 손으로-_-; 추출한 글 주소들을 코드 돌리면 자동으로 익스플로러에 띄우기 내 손으로-_-;;;.. 2020. 3. 10.
R로 아마존 리뷰 크롤링 프롤로그 일단 난 R을 한 10년전에 대학원 때 베이직 코스를 들어 지금은 다 까먹었고, 사실 그때도 완벽하게 이해한 것은 아니라 지금 내 업무에 필요한 부분만 인터넷에서 찾아서 사용하고 있는 상황이다. 그런데 왜이렇게 오류는 많이 나고 패키지는 왜이렇게 많이 깔라고 하는 것인지... 그러다 별 문제 없이 아마존 사이트 크롤링에 워드 클라우드 생성, 심지어 응용해서 워드클라우드 텍스트에 색까지 완벽하게 입힐 수 있는 스크립트를 찾아 이렇게 글을 써본다. 스크립트는 아래 Musings on R 블로그 작가님과 개발자포럼인 stsaxkoverflow.com에서 가져왔다. https://martinctc.github.io/blog/vignette-scraping-amazon-reviews-in-r/ Vigne.. 2020. 3. 3.