본문 바로가기

투자를 위한 코딩10

R에서 중국 주식 수익률&상관관계 구하기 library(quantmod) library(stringr) library(readr) library(xts) library(magrittr) library(PerformanceAnalytics) library(ggplot2) library(dplyr) # 상해380 증권 test_1 2021. 1. 18.
R로 중국 주식 티커 데이터 가져오기 본 포스트는 중국주식 종목티커과 종목명을 크롤링하는 코드를 소개하는 글이다. 밑의 그림에서 볼 수 있듯이, 빨간색 박스 아래 부분들을 간단히 크롤링할 것이다.각각 종목티커(股票代码)와 종목명(股票名称)에 해당하며,크롤링한 주식들은 션전성분지수500(深成500)의 주식들이다. library(rvest) library(htmltab) library(stringr) library(readr) library(httr) library(dplyr) Sys.setlocale("LC_ALL", "English") # 상해 380 : bk_4506 # 션강통 : bk_4583 # 후강통 : bk_4584 # 션전 성분지수 500 url % html_node(.,xpath = "//*[@id='BIZ_MS_board_ca.. 2021. 1. 18.
R로 네이버 주식 데이터 크롤링 얼마전에 어도비 플래시가 사라지면서, 네이버 증권의 차트도 형식이 바뀌었다. 그래서 종전의 방법으로 네이버 차트의 주가를 가져오는건 무리일듯 싶어서, 오늘 부랴부랴 만들어봤다. 참고로 네이버 증권사이트의 "시세"를 보면 하단에 일별 시세가 나오는데 이는 수정주가가 아니므로 분석할 때 오류가 있을 수 있다. 그래서 본인은 수정주가인 차트란의 일별 시세를 사용한다. library(stringr) library(xts) library(httr) library(rvest) library(readr) library(timetk) library(lubridate) KOR_ticker 2021. 1. 11.
R로 중국 주식 크롤링 & 저변동성 분석 한국이나 미국 주식을 인터넷 사이트에서 볼려면 네이버나 야후 파이낸스를 들어간다. 하지만 중국은 그런 서비스를 제공해주는 사이트가 매우 많다. 예를 들면 同花顺,东方财富网,新浪财经 이 3군데가 가장 유명하다.바이두에 주식 티커를 검색하면 이 3개 사이트들을 기반으로 해당 정보를 제공해준다. 근데 문제는 중국 주식시장이 워낙 복잡하다보니, 사이트에서 원하는 정보를 찾기도 그렇게 쉽진않다. 한마디로 정보가 너무 많아서 원하는 것을 바로바로 찾기가 상대적으로 어렵다고 느껴진다. 디자인이 깔끔하지 않은 것도 한 몫한다. 그래서 그런지 몰라도, 크롤링 난이도도 뒤따라 상승하는 듯 하다. 물론, 사용하는 언어가 R이라서 그런 것일 수도 있다.크롤링 툴/정보/포스트를 기준으로 보면 R보다 Python이 크롤링에 적합.. 2020. 12. 31.