본문 바로가기

전체 글13

R로 네이버 주식 데이터 크롤링 얼마전에 어도비 플래시가 사라지면서, 네이버 증권의 차트도 형식이 바뀌었다. 그래서 종전의 방법으로 네이버 차트의 주가를 가져오는건 무리일듯 싶어서, 오늘 부랴부랴 만들어봤다. 참고로 네이버 증권사이트의 "시세"를 보면 하단에 일별 시세가 나오는데 이는 수정주가가 아니므로 분석할 때 오류가 있을 수 있다. 그래서 본인은 수정주가인 차트란의 일별 시세를 사용한다. library(stringr) library(xts) library(httr) library(rvest) library(readr) library(timetk) library(lubridate) KOR_ticker 2021. 1. 11.
R로 중국 주식 크롤링 & 저변동성 분석 한국이나 미국 주식을 인터넷 사이트에서 볼려면 네이버나 야후 파이낸스를 들어간다. 하지만 중국은 그런 서비스를 제공해주는 사이트가 매우 많다. 예를 들면 同花顺,东方财富网,新浪财经 이 3군데가 가장 유명하다.바이두에 주식 티커를 검색하면 이 3개 사이트들을 기반으로 해당 정보를 제공해준다. 근데 문제는 중국 주식시장이 워낙 복잡하다보니, 사이트에서 원하는 정보를 찾기도 그렇게 쉽진않다. 한마디로 정보가 너무 많아서 원하는 것을 바로바로 찾기가 상대적으로 어렵다고 느껴진다. 디자인이 깔끔하지 않은 것도 한 몫한다. 그래서 그런지 몰라도, 크롤링 난이도도 뒤따라 상승하는 듯 하다. 물론, 사용하는 언어가 R이라서 그런 것일 수도 있다.크롤링 툴/정보/포스트를 기준으로 보면 R보다 Python이 크롤링에 적합.. 2020. 12. 31.
Numpy(2) - 기본적인 함수들 앞의 포스트에는 numpy의 데이터 기본적인 생성 및 조작방법을 보았다면, 이번 포스트는 numpy의 대표적인 함수들과 메서드들을 알아볼 차례이다. 1. 데이터의 구조를 알아보는 메서드 : .ndim, .shape, .size, .dtype import numpy as np arr1 = np.array( [1,2,3] ) print(arr1.shape, arr1.dtype,arr1.ndim, arr1.size) ''' shape : (3,) dtype : int32 ndim : 1 size : 3 ''' arr2 = np.array([ [1,2,3], [4,5,6] ]) print(arr2.shape, arr2.dtype, arr2.ndim, arr2.size) ''' shape : (2,3) dtype.. 2020. 12. 15.
R로 주식 데이터 가져오기 & 베타 분석 R은 여러가지 금융 패키지를 제공한다. 오늘은 그 중 quantmod, PerformanceAnalytics 사용에 대해 간단히 알아보고 간략하게 베타 분석을 해볼 것이다. 여기서 베타란, 이현열 퀀트님의 저서 "R을 활용한 퀀트투자 포트폴리오 만들기"에 의하면 '개별 주식이 전체 주식시장의 변동에 반응하는 정도를 숫자로 나타낸 값'을 말한다. 만약 어떤 주식의 베타 값이 1이면, 해당 주식의 수익률 변동폭은 시장의 수익률 변동폭과 동일하다.만약 1을 초과하면 시장 수익률이 1% 상승시 해당 주식은 1%보다 더 상승한다는 뜻이고, 1미만이면 시장 수익률이 1% 상승시 1%보다 덜 상승한다는 뜻이다. 이는 하락시에도 동일한 원리로 적용된다. 오늘은 펀드 중 유명한 미래에셋타이거ETF와 코스피200지수를 거.. 2020. 12. 9.