본문 바로가기
STEM - 학술세미나/etc

퀀트 투자에 대해 알아보자

by STEMSNU 2022. 12. 30.

 

최근 몇 년 동안 코로나19 및 여러 경제 상황으로 인해 주식 투자가 많은 주목을 받아 왔습니다. 하지만, 미 연준(FED)의 발표나, 전쟁 등 개인의 힘으로는 예측하기 힘든 여러 사건들로 인해 높은 수익을 거두기는 힘들게 됩니다. 이에 따라 사람들은 개인의 불완전한 판단이 아닌, 보다 검증이 되어 있는 투자의 규칙을 찾고자 노력하게 됩니다. 그 일환으로 나오는 개념이 바로 계량적인 수치를 근거로 하는 계량 투자, 즉 퀀트(Quant)입니다.

안녕하세요! 저는 공우 12.5기 화학생물공학부 임정욱이라고 합니다. 오늘은 위와 같은 의도에서 시작되는 퀀트가 무엇인지 간단히 알아보고, 그 근간에 있는 금융 관련 원리와 실제 퀀트에 사용되는 여러 공학적 기술들을 다뤄보려 합니다.

먼저 앞서서 퀀트에 대해 간단히 이야기를 드렸지만, 보다 자세하게 퀀트라는 분야에 어떤 것들이 있는 지를 다뤄보려고 합니다. 흔히 퀀트라고 하면 주가에 따라서 주식을 자동으로 사고 파는 프로그램을 개발하는 모습을 떠올리게 됩니다. 이러한 알고리즘 트레이딩 역시 수치를 기반으로 한 투자인 만큼, 퀀트의 일종이라고 할 수 있습니다. 한편으로는, 이 금융 데이터를 사용해 보다 복잡한 일을 하는 사람들도 있습니다. 아래 공식은 대표적인 금융 파생상품의 하나인 옵션의 가격을 결정하는 블랙-숄즈 방정식입니다.

옵션의 가격을 설명하는 블랙-숄즈 방정식

이 방정식을 얻어내기 위해서는 불규칙한 운동에 대한 원리인 브라운 운동을 응용하는 등 복잡한 수학적 접근이 필요합니다. 이렇게 금융 시장 저변에 깔려 있는 원리와 규칙을 수학적으로 찾아내는 금융수학 역시 흔히 퀀트의 한 분야로 불리게 됩니다.
또 다른 한편으로는 기업과 관련된 여러 정보들을 활용해 투자 포트폴리오를 구성하는 펀드들의 예시를 들 수 있습니다. 이들은 여러 정성적인 자료들을 기반으로 포트폴리오를 만들어서 판매하기도 하지만, 때로는 좋은 성과를 거두기 위해 기업의 가치를 평가해서 나오는 정량적인 지표를 바탕으로 포트폴리오를 구성하기도 합니다. 이렇게 정량적인 지표를 바탕으로 하는 포트폴리오 구성 역시 퀀트라고 이야기할 수 있습니다. 오늘 할 이야기는 이 중에서도 세 번째인 포트폴리오 구성과, 그 속에 숨겨진 금융공학적인 원리 및 공학 기술이 어떻게 포트폴리오 구성에 도움을 주는지에 대한 이야기입니다.

여기서, 제가 뜬금없이 공학적인 원리라는 이야기를 한 이유를 먼저 짚고 넘어가려고 합니다. 앞서 말씀드린 바와 같이 투자자들은 금융시장의 원리를 알아내고자 합니다. 이 원리에 대해 탐구하는 금융공학자들의 접근법을 유체역학을 연구하는 연구자에 빗대어 크게 세 가지로 나눠보려고 합니다. 첫 번째는 마치 유체의 전산모사 시뮬레이션과 같이 금융시장의 주가 데이터를 바탕으로 시뮬레이션하려는 시도입니다. 앞서 말씀드린 알고리즘 트레이딩이 비슷한 느낌이라고 이야기할 수 있습니다. 이런 연구들은 특히 컴퓨터공학에서 많이 이뤄지는데요, 시간에 따른 주식 데이터에 대해 딥러닝 등 여러 방법을 적용하여 그 속의 규칙을 파악하는 알고리즘의 개발에 중심을 두게 됩니다.

혈액 흐름에 대한 유체 전산 모사 그래픽, Atif Masood (FetchCFD), CC BY 4.0 <https://creativecommons.org/licenses/by/4.0>, via Wikimedia Commons

둘째로는 아래에 있는 나비에 스토크스 방정식과 같이 유체 흐름의 근간에 있는 방정식을 유도하려는 접근과 유사한 접근입니다. 앞서 설명한 금융수학자들이 이러한 접근법을 가지고 있다고 생각할 수 있습니다.

나비에-스토크스 방정식,&nbsp;https://blog.dhkim.info/MMdata/#

세번째로는 유체의 흐름을 대표할 수 있는 지수들을 얻고 그 사이의 관계를 분석하는 방법이 있습니다. 이런 방식은 물리적인 의미를 가지는 변수로 시스템을 간접적으로 해석하는 공학적 방법이라고 할 수 있는데요, 기업 가치 평가를 통한 지수를 통해 거래 알고리즘을 세우는 펀드들의 포트폴리오 구성 방식이 이러한 방법이라고 이야기할 수 있습니다. 이런 접근법은 주로 재무금융의 전문가들이 금융이론을 바탕으로 접근할 때 사용이 됩니다.

그렇기 때문에 이들의 퀀트 투자 방식을 이해하기 위해서는 금융 시장의 물리적인 의미를 알아볼 필요성이 있습니다. 이를 이해하는 시작은 각 주식의 위험성입니다. 가격 변동이 큰 주식이 위험하게 되며, 그 경우 주가의 표준편차가 크게 된다는 사실을 알 수 있습니다. 적절한 비율로 두 주식을 섞어서 산다고 하면 이때의 수익률을 아래와 같이 나타낼 수 있습니다. $$r_{p}= w_{A}r_{A}+w_{B}r_{B}$$ 이에 따른 수익의 기댓값과 위험도는 통계 법칙을 사용하면 아래와 같이 정리됩니다. $$E(r_{P})=w_{A}E(r_{A})+w_{B}E(r_{B})$$ $$\sigma_{P}^{2}=w_{A}^{2}\sigma_{A}^{2}+w_{B}^{2}\sigma_{B}^{2}+2w_{A}w_{B}Cov(r_{A}, r_{B})$$
여기서 적절히 비율을 조정하면 그 때마다의 기대수익과 위험도 사이의 관계를 알아낼 수 있다는 사실을 알 수 있습니다. 두 개가 아니라 시장 전체의 기업들을 전부 비율을 다르게 해서 사면 아래와 같이 시장 전체를 대상으로 한 포트폴리오의 기대수익과 위험도 사이의 관계를 얻을 수 있게 됩니다.

시장 전체를 포트폴리오로 하였을 때의 위험도와 기대 수익 간 관계, J. Berk, P. DeMarzo, "Corporate Finance, 5th edition", Pearson, 2020.

이때 포물선 안쪽과 비교한다면 왼쪽으로 갈수록 위험이 줄어들고, 위로 갈수록 기대수익이 크기 때문에 시장 전체에 대해 분산투자를 하는 것, 즉 위 그래프의 경계선이 가장 좋은 방법임을 알 수 있습니다. 만일 주식과 현금 사이의 비율을 고려해서 투자를 하게 된다면 어떻게 될까요? 채권같은 위험이 없는 자산들은 그래프의 y축, 즉 위험도가 0인 자산에 해당하게 됩니다. 즉 아래 그래프의 F 점에 해당하는 위치가 무위험자산이 되고, 이 지점과 그래프 위의 한 점을 적절히 연결한 직선 상의 지점이 최종 투자 포트폴리오의 기대 수익과 위험이 됩니다.

주식과 무위험자산을 동시에 투자하였을 때의 포트폴리오의 기대 수익과 위험,&nbsp;J. Berk, P. DeMarzo, "Corporate Finance, 5th edition", Pearson, 2020.

만약 이 비율을 자유자재로 조절할 수 있다면 각각의 직선 상에서는 자유롭게 위치를 조절할 수 있게 됩니다. 그렇다면 각 직선 중 어느 직선이 최적의 투자 포트폴리오인지를 확인하면 최종적으로 이상적인 경우의 최적 포트폴리오를 알 수 있게 됩니다. 직선 안에서 자유롭게 이동할 수 있다면 아래 그래프의 S 지점보다는 S’ 지점이 기대수익이 더 높게 됩니다. 즉 최적의 포트폴리오는 M 지점과 무위험자산을 적절히 섞은 포트폴리오가 됩니다. 결론적으로, 이상적인 경우 시장을 따라가는 것이 최선의 포트폴리오가 된다는 점을 알 수 있게 됩니다.

이상적인 경우 최적의 포트폴리오의 지점, J. Berk, P. DeMarzo, "Corporate Finance, 5th edition", Pearson, 2020. (가공을 거침)

비슷한 원리로 시장 포트폴리오와 기대수익 사이의 관계를 구해보면 아래와 같은 식을 얻을 수 있습니다. $$E(r_{i})=r_{F}+[E(r_{M})-r_{F}]\beta_{i}$$ 이를 CAPM이라고 이야기하며, 시장의 위험도를 나타내는 수치인 beta에 따라 기대 수익이 비례한다는 결론을 얻을 수 있게 됩니다. 여기서 식의 형태를 보면 마치 $y=\alpha+\beta x$ 형태의 일차식으로 나타남을 알 수 있습니다. 실제로, $E(r_{i})-r_{F}$를 risk premium이라 하고, 시장의 risk premium에 대한 각 기업의 risk premium을 그래프에 나타낸 뒤 이에 대해 추세선을 그려보면 CAPM 식과 비슷한 형태로 그려볼 수 있습니다.

서울대학교 재무와 기계학습 강의자료 참조

여기서 시장의 risk premium이 0이 된 y절편을 확인하면 여전히 개별 종목의 risk premium이 0이 아님을 확인할 수 있는데요, 이 차이는 CAPM 모델로 예상하지 못한 수익이며, 이를 alpha라고 이야기합니다. 아래와 같이 beta에 대해 risk premium을 그려보면 더 명확하게 알 수 있는데요, 시장 포트폴리오로 예상되는 수익에서 벗어나는 정도가 alpha임을 알 수 있습니다.

이렇게 회귀 분석을 통해서 시장 포트폴리오를 통한 개별 종목이나 포트폴리오의 기대 수익을 예상할 수 있지만, 실제로 이 모델은 이상적인 상황을 고려한 만큼 정확한 예측이 어려울 수 있게 됩니다. 이에 따라 Fama 등은 alpha에 숨어 있는 추가적인 요소들을 발견하고자 노력하게 되었고, 아래 식과 같이 시장의 premium 외에 다른 요소들을 더하여 회귀 분석을 진행하는 등의 연구가 이뤄지게 됩니다. $$r_{i, t}-r_{f, t}=\alpha_{i}+\beta_{i, M}(r_{M, t}-r_{f, t})+\beta_{i, SMB}SMB_{t}+\beta_{i, HML}HML_{t}+e_{i, t}$$

이처럼 수익을 예측하는 모델을 만들어내기 위해서는 여러 factor들을 적절히 도입하는 것이 중요하다고 이야기할 수 있으며, 그 과정에서 흔히 사용되는 factor들이 기업의 가치 평가에 사용되는 factor들입니다. 흔히 주식 투자를 할 때 사용하는 PBR이나 PER같은 값들이 대표적인 기업가치평가를 위한 지수들인데요, 이번 글에서는 이들 수치들이 어떻게 기업 가치를 설명하는지를 간단히 다뤄보고 실제 퀀트에서 어떻게 응용되는지를 설명해보고자 합니다.

먼저 대표적인 수치 중 하나인 PBR의 경우 주가를 한 주당 순자산가치로 나눈 값으로 기업의 순자산에 비해 몇 배로 주식이 거래되고 있는지를 나타내는 값입니다. 즉, 기업의 자본 대비 시가총액이 얼마나 되는지를 설명하는 값이라고 생각할 수 있습니다. 비슷한 수치로 PER이나 ROE 역시 있습니다. PER의 경우 주가를 순자산가치 대신 당기순이익으로 나눈 값으로, 벌어들인 이익 대비 시가총액이 얼마나 되는지를 설명하는 값이라고 이해할 수 있습니다. 마찬가지로 ROE는 당기순이익을 한 주당 순자산가치로 나눈 값으로, 기업의 자본 대비 이익이 얼마나 나오게 되었는지를 나타내는 값입니다.

PBR, ROE, PER에 대한 그림, 유튜브 <슈카월드> 참조 및 변형

이 값들을 기반으로 간단한 기업가치평가를 할 수 있게 되는데요, PBR을 예시로 들어서 설명을 해보고자 합니다. PBR의 경우 적절한 수식의 변형을 거치면 아래와 같이 식을 변형할 수 있습니다. $$PBR=\frac{P}{B}=1+\rm{PV} of \it(ROE-r)$$ 즉, PBR 값은 자본 대비 이익과 기대 수익의 차이와 비례함을 알 수 있습니다. 이는 기존 예상에 비하여 얼마나 초과 이익이 나타났는지를 나타내는 값이므로, PBR이 1보다 크면 초과 이익이 0보다 크고, 반대로 PBR이 1보다 작으면 초과 이익이 0보다 작게 됩니다. 따라서 초과 이익이 작은 저평가된 기업의 경우 PBR 역시 작게 됨을 알 수 있으므로, PBR은 투자의 기준으로 삼을 수 있는 지표가 됩니다.

실제 퀀트 알고리즘 포트폴리오를 짤 수 있도록 돕는 여러 사이트에서는 이런 값들을 활용하여 알고리즘을 짜도록 설계가 되어 있습니다. 아래 그림은 여러 퀀트 서비스를 제공하는 사이트 중 한 사이트에서 퀀트 투자를 위해 기본 조건을 설정하는 설정창의 그림입니다.

https://genport.newsystock.com/ 참조

보이는 바와 같이 앞서 언급한 ROE 등 다양한 수치를 기준으로 투자 조건을 설정하는 것을 알 수 있습니다. 이런 퀀트 사이트들에서는 이와 비슷한 다양한 수치들을 바탕으로 기업들의 순위를 설정하고, 그 중에서 순위가 높은 기업들을 선정하여 투자 포트폴리오를 구성하게 됩니다. 아래 그림은 해당 사이트에서 홍보를 위해 제공하는 그림입니다.

https://genport.newsystock.com/ 참조

이렇게 여러 지표들을 사용하여 기업들의 순위를 정하고, 이를 바탕으로 투자 포트폴리오를 구성하는 것은 퀀트의 가장 간단한 예시라고 할 수 있습니다.

여기에서 나아가 퀀트를 위해 컴퓨터공학적인 기술을 다양하게 활용할 수도 있습니다. 이 활용 방향은 크게 두세가지 정도의 방향으로 나눠지게 됩니다. 이 중 먼저 앞서 다뤘던 투자 포트폴리오 구성 방법에서 확장을 해보고자 합니다. 아래 그림은 Gu, Kelly, and Xiu (2020)의 연구에 수록된 그림으로, PBR 및 최근 수익률 등 여러가지 지표들을 활용하여 투자 포트폴리오를 구성한 그림입니다.

Gu, Shihao, Bryan Kelly, and Dacheng Xiu. "Empirical asset pricing via machine learning." The Review of Financial Studies 33.5 (2020): 2223-2273.

이 그림에서 특별하게 확인할 수 있는 부분으로는 그림 중간의 neural network라는 말이 있습니다. Neural network라는 표현대로 이 논문에서는 여러 지표들로부터 최적의 예측식을 만들어내기 위해 기계학습을 사용함을 알 수 있습니다. 이런 과정이 필요한 이유는 무엇일까요? 위 논문에서는 900개의 변수들을 사용해서 미래의 수익을 예측하고자 하였습니다. 이렇게 수많은 변수들을 사용하게 되면 단순히 더해서는 정확한 예측이 힘들게 됩니다. 이 과정을 도와 변수들과 미래 수익률 사이의 관계식을 예측하는 과정에 기계학습이 쓰임을 알 수 있습니다.

한편으로는, 보다 직접적으로 기계학습을 응용하는 방법이 있을 수 있습니다. 주가 데이터로부터 직접 패턴을 분석하고 미래의 주가를 예측하는 연구가 바로 여기에 해당합니다. 아래 그림은 Yoo, Soun, Park, Kang (2021)의 연구에 수록된 그림으로, 다양한 기계학습 방법론을 이용하여 주가를 예측한 결과를 나타낸 그림입니다. 이런 방법을 기술적 분석이라고 이야기하게 됩니다. 이런 기술적 분석을 효과적으로 진행하게 된다면 재무 이론적으로 찾아내기 힘든 숨겨진 alpha를 찾아낼 수 있을 수도 있습니다. 하지만, 주가 데이터의 방대한 크기나, 예측하기 어려운 패턴, 규칙을 찾기 어려우며 외란이 큰 사회과학적 데이터의 한계로 인해 연구에 어려움이 있기도 합니다.

Yoo, Jaemin, et al. "Accurate multivariate stock movement prediction via data-Axis transformer with multi-level contexts." Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021.

이러한 두 가지 접근법은 금융을 연구하는 연구자들의 시선 차이로부터 기인하기도 합니다. 보다 자세하게 다뤄보면, 앞서 이야기한 이상적인 모델로 예상하지 못하는 차이인 alpha를 바라보는 관점에 따라 두 가지로 나눠지게 됩니다. 한 가지 입장은 이론으로 예상하지 못하는 alpha는 없으며, 모델이 맞지 않는 이유는 모델이 불안정하기 때문이라는 시각입니다. 앞서 다뤘던 Fama의 CAPM 개선판이 대표적인 예시라고 생각할 수 있습니다. 이 방식으로 데이터를 분석하기 위해서는 보다 다양한 변수들을 식에 포함시켜서 모델을 보다 정확히 만드는 과정이 필요하게 됩니다. 앞서 다뤘던 Gu, Kelly, and Xiu의 연구와 같이 여러 변수들로부터 주가 데이터를 예측하고자 하는 노력이 이에 해당합니다.

다른 접근법은 모델에서 예상하지 못하는 alpha가 존재할 것이라는 입장입니다. 이런 입장을 취하는 사람들은 다양한 방법으로 기존의 모델이 찾지 못하는 새로운 패턴을 찾고자 노력하게 됩니다. 기술적 분석이 여기에 해당하는 한 가지의 접근 방식이라고 이야기할 수 있게 됩니다.

(엄밀히 이야기하면 기술적 분석을 순수히 경제학적인 접근이라고 칭하기에는 무리가 있을 수 있을지도 모릅니다. 이 글에서는 다만 모델의 factor를 중심으로 시장을 바라보는지의 여부에 따라 간단하게 두 부류로 나누어 설명을 했고, 기술적 분석이 factor-based한 접근 방식이 아니라는 사실과 이를 연결한 설명으로 다소 비약이 있음을 알려드립니다. 실제로는 시장을 이상적인 모델로 바라볼 수 있는지, 시장의 합리성을 가정할 수 있을지 등의 여러 논의가 이뤄지는 영역에 해당합니다. 이러한 내용은 전공 서적이 아니더라도 investopedia 등 인터넷 사이트에도 많이 나와 있으므로, 혹시 추가적인 내용이 궁금하신 분들은 찾아보시면 좋을 것 같습니다.)

이 두 가지 방법과 모두 접점이 닿아 있는 새로운 컴퓨터공학의 응용 방법 역시 있습니다. 기존의 재무적인 지표가 아닌, 새로운 지표를 컴퓨터공학을 이용하여 찾아내는 방식입니다. 한 가지 흥미로운 사례를 통해서 이를 소개해보려고 합니다. 아래 사진은 어떤 사진일까요?

위성 사진으로 찍은 Wichita, Kansas의 Walmart 주차장,&nbsp;https://www.npr.org/sections/money/2010/08/19/129298095/with-satellite-images-wall-street-analysts-spy-on-wal-mart

바로 미국 월마트의 주차장을 위성으로 찍은 사진이라고 합니다. 이 사진으로부터 어떤 데이터를 얻어서 주식 투자에 응용할 수 있을까요? 실시간으로 주차장에 주차된 차량의 수를 데이터화하게 되면, 이 데이터는 직접적으로는 해당 월마트의 매출과 직결될 수 있고, 나아가서는 월마트라는 기업의 성과나 시장의 소비 활성화 정도와도 연결될 수 있게 됩니다. 하지만 이러한 데이터를 사람이 하나하나 얻어내는 과정은 대단히 어렵게 됩니다. 이를 위해서 인공지능, 그 중에서도 Vision AI를 사용하여 위성 사진으로부터 정보를 찾아내게 됩니다.

나아가, 이와 비슷한 또 다른 예시를 한 가지 들어보고자 합니다. 여기서 사용하는 인공지능의 방법론은 최근 주목을 받는 분야 중 하나인 NLP, 자연어처리입니다. 아래 그림은 자연어처리를 이용하여 미래 신산업에 대한 펀드를 만든 미국 Kensho사에서 제공하는 펀드의 sector들을 정리하는 표입니다.

S&P Kensho New Economies Composite Index 30의 2022년 Q3 보고서 중

이 회사에서는 자연어처리를 사용하여 재무제표 등의 자료로부터 각 기업의 특징을 얻어내고, 그 중 미래 신산업과 관련이 있는 기업들 및 분야들을 선정하여 펀드로 출시하고 실제로 그 성과를 거두었음을 홍보하고 있습니다. 이러한 접근 방식은 기존의 방식으로 얻어내지 못한 새로운 요소를 찾는 방식이라고 이야기할 수 있습니다.

또 다른 흥미로운 예시 중 하나로는 여러 투자 회사들에서 널리 사용하고 있는 방법론인 HFT (High Frequency Trading, 고빈도 매매)와 반도체 회로 및 AI 기술의 결합을 들 수 있습니다. 이러한 고빈도 매매의 접근 방식은 기본적으로 남들보다 더 빠르게 사고팔면 이득을 얻을 수 있다는 아이디어에서 출발합니다. 이를 위해서 여러 기업들은 가능한 한 빠르게 매매가 이뤄질 수 있도록 거래소와의 물리적인 거리를 줄이거나, 더 빠른 거래 알고리즘을 설계하게 됩니다. 여기에 더 나아가 반도체와의 결합에 대한 필요성도 제시되어지고 있습니다. 효율적인 전자 회로의 설계 역시 더 빠르고 정확한 거래에 도움을 주게 되고, AI를 사용한 알고리즘을 적용하게 된다면 여기에 맞도록 설계된 컴퓨터를 사용할 때 더 빠르고 정확한 거래가 이뤄지게 됩니다. 따라서 AI 뿐 아니라 AI 반도체에 대한 수요 역시 증가하고 있음을 알 수 있습니다. 실제로 여러 국내외의 스타트업 기업들에서 여기에 대한 로직을 제시하고자 노력하고 있습니다.

이렇게 수치를 기반으로 하는 계량 투자인 퀀트는 매우 이론적인 분야부터 실제 투자로의 적용까지 다양한 분야에 걸쳐 이뤄지고 있으며, 그 속에서 데이터 분석 및 새로운 지표 창출을 위한 컴퓨터 기술이 다양하게 사용되어지고 있음을 오늘 글을 통해서 다루어 보았습니다. 개인적으로는 주식 투자에 숨겨진 복잡한 원리와, 이를 뛰어넘고자 하는 이론적인 분석 및 데이터로의 접근 방식에 대한 매력적인 분야가 바로 이 분야가 아닐까 하고 생각합니다. 긴 글 읽어주셔서 감사합니다!

 

댓글