본문 바로가기
[추천시스템] Alternating Least Square (ALS)를 활용한 Matrix Factorization [추천시스템 시리즈] 2021.08.30 - [데이터과학] - [추천시스템] 비개인화 추천 알고리즘 - 인기도 기반 추천 2021.09.01 - [데이터과학] - [추천시스템] 성능 평가 방법 - Precision, Recall, NDCG, Hit Rate, MAE, RMSE 2021.09.08 - [데이터과학] - [추천 시스템] Matrix Factorization (SGD) 2021.09.28 - [데이터과학] - [추천시스템] Alternating Least Square (ALS)를 활용한 Matrix Factorization 2021.10.18 - [데이터과학] - [추천시스템] Multi-Armed Bandit 본 포스팅에서는 Matrix Factorization의 학습 속도를 매우 향상시킨 .. 2021. 9. 28.
[추천 시스템] Matrix Factorization (SGD) [추천시스템 시리즈] 2021.08.30 - [데이터과학] - [추천시스템] 비개인화 추천 알고리즘 - 인기도 기반 추천 2021.09.01 - [데이터과학] - [추천시스템] 성능 평가 방법 - Precision, Recall, NDCG, Hit Rate, MAE, RMSE 2021.09.08 - [데이터과학] - [추천 시스템] Matrix Factorization (SGD) 2021.09.28 - [데이터과학] - [추천시스템] Alternating Least Square (ALS)를 활용한 Matrix Factorization 2021.10.18 - [데이터과학] - [추천시스템] Multi-Armed Bandit 본 포스팅에서는 추천 시스템에서 가장 많이 사용되는 Matrix Factorizat.. 2021. 9. 8.
[추천시스템] 성능 평가 방법 - Precision, Recall, NDCG, Hit Rate, MAE, RMSE [추천시스템 시리즈] 2021.08.30 - [데이터과학] - [추천시스템] 비개인화 추천 알고리즘 - 인기도 기반 추천 2021.09.01 - [데이터과학] - [추천시스템] 성능 평가 방법 - Precision, Recall, NDCG, Hit Rate, MAE, RMSE 2021.09.08 - [데이터과학] - [추천 시스템] Matrix Factorization (SGD) 2021.09.28 - [데이터과학] - [추천시스템] Alternating Least Square (ALS)를 활용한 Matrix Factorization 2021.10.18 - [데이터과학] - [추천시스템] Multi-Armed Bandit 이번 포스팅에서는 대표적인 추천시스템의 성능 평가 방법들을 소개한다. 평가에는 여러.. 2021. 9. 1.
[추천시스템] 비개인화 추천 알고리즘 - 인기도 기반 추천 [추천시스템 시리즈] 2021.08.30 - [데이터과학] - [추천시스템] 비개인화 추천 알고리즘 - 인기도 기반 추천 2021.09.01 - [데이터과학] - [추천시스템] 성능 평가 방법 - Precision, Recall, NDCG, Hit Rate, MAE, RMSE 2021.09.08 - [데이터과학] - [추천 시스템] Matrix Factorization (SGD) 2021.09.28 - [데이터과학] - [추천시스템] Alternating Least Square (ALS)를 활용한 Matrix Factorization 2021.10.18 - [데이터과학] - [추천시스템] Multi-Armed Bandit 추천시스템은 보통 개인의 취향에 맞춰 상품이나 콘텐츠를 추천해주는 알고리즘을 생각할.. 2021. 8. 30.
[머신러닝] 앙상블 학습 - 2) Bagging 지난 번 포스팅에서 앙상블 학습의 의미와 효과에 대해서 알아보았다. 이어서 이번 포스팅에서는 앙상블 학습 기법 중 한 종류인 Bagging에 대해서 정리하였다. 구체적으로는, 1) Bagging의 정의와 의의, 그리고 2) 모델 결합 방법에 대해서 알아본다. 본 포스팅은 고려대학교 강필성 교수님의 비즈니스 애널리틱스 강의 내용을 요약한 것이며, 해당 강의는 유튜브에서 무료로 시청이 가능하다(링크). 아래 링크들은 본 포스팅과 관련된 게시글이므로 같이 보면 이해가 더 쉬울 것이다. 1. [머신러닝] 편향-분산 분해 2. [머신러닝] 편향과 분산의 의미 3. [머신러닝] 앙상블 학습 - 1) 배경 1. Bagging 1) Bagging (Bootstrap Aggregating) 이란? Bagging이란, 기.. 2021. 6. 23.
[머신러닝] 앙상블 학습 - 1) 배경 이번 포스팅에서는 모델의 편향과 분산을 줄이기 위한 노력의 일환인 앙상블 학습에 대하여 정리해봤다. 본 글에서는 1) 앙상블의 목적, 2) 앙상블의 핵심 가치, 그리고 3) 앙상블의 효과를 차례대로 설명한다. 이는 고려대학교 강필성 교수님의 비즈니스 애널리틱스 강의 내용을 요약한 것이며, 해당 강의는 유튜브에서 무료로 시청이 가능하다(링크). 1. 앙상블의 목적 지난 번 포스팅을 통해 편향과 분산의 정도를 바탕으로 모델을 4가지 유형으로 나눌 수 있음을 배웠다. 네 번째 유형(낮은 편향, 낮은 분산)이 가장 바람직한 모델이지만, 현실은 대부분 두 번째나 세 번째인 경우가 많다. 따라서, 이 두 가지 유형에서 네 번째 유형의 모델로 만들기 위한 노력이 바로 앙상블 학습인 것이다. 즉, 앙상블의 목적은 다중.. 2021. 6. 14.
[머신러닝] 편향과 분산의 의미 지난번 포스팅에 이어, 이번 글에서는 1) 편향과 분산이 의미하는 바를 그림으로 쉽게 이해하고, 2) 편향, 분산과 모델 복잡도 간의 관계에 대해서 알아보도록 한다. 본 글은 고려대학교 강필성 교수님의 비즈니스 애널리틱스 강의 내용을 요약한 것이며, 해당 강의는 유튜브에서 무료로 시청이 가능하다(링크). 1. 그림으로 보는 편향과 분산 지난 번 편향-분산 분해 포스팅을 통해 우리는 위의 수식과 같이 오차 함수 MSE를 세 가지로 분해할 수 있음을 보였다. 가장 우측에 있는 sigma 제곱은 사람이 컨트롤 할 수 없는 자연발생적인 데이터의 변동성이므로 이를 제외한다고 하면, 오차를 줄일 수 있는 방법은 편향의 제곱(첫번째 텀) 또는 분산(두번째 텀)을 감소시키는 것 뿐이다. 우선, 편향과 분산이 각각 의미.. 2021. 6. 4.
[머신러닝] 편향-분산 분해 (Bias-Variance Decomposition) 본 작성글은 고려대학교 강필성 교수님의 비즈니스 애널리틱스 강의 내용을 바탕으로 정리한 내용이다. 해당 강의는 유튜브에서 무료로 시청이 가능하다(링크). 앙상블 학습(Ensemble Learning)에 대해 순차적으로 다룰 예정이며, 이번 게시글에는 이론적 배경이 되는 편향-분산 분해에 대하여 먼저 알아보도록 한다. 1. Additive Error Model Additive Error Model이란 데이터에 대한 가정을 의미한다. 우리에게 주어진 현실 세계의 데이터에는 데이터를 생성하는 정답 매커니즘(f(x))이 있다하더라도, 노이즈(epsilon)가 반드시 포함되어 있다는 가정이다. 노이즈란, 사람이 컨트롤 할 수 없는 자연발생적인 변동성을 의미한다. 아래 수식은 Additive Error Model를.. 2021. 5. 29.
[독후감] 인간실격 - 다자이 오사무 요조라는 인물에 대하여 요조는 표리부동하며 심기에 어긋나는 경우 돌변하는 인간의 본성을 두려워한다. 이를 숨기고자 억지로 익살꾼을 자처하며 거절을 못하고, 사람을 두려워하는 자신의 본 모습을 들킬까 조마조마해하는 인물이다. 부유한 집안에서 태어났으나 여러 일탈 행위를 거치며 본가로부터 버림받게 되는데, 이로 인해 언제나 생활고에 시달리게 된다. 경제적 어려움과 가족에게 버림받았다는 상처, 사람에 대한 두려움으로 여자와 술, 마약 등의 쾌락을 즐기고 자살을 회피의 수단으로 활용하는 모습을 보인다. 결국 주변 인물들에 의해 정신병원에 갇힌 후 본가로 돌아가 약에 의지한 모습으로 결말을 맞는다. 인간실격의 주인공 요조는 저자 다자이 오사무의 자전적 인물이라고 생각될 정도로 실제 그와 유사한 삶을 살았다. 다자.. 2021. 5. 24.