데이터 사이언스 지망생들로부터 가장 많이 받는 질문 중 하나는 "머신 러닝에 필요한 수학은?"입니다. 데이터 사이언스를 처음 독학하기 시작했을 때, 저는 엔트리 레벨의 데이터 사이언스 포지션에 완전히 합격하기 위해 정확히 얼마나 많은 수학을 배워야 하는지 혼란스러웠습니다.
머신러닝에 필요한 수학 5가지
저는 학부 수준의 미적분, 선형대수, 통계학을 공부하는데 많은 시간을 보냈습니다.
데이터 사이언스 일을 처음 시작한 후, 저는 업계에서 일할 때 필요한 수학의 양이 제가 예상했던 것보다 훨씬 적다는 것을 깨달았습니다. 대부분의 기업은 매우 유사한 비즈니스 문제를 해결하기 위해 기계 학습 모델을 구축하는 경향이 있습니다. 따라서 일반적으로 휠을 다시 발명하거나 알고리즘을 처음부터 구축할 필요가 없습니다. 현재 사용 사례에 맞게 기존 설루션을 사용할 수 있습니다.
단, 이러한 알고리즘의 배후에 있는 작업을 적어도 직관적으로 이해하는 것이 항상 좋습니다. 예를 들어, 경사 하강은 선형 회귀 모델에서 최적의 경사 값을 찾는 데 사용됩니다. 이것은 미적분의 응용이며, 가장 적합한 선이 어떻게 계산되는지 이해하는 것이 항상 유익합니다. 마찬가지로 선형대수는 모델링을 위한 데이터 준비에 적용되며 차원 축소 설루션을 구현하는 데 널리 사용된다. 딥 러닝에 대한 지식을 넓히고 싶다면 매트릭스 조작 기술을 배울 필요가 있습니다.
마지막으로, 통계학은 데이터 과학자가 되기 위해 배워야 하는 수학의 가장 중요한 분야이다. 현장에서 작업할 때는 데이터의 추세를 분석하고 가설을 특화하며 관찰 결과를 의미 있는 통찰력으로 변환해야 합니다. 이것들은 모두 통계학을 응용한 것으로, 데이터 과학에 종사하려면 반드시 배워야 합니다. 위의 개념을 배웠을 때 처음에는 수작업으로 계산을 하는 데 많은 시간을 할애했습니다. 나는 선형 방정식을 미분, 적분, 푸는 법을 배웠다. 그러나 이것은 데이터 과학을 배우기 위한 전제조건은 아닙니다.
이러한 계산을 수행할 수 있는 컴퓨터 프로그램이 있습니다. 그리고 우리에게 정말로 필요한 것은 이러한 수학적 개념에 대한 높은 수준의 직관적인 이해를 얻는 것입니다. 위의 조언은 업계에 취업하기 위해 데이터 과학을 배우려는 경우에만 적용됩니다. 기계학습 연구원이 되거나 학계에 진학하고 싶다면 새로운 ML 설루션을 처음부터 개발해야 하기 때문에 수학 학습량이 크게 증가할 것입니다. 이 기사에서는 당신에게 기계 학습을 위한 수학을 배울 수 있는 6가지 자료를 제공할 것입니다. 데이터 사이언티스트가 되기 위해 충분한 수학 실력을 쌓기 위해 사용할 수 있는 무료 온라인 자료(유튜브 동영상, 온라인 강좌, 교과서)를 포함하겠습니다.
1. 3 Blue 1 Brown의 선형 대수 시리즈
3 Blue 1 Brown은 매우 복잡한 수학 개념을 분석하기 위해 시각적으로 접근하는 인기 있는 YouTube 채널입니다. 이러한 시리즈는 벡터, 선형 결합, 선형 변환, 행렬 곱셈, 고윳값 및 고유 벡터와 같은 핵심 선형 대수 개념을 설명합니다.
3 Blue 1 Brown의 비디오의 가장 좋은 점은 수학적인 계산에 너무 깊이 들어가지 않는다는 것이다.대신, 이 시리즈의 초점은 선형 대수에 대한 직관적인 이해를 제공하는 것입니다.단순히 공식을 암기하는 대신, 공식이 왜 작용하는지, 그리고 어떻게 직접 공식을 도출할 수 있는지에 대한 설명이 주어질 것입니다.
2. 3Blue1Brown의 미적분 시리즈
이것은 3 Blue 1 Brown이 작성한 이 목록의 두 번째 리소스입니다. 그들의 미적분 시리즈는 또한 직관적이고 이해하기 쉬우며 계산과 복잡한 공식에 너무 깊이 들어가지 않습니다.
도함수, 연쇄 규칙 및 암묵적 미분과 같은 개념을 배우게 됩니다. 이 모든 개념은 구배 강하 알고리즘을 구현하는 데 직접 적용됩니다.
3. 3 Blue 1 Brown의 딥러닝 시리즈
그들의 미적분 시리즈는 수학에 대한 지식을 향상하고자 하는 사람들을 위해 더 일반적이며, 3 Blue 1 Brown의 딥러닝 시리즈는 인공지능에 관심이 있는 학생들을 위해 특별히 만들어졌습니다. 딥러닝 시리즈는 뉴럴 네트워크의 내부 작동과 이러한 모델이 데이터에서 패턴을 학습하는 방법을 안내합니다. 역전파 알고리즘과 그 작동 방식에 대한 자세한 설명과 함께 미적분 개념도 제공됩니다.
4. 통계학습 개론
이것은 기계 학습 마니아로서 읽을 수 있는 최고의 통계 입문 교재 중 하나입니다. 온라인에서 이용할 수 있으며 무료로 다운로드할 수 있습니다. 선형 회귀 분석, 로지스틱 회귀 분석 및 의사 결정 나무와 같은 알고리즘을 과거에 구현했지만 이러한 모델의 이면 작업이나 사용 시기를 이해하지 못하는 경우 이 책을 시작하는 것이 좋습니다.
선형 모형, 트리 기반 알고리즘 및 비감독 기술의 작동 방식을 직관적으로 이해할 수 있습니다. 다양한 통계 모델을 작성할 때 과적합과 싸우는 방법에 대해 설명합니다. 이 책의 모든 장에는 코드 화할 수 있는 R의 실습도 포함되어 있기 때문에 이 주제에 대한 이론적 이해뿐만 아니라 학습한 개념을 실천할 수 있습니다.
5. 하버드대학교 통계 110
이 목록의 마지막 자원은 하버드 대학에 의해 대중에게 공개된 통계 110이라고 불리는 유튜브 시리즈이다.
이것은 제가 온라인에서 통계와 확률에 관해 찾은 최고의 시리즈 강의 중 하나입니다. 여기에는 일반적으로 학부 수준의 통계학 수업에서 볼 수 있는 거의 모든 통계 개념(확률 공리, 분포 유형, 몬티 홀 문제, 공분산, 상관관계, 카이-제곱 검정, T 검정, 마르코프 체인 등)이 포함됩니다.
강의는 입문 단계부터 시작하며, 통계나 확률에 대한 지식이 없어도 어렵지 않게 따라갈 수 있습니다.
데이터 과학을 위한 수학 학습 - 다음 단계
위의 자료들은 여러분이 기계 학습을 위해 수학의 세계에 발을 담글 수 있는 훌륭한 방법입니다. 수학 개념에 대한 직관적인 이해를 제공하며, 이를 통해 매일 작성하는 모델의 이면에 있는 작업에 대한 지식을 강화할 수 있습니다.
이 목록에 있는 모든 리소스를 검토할 시간이 없다면 통계학 입문이라도 읽어보시길 권장합니다. 이 교과서에서 설명하는 개념은 데이터 과학자로서 일상적인 워크플로우에 직접 적용됩니다.
기계학습 프로젝트 체크리스트
기계 학습 프로젝트 계획 머신 러닝과 AI를 통해 조직은 데이터를 분석하고, 통찰력을 발견하고, 수많은 데이터에서 의사결정을 주도할 수 있습니다.그 어느 때보다 많은 조직이 머신러닝에 투
www.oskinp.com
댓글