Study/[도서] 혼자 공부하는 머신러닝+딥러닝

[혼자 공부하는 머신러닝+딥러닝] 마켓과 머신러닝

CodeNook; 2024. 6. 18. 12:45

 

 

 

혼자 공부하는 머신러닝+딥러닝: 마켓과 머신러닝

안녕하세요, 오늘은 [혼자 공부하는 머신러닝+딥러닝]의 3강 '마켓과 머신러닝' 강의를 요약해보겠습니다. 이 강의는 머신러닝의 기본 개념을 쉽게 이해할 수 있도록 다양한 예제를 통해 설명합니다. 특히 가상의 모바일 쇼핑몰인 '한빛 마켓'의 생선 분류 문제를 중심으로 머신러닝 프로그램을 만드는 과정을 살펴봅니다.

1. 인트로

이번 강의에서는 교재의 1장 3절 내용을 다루며, 이전에 사전 동영상으로 학습한 1장 1절과 2절을 기반으로 본격적인 머신러닝의 개념을 설명합니다.

2. 머신러닝 프로그램이란?

머신러닝 프로그램은 데이터를 이용해 모델을 학습시키는 과정을 의미합니다. 이론보다는 실습을 통해 개념을 쉽게 이해할 수 있도록 접근합니다. 가상의 모바일 쇼핑몰 '한빛 마켓'의 예제를 통해 생선을 분류하는 프로그램을 만드는 과정을 소개합니다.

3. 예제 설명

이번 강의에서는 생선의 길이와 무게 데이터를 이용해 도미인지 빙어인지를 자동으로 분류하는 프로그램을 만듭니다. 이를 통해 머신러닝의 기본 개념과 프로그램 작성 과정을 이해할 수 있습니다.

4. 전통적 프로그래밍 vs 머신러닝 프로그래밍

전통적 프로그래밍은 사람이 규칙을 정의하지만, 머신러닝은 데이터를 통해 규칙을 학습합니다. 규칙이 명확하지 않은 문제에 머신러닝이 유용하게 사용됩니다.

5. 데이터 준비

먼저, 생선 길이와 무게 데이터를 파이썬 리스트로 준비합니다. 각 생선 데이터를 샘플로, 길이와 무게를 특성으로 정의합니다. 이후 특성을 시각화하기 위해 산점도를 그립니다.

6. 산점도 그리기

파이썬의 Matplotlib 라이브러리를 사용해 산점도를 그립니다. 도미와 빙어 데이터를 각각 다른 색으로 시각화하여 데이터의 분포를 확인합니다.

7. 머신러닝 모델 학습

준비된 데이터를 2차원 리스트 형태로 변환하여 학습 준비를 합니다. 사이킷런 라이브러리를 사용해 k-최근접 이웃(KNN) 모델을 학습시키고, 모델의 성능을 평가하기 위해 정확도를 확인합니다.

8. 모델 예측

새로운 생선 데이터로 모델을 테스트하여 예측 결과를 확인합니다. k-최근접 이웃 알고리즘이 주위 데이터 샘플을 기준으로 예측하는 원리를 설명합니다.

9. k-최근접 이웃 알고리즘

기본 k값(5)을 변경해가며 모델의 정확도를 비교합니다. 주위 샘플 개수를 늘리면 정확도가 어떻게 변하는지 실험합니다.

10. 결론

첫 번째 머신러닝 프로그램을 성공적으로 작성하였으며, 다양한 용어와 라이브러리를 사용하여 기본적인 머신러닝 개념을 학습하였습니다. 후속 강의에서는 더 흥미로운 주제와 심화된 내용을 다룰 예정입니다.

Q&A 및 추가 설명

  • 스코어 메서드: 학습한 모델의 성능을 평가하기 위해 사용됩니다.
  • 특성 수 증가: 실제 머신러닝에서는 더 많은 특성을 사용할 수 있으며, 2차원 이상의 데이터도 처리 가능합니다.

이번 강의는 생선 분류 문제를 통해 머신러닝의 기본 개념과 실습 과정을 체계적으로 설명합니다. 다음 강의에서는 더욱 심화된 내용을 다룰 예정이니 많은 기대 부탁드립니다. 감사합니다!

 

 

😎수강 후기

 - 생각보다는 쉽다. 입문서라 그런가?

 - 머신러닝이 미지의 무언가라 생각했는데 결국 사람이 만든것이기에 원리 자체는 나같은 초보자라도 살짝은 이해할 수 있겠구나 싶다.

 - 흥미롭다. 굉장히 응용의 영역이 많을 것 같다.