Contents

핸즈온 머신러닝 1장 한눈에 보는 머신러닝 - 1.1 머신러닝이란?

데이터분석 관련 책 `핸즈온 머신러닝 2판`의 1장 1.1절 머신러닝이란? 요약 및 정리


1. 한눈에 보는 머신러닝


1.1. 머신러닝이란?

  • [머신러닝은] 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구분야

— 아서 새뮤얼(Arthur Samuel)
  • 어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정했을 때 경험 E로 인해 성능이 향상됐다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다.

— 톰 미첼(Tom Mitchell)
  • 제가 생각하는 머신러닝은 사용자가 목표로 하는 기능을 컴퓨터가 스스로 학습하여 보다 정확하게 수행하는 것을 뜻하는것 같습니다.

  1. 사례 - 스팸 필터

    • 스팸필터는 스팸 메일과 일반 메일의 샘플을 이용해 스팸 메일 구분법을 배울 수 있는 머신러닝 프로그램

    • 시스템이 학습하는 데 사용하는 샘플을 훈련 세트 라고 하고 각 훈련 데이터를 훈련 사례(또는 샘플) 라고함

    • 작업 T는 새로운 메일이 스팸인지 구분하는 것이고, 경험 E는 훈련 데이터 이며, 성능 측정 P는 직접 정의해야함

    • 예를 들면 정확히 분류된 메일의 비율을 P로 사용할 수 있으며, 이 성능 측정을 정확도 라고 부르며 분류작업에 자주 사용됨

      1. 훈련 세트(training set) : 시스템이 학습하는 데 사용하는 샘플

      2. 훈련 사례 또는 샘플(training instance) : 각 훈련 데이터

      3. 훈련 데이터(training data) : 시스템 훈련 경험

      4. 정확도(accuracy) : 사용자가 목표로 하는 기능의 성공률