딥러닝(10)
-
Ch5
5.1 일반화: 머신 러닝의 목표 5.1.1 과소적합과 과대적합 머신러닝은 일반화와 최적화 사이에서 줄다리기를 하는 과정이다. 그러므로 제대로 된 학습을 위해서는 노이즈, 이상치, 결측치 등등을 고려하며 feature selection을 해야 한다, 최적화 : 가능한 훈련 데이터에서 최고의 성능을 얻으려고 모델을 조정하는 과정 일반화 : 훈련된 모델이 이전에 본 적 없는 데이터에서 얼마나 잘 수행되는지 의미 잡음 섞인 데이터 불확실한 특성 : 덜 익은 바나나와 익은 바나나의 구분을 가능하게 하는 특성은 무엇인가? 드문 특성과 가짜 상관관계 : 드문 특성 값에 대해 무시하지 않고 그것을 반영하는 것은 옳은 일인가? 이렇게 반영했을 때 만들어지는 상관관계는 가짜 상관관계일 확률이 높다. 5.1.2 딥러닝에서..
2024.04.07 -
Ch4
4.1 영화 리뷰 분류: 이진 분류 문제 IMDB 데이터셋 인터넷 영화 데이터베이스로부터 가져온 양극단의 리뷰 5만 개로 이루어진 IMDB 데이터셋을 사용 훈련 데이터 2만 5,000개와 테스트 데이터 2만 5,000개로 나뉘어 있고 각각 50%는 부정, 50%는 긍정 리뷰로 구성 다음 코드는 데이터셋을 로드 IMDB 데이터셋 로드하기 from tensorflow.keras.datasets import imdb (train_data, train_labels), (test_data, test_labels) = imdb.load_data( num_words=10000) num_words = 10000 매개변수는 훈련 데이터에서 가장 자주 나타나는 단어 1만개만 사용하겠다는 의미 train_labels와 te..
2024.03.31 -
Ch3
3.1 텐서플로란? 텐서플로(TensorFlow)는 구글에서 만든 파이썬 기반의 무료 오픈 소스 머신 러닝 플랫폼 미분 가능한 어떤 표현식에 대해서도 자동으로 그레이디언트를 계산할 수 있으므로 머신 러닝에 매우 적함 CPU 뿐만 아니라 고도로 병렬화된 하드웨어 가속기인 GPU와 TPU에서도 실행할 수 있음 텐서플로 프로그램은 C++, (브라우저 기반 어플리케이션을 위한) 자바스크립트(JavaScript), (모바일 장치나 임베디드 장치(embedded device)에서 실행하는 어플리케이션을 위한) 텐서플로 라이트(TensorFlow Lite) 등과 같은 다른 런타임(runtime)에 맞게 변환할 수 있음 3.2 케라스란? 케라스는 텐서플로 위에 구축된 파이썬용 딥러닝 API로 어떤 종류의 딥러닝 모델도..
2024.03.24 -
Ch2
1. 신경망과의 첫 만남 - class(클래스) 머신 러닝에서 분류 문제의 범주(category) - label(레이블) 특정 샘플(데이터 포인트)의 클래스 - layer(층) 신경망의 핵심 구성 요소 주어진 문제에 더 의미있는 표현을 입력된 데이터로부터 추출 학습 작업 순서 1. 훈련 데이터인 train_images와 train_labels을 네트워크에 주입 2. 네트워크가 이미지와 레이블을 연관시킬 수 있도록 학습 3. test_images에 대한 예측을 네트워크에 요청 4. 예측이 test_labels와 맞는지 확인 MNIST 데이터셋 케라스 파이썬 라이브러리 사용 넘파일 배열 형태이며 흑백 손글씨 숫자 이미지(28*28 픽셀)를 10개의 범주(0~9)로 분류 이미지와 레이블은 1 대 1관계 ima..
2024.03.13