Tensorflow 시작하기 3 (Dataset)
사용 버전: Python 3.7.6, Tensorflow 2.1.0
이번 시간에는 데이터 셋(Dataset)을 불러오는 것과 전처리를 하는 것을 해보겠습니다.
tensorflow에는 기본적으로 테스트를 위해 유명한 데이터 셋을 제공해 줍니다. mnist도 포함되어 있습니다.
한번 어떤 데이터가 들어있는지 봅시다.
데이터 셋을 분석해봅시다.
최댓값과 최솟값을 확인해 봅시다.
데이터 타입은 uint8이고, 데이터 내의 최댓값은 255, 최솟값은 0입니다.
사실 이미지 형식의 데이터는 이론상 픽셀이 가질 수 있는 크기가 0 ~ 255입니다.
우리 데이터 셋에는 어떠한 값을 가지고 있는지 알아야 전처리 방법을 선택하기 쉽습니다.
데이터들을 그림으로 한 번 봅시다.
딱히 특별한 것은 없고, 그냥 숫자 그림입니다.
그러면, 이진화를 하면 될 것 같습니다. 굳이 다양한 값의 픽셀이 필요하지 않을 것 같네요.
10 이상의 픽셀은 그냥 1로 만들고, 나머지는 0으로 만들어야겠습니다.
끝.
코드:
기획: MNIST 데이터 셋을 이용하여, 손글씨 숫자를 맞추는 AI(인공지능) 만들기
이번 시간에는 데이터 셋(Dataset)을 불러오는 것과 전처리를 하는 것을 해보겠습니다.
tensorflow에는 기본적으로 테스트를 위해 유명한 데이터 셋을 제공해 줍니다. mnist도 포함되어 있습니다.
한번 어떤 데이터가 들어있는지 봅시다.
데이터 셋을 분석해봅시다.
최댓값과 최솟값을 확인해 봅시다.
데이터 타입은 uint8이고, 데이터 내의 최댓값은 255, 최솟값은 0입니다.
사실 이미지 형식의 데이터는 이론상 픽셀이 가질 수 있는 크기가 0 ~ 255입니다.
우리 데이터 셋에는 어떠한 값을 가지고 있는지 알아야 전처리 방법을 선택하기 쉽습니다.
데이터들을 그림으로 한 번 봅시다.
딱히 특별한 것은 없고, 그냥 숫자 그림입니다.
그러면, 이진화를 하면 될 것 같습니다. 굳이 다양한 값의 픽셀이 필요하지 않을 것 같네요.
10 이상의 픽셀은 그냥 1로 만들고, 나머지는 0으로 만들어야겠습니다.
끝.
코드:
카테고리: BlackSmith, Tensorflow
댓글
댓글 쓰기
궁금한 점은 댓글 달아주세요.
Comment if you have any questions.