What is Sequence_data & apply AI
Sequence data
자연에는 사건이 발생하는데, 이는 대부분 시간에 따른 원인에 의한 결과로써 발생하게 된다. 예를들어
-
오전에는 맑았는데 오후에는 흐리다.
-
상반기에는 잘 팔렸는데, 하반기에는 잘 안팔린다.
자연에는 사건이 발생하는데, 이는 대부분 시간에 따른 원인에 의한 결과로써 발생하게 된다. 예를들어
오전에는 맑았는데 오후에는 흐리다.
상반기에는 잘 팔렸는데, 하반기에는 잘 안팔린다.
머신러닝을 활용하기에 좋은 분야에 대하여 알아보겠습니다.
분류(classification)
정해진 카테고리 중 어디에 속하는지 알아내는 경우
종류
KNN(k-nearest neighbor)
결론은 .fit()을 통해 학습데이터(train)의 경향을 파악 및 저장하고 이 경향을 train, test data를 적용해 조정해주기 위함입니다.
데이터의 값의 범위를 조정하는 것
데이터의 경향, feature의 영향, 상관관계 등 데이터를 분석하는데 활용할 수 있으며, 인공지능 개발 중 학습단계에서 여러 feature의 영향도를 비슷한 수준으로 맞추기 위해 범위를 조정.
AI 모델링을 위해 X_train, X_test, y_train, y_test로 나누는 작업은 필수적입니다. 저는 train과 test를 나누는 코드를 직접 짜서 사용했었는데 scikit learn에서 제공되는 함수가 있었습니다. “train_test_split()"이를 알아보겠습니다.