AI study11 [EDA] Home-credit-default-risk Dataset https://www.kaggle.com/code/emilyjiminroh/eda-visualization-home-credit-default-risk 대출 상환 예측 데이터 https://www.kaggle.com/c/home-credit-default-risk 고객 정보를 기반으로 대출 상환 가능 여부 예측(0이면 상환 가능, 1이면 상환 불가능) 메인 테이블(application_train, application_test)만 사용 예정 linkcode 많은 사람들이 신용 기록이 부족하거나 존재하지 않아 대출을 받기 위해 애쓴다. 그리고 불행하게도, 이 인구는 종종 신뢰할 수 없는 대출자들에 의해 이용된다. 홈 크레딧은 긍정적이고 안전한 대출 경험을 제공함으로써 비은행 인구에 대한 금융 포함을 확대하.. 2022. 5. 27. [모두의 딥러닝] #12장: 다중 분류 문제 해결하기 앞의 11장에서는 1과 0으로 나타낼 수 있는 이중 분류를 통해 데이터 분석을 진행했다. 하지만, 참과 거짓으로 모든 데이터를 정의내릴 수 없다. 그러므로 class가 3개 이상이 되는(ex. 노란색, 파란색, 초록색) 다중 분류 문제를 원-핫 인코딩법 그리고 소프트맥스를 적용해 해결해보는 법을 공부했다. 총 두 가지 실습을 진행했다. 1) 아이리스 꽃 분류 In [4]: # 라이브러리 설치 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from sklearn.preprocessing import LabelEncoder In [5]: import pandas as pd import seabor.. 2022. 1. 25. [모두의 딥러닝] #11장: 데이터 다루기 앞써 모델 설계하기에 대해 공부했다. 하지만 모델이 존재해도, 적용할 데이터의 가공이 잘 되어있지 않으면 무용지물이 된다. 그러므로 데이터를 이쁘게 목적에 맞게끔!! 다루는 법을 배우는 것이 무엇보다 중요하다. 이번 시간에는 어떤 데이터가 좋은 데이터이며, 목적에 맞추어 데이터를 가공하고 모델을 적용해 예측 결과를 나타내어, 최종적으로 어떻게 시각화 할 수 있는지에 대해 공부해 보았다. 11장 실습 코드) https://github.com/emilyjiminroh/2022_ai_winter_study/blob/main/chapter_11/ch11_Pima_Indian.ipynb GitHub - emilyjiminroh/2022_ai_winter_study: 모두의 딥러닝 교재를 바탕으로 AI Study .. 2022. 1. 25. [모두의 딥러닝] #10장: 모델 설계하기 본격적인 딥러닝 모델 설계하기의 첫 걸음이다. tensorflow의 keras를 통해 모델을 설계하는 방법을 공부했다. 딥러닝 구조를 짜고, 층을 설정하고, 컴파일하는 방법, 또 실행하여 정확도를 출력하여 모델이 잘 구축되었는지 확인하며, 실습을 통해 더 알차게 공부할 수 있었다. 실습 코드) 폐암 수술 환자의 생존율 예측하기 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 7.. 2022. 1. 25. [모두의 딥러닝] #9장: 신경망에서 딥러닝으로 지금까지 오차를 줄이기 위한 방법 중 경사하강법에 집중해 공부했다. 하지만, 다층 퍼셉트론에 오차역전파가 사용될 때도 역시나,,, 한계점이 존재했는데.... 이 한계점이 바로 기울기 소실 문제이다. 활성화 함수의 미분값을 사용하여 가중치를 업데이트하게 되는데, 시그모이드 함수를 미분했을 때, 미분값은 점점 0에 가까워지는 것을 볼 수 있다... 결국, 층이 많아질수록 기울기가 소실되는 문제가 발생하게 된다. 이런 문제를 바탕으로 해결하기 위해 여러 고급 경사하강법이 개발되었는데...! 살펴보도록 하자~ 확률적 경사 하강법 적용실습) 데이터 로드 In [1]: import pandas as pd fish = pd.read_csv('https://bit.ly/fish_csv_data') fish_input .. 2022. 1. 22. [모두의 딥러닝] #8장: 오차는 다운! 정확도는 업! 오차역전파 이번 8장에는 오차를 낮추고 정확도를 높이는 과정을 역으로 업데이트하는 방식으로 수행하는 오차역전파에 대해 공부하겠다! 지금까지 공부했던 내용들 중에서도 가장 난이도가 높은... 그리고 수학적 이해가 상당히 필요한 챕터이기 때문에 공부하면서 유독 많은 시간을 할애했다... 이걸 보고 계신 여러분도.. 포기하지 마시고 화이팅~! XOR 문제 오차역전파로 해결하기) 신경망의 구현 과정 1 | 환경 변수 지정: 데이터셋(입력 값, 결괏값), 학습률, 활성화 함수, 가중치 포함. 2 | 신경망 실행: 초기값 입력 -> 활성화 함수, 가중치 -> 결과값 3 | 결과를 실제 값과 비교: 오차 측정 4 | 역전파 실행: 출력층, 은닉층의 가중치 수정 5 | 결과 출력 In [1]: # 라이브러리 import impo.. 2022. 1. 22. 이전 1 2 다음