본문 바로가기

AI & Data Analysis19

[EDA] Home-credit-default-risk Dataset https://www.kaggle.com/code/emilyjiminroh/eda-visualization-home-credit-default-risk 대출 상환 예측 데이터 https://www.kaggle.com/c/home-credit-default-risk 고객 정보를 기반으로 대출 상환 가능 여부 예측(0이면 상환 가능, 1이면 상환 불가능) 메인 테이블(application_train, application_test)만 사용 예정 linkcode 많은 사람들이 신용 기록이 부족하거나 존재하지 않아 대출을 받기 위해 애쓴다. 그리고 불행하게도, 이 인구는 종종 신뢰할 수 없는 대출자들에 의해 이용된다. 홈 크레딧은 긍정적이고 안전한 대출 경험을 제공함으로써 비은행 인구에 대한 금융 포함을 확대하.. 2022. 5. 27.
[EDA & Visualization] San_Francisco Data https://www.kaggle.com/code/emilyjiminroh/eda-visualization-san-francisco-notebook # This Python 3 environment comes with many helpful analytics libraries installed # It is defined by the kaggle/python Docker image: https://github.com/kaggle/docker-python # For example, here's several helpful packages to load import numpy as np # linear algebra import pandas as pd # data processing, CSV file I/O.. 2022. 3. 31.
[CNN] Fashion-Mnist-Data https://www.kaggle.com/code/emilyjiminroh/cnn-fashion-mnist Import 라이브러리 In [1]: import sys import os In [2]: from keras.datasets import mnist from keras.utils import np_utils # 원-핫 인코딩. np_utils.to_categorical(클래스, 클래스의 개수) In [3]: from keras.models import Sequential from keras.layers import Dense, Dropout, Flatten, Conv2D, MaxPooling2D from keras.callbacks import ModelCheckpoint, EarlyStopping.. 2022. 3. 31.
[모두의 딥러닝] #12장: 다중 분류 문제 해결하기 앞의 11장에서는 1과 0으로 나타낼 수 있는 이중 분류를 통해 데이터 분석을 진행했다. 하지만, 참과 거짓으로 모든 데이터를 정의내릴 수 없다. 그러므로 class가 3개 이상이 되는(ex. 노란색, 파란색, 초록색) 다중 분류 문제를 원-핫 인코딩법 그리고 소프트맥스를 적용해 해결해보는 법을 공부했다. 총 두 가지 실습을 진행했다. 1) 아이리스 꽃 분류 In [4]: # 라이브러리 설치 from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from sklearn.preprocessing import LabelEncoder In [5]: import pandas as pd import seabor.. 2022. 1. 25.
[모두의 딥러닝] #11장: 데이터 다루기 앞써 모델 설계하기에 대해 공부했다. 하지만 모델이 존재해도, 적용할 데이터의 가공이 잘 되어있지 않으면 무용지물이 된다. 그러므로 데이터를 이쁘게 목적에 맞게끔!! 다루는 법을 배우는 것이 무엇보다 중요하다. 이번 시간에는 어떤 데이터가 좋은 데이터이며, 목적에 맞추어 데이터를 가공하고 모델을 적용해 예측 결과를 나타내어, 최종적으로 어떻게 시각화 할 수 있는지에 대해 공부해 보았다. 11장 실습 코드) https://github.com/emilyjiminroh/2022_ai_winter_study/blob/main/chapter_11/ch11_Pima_Indian.ipynb GitHub - emilyjiminroh/2022_ai_winter_study: 모두의 딥러닝 교재를 바탕으로 AI Study .. 2022. 1. 25.
[모두의 딥러닝] #10장: 모델 설계하기 본격적인 딥러닝 모델 설계하기의 첫 걸음이다. tensorflow의 keras를 통해 모델을 설계하는 방법을 공부했다. 딥러닝 구조를 짜고, 층을 설정하고, 컴파일하는 방법, 또 실행하여 정확도를 출력하여 모델이 잘 구축되었는지 확인하며, 실습을 통해 더 알차게 공부할 수 있었다. 실습 코드) 폐암 수술 환자의 생존율 예측하기 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 7.. 2022. 1. 25.