반응형

Kaggle 5

유럽 축구 경기 및 선수 특징 추출을 통한 승부 예측

데이터 소개¶ - 이번 주제는 European Soccer Database 데이터셋을 사용합니다. - 다음 1개의 sqlite 데이터베이스를 사용합니다. database.sqlite - 데이터 베이스 내 총 7개의 Table을 사용합니다. Country: 국가 정보 League: 리그 정보 Match: 경기 정보 (주 데이터셋) Player: 플레이어 정보 Player_Attributes: 플레이어의 특성 Team: 팀 정보 Team_Attributes: 팀의 특성 데이터 출처: https://www.kaggle.com/hugomathien/soccer Step 0. 데이터베이스와 SQL¶ SQL과 Query¶ Step 1. 데이터셋 준비하기¶ In [1]: import pandas as pd impor..

Project & Kaggle 2021.04.02

데이터로 알아보는 리그 오브 레전드의 승리 예측 및 인사이트

주제 : 롤 좀 하니? '이것'만 하면 무조건 이긴다! - 데이터로 알아보는 리그 오브 레전드의 승리 공식 . 데이터 소개¶ - 이번 주제는 League of Legends Diamond Ranked Games (10 min) 데이터셋을 사용합니다. - 다음 1개의 csv 파일을 사용합니다. high_diamond_ranked_10min.csv - 각 파일의 컬럼은 아래와 같습니다. gameId: 게임 판의 고유 ID blueWins: 블루팀의 승리 여부 (0: 패배, 1: 승리) xxxWardsPlaced: xxx팀에서 설치한 와드의 수 xxxWardsDestroyed: xxx팀에서 파괴한 와드의 수 xxxFirstBlood: xxx팀의 첫번째 킬 달성 여부 xxxKills: xxx팀의 킬 수 xxxD..

Project & Kaggle 2021.02.09

심부전증 환자 데이터를 통한 사망 여부 Classification

주제 : 데이터 분석으로 심부전증을 예방할 수 있을까?¶ 데이터 소개¶ - 이번 주제는 Heart Failure Prediction 데이터셋을 사용합니다. - 다음 1개의 csv 파일을 사용합니다. heart_failure_clinical_records_dataset.csv - 각 파일의 컬럼은 아래와 같습니다. age: 환자의 나이 anaemia: 환자의 빈혈증 여부 (0: 정상, 1: 빈혈) creatinine_phosphokinase: 크레아틴키나제 검사 결과 diabetes: 당뇨병 여부 (0: 정상, 1: 당뇨) ejection_fraction: 박출계수 (%) high_blood_pressure: 고혈압 여부 (0: 정상, 1: 고혈압) platelets: 혈소판 수 (kiloplatelets..

Project & Kaggle 2021.02.01

전설의 포켓몬 Classification

%matplotlib inline import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings("ignore") df = pd.read_csv("https://raw.githubusercontent.com/yoonkt200/FastCampusDataset/master/Pokemon.csv") df.head() Feature Description Name : 포켓몬 이름 Type 1 : 포켓몬 타입 1 Type 2 : 포켓몬 타입 2 Total : 포켓몬 총 능력치 (Sum of Attack, Sp. Atk, Defense, Sp...

Project & Kaggle 2020.05.06

보스턴 집 값 예측 - Boston Housing price Regression

1. 분석 목적 Linear Regression을 활용하여 Boston Price를 예측하기 2.변수 설명 : Feature Description TOWN : 지역 이름 LON, LAT : 위도, 경도 정보 CMEDV : 해당 지역의 집값(중간값) CRIM : 근방 범죄율 ZN : 주택지 비율 INDUS : 상업적 비즈니스에 활용되지 않는 농지 면적 CHAS : 경계선에 강에 있는지 여부 NOX : 산화 질소 농도 RM : 자택당 평균 방 갯수 AGE : 1940 년 이전에 건설된 비율 DIS : 5 개의 보스턴 고용 센터와의 거리에 다른 가중치 부여 RAD : radial 고속도로와의 접근성 지수 TAX : 10000달러당 재산세 PTRATIO : 지역별 학생-교사 비율 B : 지역의 흑인 지수 (10..

Project & Kaggle 2020.04.24
반응형
반응형