🐷전동준(Jeon DongJun)

Go with the flow

[ML]sklearn 머신러닝 기초 및 복습

Big Data

4차 산업의 키워드
- 빅데이터
- AI
- IoT
  - 수 많은 컴퓨터들을 연결하는 것
- Cloud
  - 저장 공간(서버)를 구름 같은 형태로 만들어서 그 곳에 저장하는 것(개인의 컴퓨터 저장소가 아닌)
  - 종류
    - AWS
    - AZure
    - OracleCloud
    - GCP
    - NaverCloud

빅데이터

3V + 2V + 2V

초창기
- 3V
  - volume - 크기
  - variety - 다양한 형태
  - velocity - 속도
그 다음 5V(Visualization)
- 2V
  - veracity - 정확성
  - value - 가치
그 다음 7V 형태로 변화
- 2V
  - validity - 유효성
  - volatility - 휘발성

Architecture

데이터엔지니어가 해야할 일은 데이터의 전처리 과정이다.
- 수집
- 저장
- 처리
  - 처리 파트의 반 정도를 차지하는 이유는 ML(Machine Learning)을 사용하기도 하기 때문(Mahout)
수집 -> 저장 -> 처리하는 형태를 파이프라인(Pipeline)을 구축하는 것

AI

개념

Artificial Intelligence(인공 지능)

목표

System that Thinking humans
- 사람처럼 생각하길 바람
- 내부적으로
- 학습
System that Act like humans
- 사람처럼 행동하길 바람
- 외부적으로
- turing test

발전

1940년대	인공적인 두뇌의 가능성 -> 뇌(뉴런)을 모방해 간단한 연산 모델 구성
1950년대	황금기로 인공지능 학문이 탄생했으며 넓은 의미의 AI가 탄생했다.
1970년대	너무너무 복잡해서 잘 안되었던 시기
1980년대	비즈니스에 적용 실패
현재	제프리 힌튼 교수의 딥러닝으로 두 번째 황금기를 맞이했다. XOR 문제를 해결

XOR : x와 y의 값이 다르다면 1, 같다면 0
- 1과 0 : True
- 1과 1 : False
- 0과 0 : False
- 0과 1 : True

종류

AI > ML > DL
ML(Machine Learning)
- 함수를 기반으로 데이터 기반 프로그래밍
- 컴퓨터가 스스로 학습하게 만들도록 시키는 것
DL(Deep Learning)
- 인간의 뉴런을 참조한 것
지도 학습 - X(문제), Y(답) 둘다 줌
- 예측(Prediction - Linear[선형])
  - 연속적인 데이터
  - 수치 계산
  - 입력에 대한 예측
  - 데이터를 가장 잘 표현할 수 있는 선을 생성
- 분류(classification - logistic[분류])
  - 불연속적인 데이터
  - 확률 계산
  - 이진 분류 - 참/거짓
  - 다중 분류 - 가/나/다/라..
비지도 학습 - X만 줌
- 군집
강화 학습
- 보상

ML(머신러닝)

개념

기존 방식은 입력을 받고 그것을 함수에 넣어준 뒤 출력시켜주는 방식
- input x - > function -> output y
기계 학습
- training data (x, y) + Learning = Model(가설)
- 테스트 데이터 X 투입 -> Model(가설)에 적용 -> Y출력
- 학습
  - h(y) = W * x + b
  - Weight(가중치)와 Bias를 변경하는 일련의 과정

순서

데이터 준비
- 학습에 필요한 데이터를 준비하고 전처리 까지!
- 결측치, 이상치를 제거하거나 대체한다.(최빈값, 평균값, 중위값)
데이터 분할
- Train Set / Test set 으로 분리
- Training Sets : 모델 학습용 - > 여러 번 평가
- Test Sets : 모델 성능평가용 -> 한 번 평가
준비
- 사용할 모델을 결정하는 단계
- 예측, 군집,
학습
- 데이터를 가지고 모델을 학습하는 단계
예측 및 평가
- 모델을 검증하고 정확도를 측정하는 단계

Loss Function

손실함수
머신러닝은 컴퓨터가 가중치(Weight)를 찾아가는 과정
종류
- MSE(Mean Squared Error)
  - h(예측값)과 y(실제값)의 차이를 제곱해서 비교
- RMSE
- MAE(Mean Absolute Error)
  - h(예측값)과 y(실제값)의 차이를 절대값으로 비교
- Cross-Entropy
  - q(실제분포)를 알지 못하는 상황에서 p(예측 분포)를 통해 q를 예측
- 등

Optimizer

Loss Function의 결과값을 최소화 하는 모델의 인자를 찾는 알고리즘
경사 하강법(Gradient Descent), 관성(Momentum), 관성과 RMSProp을 합친 Adam 등이 있다.

머신러닝 지도학습

실습환경 준비 및 테스트

가상환경 생성
- conda create -n ai01 python=3.9
파이참 프로젝트 생성 후 만든 가상환경으로 세팅
01_sklearn 디렉토리 생성
하위에 파이썬 파일 생성

함수를 만들고 실행해보자

def f(x):
    return list(map(lambda i: 2 * i, x))
    
    
x = [1,2,3,4,5]
y = f(x)
    
print(y)

matplotlib 설치
- pip install matplotlib
모듈 호출
- ```
import matplotlib.pyplot as plt
```
화면에 출력
- ```
plt.plot(x,y)
plt.show()
```
머신러닝 실습할 파이썬 파일 생성
머신러닝 시 사용하는 라이브러리
- scikit learn
- tensorflow
- pytorch
scikit learn 라이브러리 설치
- pip install sklearn
- scikit-learn 공식 홈페이지
  - https://scikit-learn.org/stable/

모듈 호출

from sklearn.linear_model import LinearRegression
import numpy as np
import matplotlib.pyplot as plt

내용 작성

# 배열 생성
x = np.array([1,2,3,4,5])
y = np.array([2,4,6,8,10])
    
# 머신러닝 객체 생성
linear = LinearRegression()
    
# [1,2,3,4,5] -> [[1],[2],[3],[4],[5]] (세로형태)로 리쉐잎
print(x.reshape(-1, 1))
    
    
linear.fit(x.reshape(-1,1), y)
    
    
test_x = np.array([6,7,8,9,10])
predict = linear.predict(test_x.reshape(-1,1))
print(predict)
    
plt.plot(test_x, predict)
plt.show()

결과

[[1]
 [2]
 [3]
 [4]
 [5]]
[12. 14. 16. 18. 20.]

예측(Predict)

파라미터 : https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html#sklearn.linear_model.LinearRegression

실습 1

환경 구성

공공 데이터 포털의 국방부_육군 신체측청정보 csv파일 다운
- https://opendata.mnd.go.kr/openinf/sheetview2.jsp?infId=OA-9425
새로운 파이썬 파일 생성
받은 csv파일 soldiers.csv로 이름 변경 후 파이썬 파일과 같은 경로에 저장
몸무게와 키(신장)의 상관관계가 있는지 알아보려고 한다.
Pandas 패키지 설치
- pip install pandas
모듈 호출
- ```
import pandas as pd
```

데이터 준비

# 컬럼 네임들을 미리 리스트로 만들어 놓음
names = ['순번', 'date', '가슴둘레', '소매길이', 'height', '허리둘레', '살높이', '머리둘레', '발길이', 'weight']
  
# csv데이터를 불러옴
df = pd.read_csv('soldiers.csv', encoding='euc-kr', names=names, header=0, low_memory=False)
  
# 해당 컬럼만 가져와 다시 데이터프레임을 생성
df = df[['date','height','weight']]
  
  
print(len(df)) # 167983
  
# 결측치제거 : dropna 
#inplace=True는 df에 dropna가 적용된 것을 원본으로 바꿔버릴 때 사용
df.dropna(inplace=True)
  
print(len(df)) # 167983, 결측치가 없나 봄

년도만 남기기

    date    height   weight
     20140106   185.500   73.200
         2013   167.200   65.100
     20140106   179.900   93.200
         2013   171.400   71.600
     20140106   176.900   67.100

년도를 확인하면 4자리로 되있는 것을 확인할 수 있고, 년도만 있는 것과 월일도 포함 된 것이 있기 때문에 년도만 남겨서 값들에 적용해야한다.

df['date'] = list(map(lambda x: int(str(x)[:4]) if len(str(x)) > 4 else x , df['date']))
print(df)

    date    height   weight
     2014   185.500   73.200
     2013   167.200   65.100
     2014   179.900   93.200
     2013   171.400   71.600
     2014   176.900   67.100
...      ...       ...      ...

height 이쁘게 정리

소수점 이하 첫 째 자리까지 줄이고 cm가 있는 부분도 지워주자.

df['height'] = list(map(lambda x: float(str(x)[:5]) if len(str(x)) > 5 else x , df['height'] ))
print(df)

    date  height   weight
     2014   185.5   73.200
     2013   167.2   65.100
     2014   179.9   93.200
     2013   171.4   71.600
     2014   176.9   67.100
...      ...     ...      ...

몸무게 이쁘게 정리

float 형을 바꾸고 kg도 제거

df['weight'] = list(map(lambda x: str(x).split(' ')[0], df['weight']))

이렇게 하면 빈 문자열이 있는 셀들이 존재한다. 따라서 다른 람다함수를 적용

# 아예 공백이 있는 곳들은 None으로 적용시키고, 값이 있다면 float형으로 
df['weight'] = list(map(lambda x: float(x) if x else None, df['weight']))

그리고 결측치 제거 후 길이 확인
```
df.dropna(inplace=True)
print(len(df))
```
```
167957
```
길이가 줄어든 것을 확인할 수 있다.

무게와 신장 데이터 변수에 저장
- ```
X = df['weight']
y = df['height']
    
```

데이터 분할

트레이닝 세트와 테스트 세트를 분리해야 함

모듈 호출

from sklearn.model_selection import train_test_split   

분할

# random_state는 randomseed같은 것
train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3, random_state=1)
train_X = train_X.values.reshape(-1,1)
test_X = test_X.values.reshape(-1,1)
print(train_X)

   74.0
   84.0
   58.7
   90.2
160473    69.8
          ...
   77.5

준비

모듈 호출

from sklearn.linear_model import LinearRegression

선형 모델 생성
- ```
linear = LinearRegression()
```

학습

linear.fit()으로 트레인 세트 데이터들을 학습
```
linear.fit(train_X, train_y)
```

예측

# 모델 학습 정도를 확인하기 위해 예측 확인
predict = linear.predict(test_X)
print(test_X)
print(predict)

[[100.7]
 [ 59.7]
 [ 80.5]
 ...
 [ 68.8]
 [ 64.2]
 [ 68.3]]
[179.28084643 172.68043159 176.02893473 ... 174.14540171 173.40486737
 174.06490885]

그림으로 그려보자

모듈 호출
- ```
import matplotlib.pyplot as plt
```

코드 작성

plt.plot(test_X, test_y, 'b.')
plt.plot(test_X, predict, 'r.')
    
plt.xlim(20, 150)
plt.ylim(150, 220)
plt.grid()
    
    
plt.show()

그래프 확인

실습 2

실습1과 같은 데이터로
몸무게와 키로 년도와 상관관계가 있는지 확인해보자

데이터 준비

2013년을 0, 2014년을 1 … 2017년을 4로 바꿔 데이터프레임의 새로운 컬럼 date_new에 넣어준다.

df['date_new'] = list(map(lambda x: 0 if x == 2013 else 1 if x == 2014 else 2 if x == 2015 else 3 if x == 2016 else 4, df['date'])) 

새로운 컬럼date_new를 X에 적용

X = df[['weight', 'date_new']]
y = df['height']

예측

실습1과 동일하게 출력만 다르게
70키로에 2017년
- ```
print(linear.predict([[70, 4]]))
```

실습 3

실습 2에서 그대로 복사해 py 파일 생성

모듈 호출

from sklearn.preprocessing import PolynomialFeatures

데이터 준비

모듈 호출
- ```
import numpy as np
```
다항회귀 (PolynormialFeatures) : 특성이 두 개. 특성을 곱해서 다차원으로 바꾸는 것
- [1, a, b, a^2, ab, b^2] <– 이런 식으로
다항회귀 모델 생성
- ```
poly = PolynomialFeatures()
```
모델을 사용해 X 변경
- ```
X = poly.fit(X).transform(X)
```

데이터 분할

기존과 같으나 해당 부분 주석처리

# train_X = train_X.values.reshape(-1,1)
# test_X = test_X.values.reshape(-1,1)

예측

예측값을 다항회귀에 맞게 변경해서 넣어야한다.

print(linear.predict(poly.fit(np.array([[70,0]])).transform(np.array([[70,0]]))))

결과
- ```
[174.91721837]
```

그림으로 그려보기

빨간 줄이 곡선형태로 바뀜(^(제곱)이 있어서)

실습 4

새 파이썬파일 생성
공공데이터 포탈에서’교육부 학생건강검사 결과분석 rawdata 서울 2015’ csv 파일 다운
파일명 : weight_height.csv 으로 .py파일과 동일 경로에 위치

데이터 준비

데이터프레임 생성 후 확인

df = pd.read_csv('weight_height.csv', encoding='euc-kr')

    ID       최종가중치  학교ID      도시규모 도시규모별분석용   학년도 광역시도       시도별  ...  혈당식전mgdl 총콜레스테롤mgdl ASTUL  ALTUL  혈색소gdl 간염검사    수축기   이완기
0     Aa011남10101  169.550665  Aa01  대도시/중소도시   특별/광역시  2015   서울  서울특별시교육청  ...       NaN        NaN   NaN    NaN     NaN 
 NaN   77.0  58.0
1     Aa011남10102  169.550665  Aa01  대도시/중소도시   특별/광역시  2015   서울  서울특별시교육청  ...       NaN        NaN   NaN    NaN     NaN 
 NaN   83.0  51.0

컬럼 목록 확인

ID       최종가중치  학교ID      도시규모 도시규모별분석용   학년도 광역시도       시도별  ...  혈당식전mgdl 총콜레스테롤mgdl ASTUL  ALTUL  혈색소gdl 간염검사    수축기   이완기

학교명, 학년, 성별, 키, 몸무게 컬럼만 가져온 후 확인

df = df[['학교명','학년','성별','키','몸무게']]

    학교명  학년 성별      키   몸무게
   서울대도초등학교   1  남  125.8  27.3
   서울대도초등학교   1  남  124.3  25.4
   서울대도초등학교   1  남  119.2  23.5
   서울대도초등학교   1  남  115.0  20.0
   서울대도초등학교   1  남  120.0  33.5
...        ...  .. ..    ...   ...

결측치 제거하고 개수 확인

print(len(df))
df.dropna(inplace=True)
print(len(df))

```
9686
9682
```

데이터 프레임에 grade 컬럼 만들어 주기

조건
- 초등학교 0, 중학교 6, 고등학교 9
- 그 뒤에 학년을 더해주면 됨

작성 후 확인

df['grade'] = list(map(lambda x: 0 if x[-4:] == '초등학교' else 6 if x[-3:] == '중학교' else 9, df['학교명'])) + df['학년']

    학교명  학년 성별      키   몸무게  grade
   서울대도초등학교   1  남  125.8  27.3      1
   서울대도초등학교   1  남  124.3  25.4      1
   서울대도초등학교   1  남  119.2  23.5      1
   서울대도초등학교   1  남  115.0  20.0      1
   서울대도초등학교   1  남  120.0  33.5      1
...        ...  .. ..    ...   ...    ...
세종과학고등학교   3  남  176.1  50.4     12
세종과학고등학교   3  남  174.1  88.8     12
세종과학고등학교   3  남  169.5  63.2     12
세종과학고등학교   3  여  159.2  52.9     12
세종과학고등학교   3  여  162.0  67.7     12

grade 컬럼을 생성했으니 학교명과 학년 컬럼을 날려주고 확인

df.drop(['학교명','학년'], axis='columns', inplace=True)
print(df)

성별      키   몸무게  grade
   남  125.8  27.3      1
   남  124.3  25.4      1
   남  119.2  23.5      1
   남  115.0  20.0      1
   남  120.0  33.5      1
...  ..    ...   ...    ...
남  176.1  50.4     12

컬럼을 영문으로 변경

df.columns = ['gender', 'height', 'weight','grade']

gender가 남자면 0, 여자면 1로 변경

df['gender'] = list(map(lambda x: 0 if x == '남' else 1, df['gender']))

남자 여자 데이터프레임으로 나누기
- 조건 만들기 : 0이라면(남자라면) is_boy
  - is_boy = df['gender'] == 0
- not(~) 사용
  - boy_df, girl_df = df[is_boy], df[~is_boy]

남성의 키와 몸무게 변수로 저장

X = boy_df['weight']
y = boy_df['height']

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

트레이닝/테스트 셋으로 분할

# 테스트 사이즈는 0.3, random_state 1로 고정
train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3, random_state=1)

형태 변환

train_X = train_X.values.reshape(-1, 1)
test_X = test_X.values.reshape(-1, 1)

준비

모듈 호출

from sklearn.linear_model import LinearRegression

모델 생성
- ```
linear = LinearRegression()
```

학습

모델을 사용해 학습 :.fit()
- ```
linear.fit(train_X, train_y)
```

예측

.predict()로 예측

predict = linear.predict(test_X)
print(predict)
    

[148.4105717  159.22580237 147.91521762 ... 166.16075945 163.02351696
 168.05961674]

그래프

plt.plot(test_X, test_y, 'b.')
plt.plot(test_X, predict, 'r.')
  
plt.xlim(10, 140)
plt.ylim(100, 220)
  
plt.show()

실습 5

동일 파일로 다항회귀
몸무게와 성별이 무슨 관계가 있는지 알아보려고 함

데이터 준비

모듈 호출

from sklearn.preprocessing import PolynomialFeatures

변수 바꿔주기

X = df['weight','gender']
y = df['height']

폴리노미알 모델 생성

poly = PolynomialFeatures()
X = poly.fit(X).transform(X)

데이터 분할

동일하나 reshape 한거 주석처리

# train_X = train_X.values.reshape(-1, 1)
# test_X = test_X.values.reshape(-1, 1)
    

준비

동일

예측

동일

평가

.score로 평가

accuracy = linear.score(test_X, test_y)
print('acc:', accuracy)

```
acc: 0.8322697807454456
```

그래프 그리기

plt.plot(test_X, test_y, 'b.')
plt.plot(test_X, predict, 'r.')
  
plt.xlim(10, 140)
plt.ylim(100, 220)
  
plt.show()

실습 6

섭씨에도 화씨로 온도 변경

함수 작성

import numpy as np
    
def celsius_to_fahrenheit(x):
    return 9.0/ 5 * x + 32
    
data_C  = np.array(range(0, 100))
data_F = celsius_to_fahrenheit(data_C)
    
inp = int(input('섭씨 온도를 입력해 주세요 : '))
print(inp, '는 화씨',celsius_to_fahrenheit(inp), '입니다.')

결과

섭씨 온도를 입력해 주세요 : 8
8 는 화씨 46.4 입니다.

이 과정을 컴퓨터에게 학습시켜보자.

데이터 준비

```
X = data_C
y = data_F
```

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

테스트 사이즈 30%, 랜덤스테이츠 1로 고정

train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3, random_state=1)
train_X = train_X.reshape(-1, 1)
test_X = test_X.reshape(-1, 1)

준비

모듈 호출

from sklearn.linear_model import LinearRegression

모델 생성
- ```
linear = LinearRegression()
```

학습

```
linear.fit(train_X, train_y)
```

예측

predict= linear.predict(test_X)
  
pred_f = linear.predict([[30]])
print('30 to fahrenheit', pred_f)

```
30 to fahrenheit [86.]
```

평가

accuracy = linear.score(test_X, test_y)
print(accuracy)

```
1.0
```
학습된 것과 실제 값이 100% 일치 한다.(1.0)

분류(Logistic)

파라미터 : https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression

실습 1

데이터 준비

공부시간과 과외시간 형태로 배열을 만들어 준다.
X - 예 : 1시간 공부하고 0시간 과외하면 [1,0], 8시간 공부하고 1시간 과외하면 [8,1]
y - 만약, 시험에 떨어졌다면 [0], 붙었다면 [1]

X = [
    [1, 0],
    [2, 0],
    [5, 1],
    [2, 3],
    [3, 3],
    [8, 1],
    [10, 0]
]
  
y = [
    [0],
    [1],
    [0],
    [0],
    [1],
    [1],
    [1]
]

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

training, test 데이터 분할

train_X, test_X, train_y, test_y = train_test_split(X,y,test_size=0.3, random_state=1)

준비

모듈 호출

from sklearn.linear_model import LogisticRegression

분류 모델 생성
- ```
logistic = LogisticRegression()
```

학습

모듈 호출
- ```
import numpy as np
```

학습

logistic.fit(train_X, np.ravel(train_y))

여기서 잠깐, np.ravel()은 무슨 기능을 하나?: 다차원 배열을 1차원으로 바꾸는 기능을 한다. 예를 들어, a = [[1,2],[3,4]] 라는 배열이 있을 때 np.ravel(a)를 해주면 [1,2,3,4]의 형태로 바뀐다. 기존 a값의 원소가 바뀌면 ravel한 배열의 원소도 바뀐다는 점을 명심(얕은복사)하자!

예측

pred = logistic.predict(test_X)
  
for i in range(len(test_X)):
    print('{} 시간 공부 {} 시간 과외 : {}'.format(test_X[i][0], test_X[i][1], 'pass' if pred[i] == 1 else 'fail'))
  
print('acc :', logistic.score(test_X, test_y))

시간 공부 0 시간 과외 : pass
시간 공부 1 시간 과외 : pass
시간 공부 0 시간 과외 : fail
acc : 0.3333333333333333

데이터가 너무 적어서 예측결과가 신뢰도가 떨어질 수 있다.

실습 2

sklearn.dataset에는 다양한 데이터셋이 존재한다.
form sklearn.datasets import load_데이터셋명
그 중에서 iris데이터를 가져오자.

데이터 준비

모듈 호출
- ```
from sklearn.datasets import load_iris
```
데이터셋 저장
- ```
iris = load_iris()
```

feature명 확인

```
print(iris.feature_names)
```

['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']

target명 확인(꽃 세부 종류들)

```
print(iris.target_names)
```
```
['setosa' 'versicolor' 'virginica']
```

변수 설정
- ```
X = iris.data
y = iris.target
```

데이터프레임 생성

df = pd.DataFrame(X)
df.columns= ['sepal length', 'sepal_width', 'petal_length', 'petal_width']
df['category'] = pd.DataFrame(iris.target_names[y].reshape(-1))
    
print(df)

    sepal length  sepal_width  petal_length  petal_width   category
           5.1          3.5           1.4          0.2     setosa
           4.9          3.0           1.4          0.2     setosa
           4.7          3.2           1.3          0.2     setosa
           4.6          3.1           1.5          0.2     setosa
           5.0          3.6           1.4          0.2     setosa
..            ...          ...           ...          ...        ...
         6.7          3.0           5.2          2.3  virginica
         6.3          2.5           5.0          1.9  virginica
         6.5          3.0           5.2          2.0  virginica
         6.2          3.4           5.4          2.3  virginica
         5.9          3.0           5.1          1.8  virginica

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

트레이닝/테스트 세트로 분할

train_X, test_X, train_y, test_y = train_test_split(X,y, test_size=0.3, random_state=1)

준비

종을 분류할 것이기 때문에 LogisticRegression 활용

모듈 호출

from sklearn.linear_model import LogisticRegression

모델 생성
- ```
logistic = LogisticRegression()
```

학습

```
logistic.fit(train_X, train_y)
```

예측

pred = logistic.predict(test_X)
for i in range(len(test_X)):
    print(f'{test_X[i]} 예측 : {iris.target_names[pred[i]]} / 실제 : {iris.target_names[test_y[i]]}')

[5.8 4.  1.2 0.2] 예측 : setosa / 실제 : setosa
[5.1 2.5 3.  1.1] 예측 : versicolor / 실제 : versicolor
[6.6 3.  4.4 1.4] 예측 : versicolor / 실제 : versicolor
[5.4 3.9 1.3 0.4] 예측 : setosa / 실제 : setosa
[7.9 3.8 6.4 2. ] 예측 : virginica / 실제 : virginica
[6.3 3.3 4.7 1.6] 예측 : versicolor / 실제 : versicolor
[6.9 3.1 5.1 2.3] 예측 : virginica / 실제 : virginica
[5.1 3.8 1.9 0.4] 예측 : setosa / 실제 : setosa
[4.7 3.2 1.6 0.2] 예측 : setosa / 실제 : setosa
[6.9 3.2 5.7 2.3] 예측 : virginica / 실제 : virginica
....
...
...

평가

print(f'acc : {logistic.score(test_X, test_y)}')

```
acc : 0.9777777777777777
```
예측과 실제 값이 약 97.77777% 일치한다.

분류(KNN)

K-Nearest Neighbors
입력값에서 가장 가까운 k개의 데이터를 비교
k개 중 가장 많은 class로 분류
일반적으로 k는 홀수
파라미터 : https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html#sklearn.neighbors.KNeighborsClassifier

실습

데이터 준비

모듈 호출
- ```
from sklearn.datasets import load_iris
```

iris 데이터 불러와 데이터 지정

iris = load_iris()
X = iris.data
y = iris.target

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

트레이닝, 테스트 세트 분할

train_X, test_X, train_y, test_y = train_test_split(X,y,test_size=0.3,random_state=1)

준비

모듈 호출

from sklearn.neighbors import KNeighborsClassifier

모델 생성
- ```
model = KNeighborsClassifier()
    
```

학습

```
model.fit(train_X, train_y)
```

예측

pred = model.predict(test_X)
for i in range(len(test_X)):
    print(f'{test_X[i]} 예측 : {iris.target_names[pred[i]]} / 실제 : {iris.target_names[test_y[i]]}')

...
...
...
...
[6.3 2.9 5.6 1.8] 예측 : virginica / 실제 : virginica
[6.6 2.9 4.6 1.3] 예측 : versicolor / 실제 : versicolor

평가

print(f'acc : {model.score(test_X, test_y)}')

```
acc : 0.9777777777777777
```

분류(SVM)

Support Vector Machine
Margin이 최대화가 되는 결정 경계(초평면)을 정의
Hard Margin SVM
- 이상치를 허용하지 않음(overfitting)
- 진짜 꼼꼼하게 완벽하게 분류하려고하는거
Soft margin SVM
- 이상치를 어느정도 허용(underfitting)
Kernel Trick
- 차원을 추가하여 분류
파라미터 : https://scikit-learn.org/stable/modules/classes.html#module-sklearn.svm

실습

데이터 준비

모듈 호출
- ```
from sklearn.datasets import load_iris
```

데이터 준비

iris = load_iris()
X = iris.data
y = iris.target

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

트레이닝/테스트 세트 분할

train_X, test_X, train_y, test_y = train_test_split(X, y, test_size=0.3, random_state=1)

준비

모듈 호출
- ```
from sklearn.svm import SVC
```
SVM 모델 생성
- ```
model = SVC(kernel='linear')
```

학습

```
model.fit(train_X, train_y)
```

예측

pred = model.predict(test_X)
print(test_X)
print(pred)

[[5.8 4.  1.2 0.2]
 [5.1 2.5 3.  1.1]
 [6.6 3.  4.4 1.4]
 [5.4 3.9 1.3 0.4]
 [7.9 3.8 6.4 2. ]
 [6.3 3.3 4.7 1.6]
 [6.9 3.1 5.1 2.3]
 [5.1 3.8 1.9 0.4]
 [4.7 3.2 1.6 0.2]
 [6.9 3.2 5.7 2.3]
 [5.6 2.7 4.2 1.3]
 [5.4 3.9 1.7 0.4]
 [7.1 3.  5.9 2.1]
 [6.4 3.2 4.5 1.5]
 [6.  2.9 4.5 1.5]
 [4.4 3.2 1.3 0.2]
 [5.8 2.6 4.  1.2]
 [5.6 3.  4.5 1.5]
 [5.4 3.4 1.5 0.4]
 [5.  3.2 1.2 0.2]
 [5.5 2.6 4.4 1.2]
 [5.4 3.  4.5 1.5]
 [6.7 3.  5.  1.7]
 [5.  3.5 1.3 0.3]
 [7.2 3.2 6.  1.8]
 [5.7 2.8 4.1 1.3]
 [5.5 4.2 1.4 0.2]
 [5.1 3.8 1.5 0.3]
 [6.1 2.8 4.7 1.2]
 [6.3 2.5 5.  1.9]
 [6.1 3.  4.6 1.4]
 [7.7 3.  6.1 2.3]
 [5.6 2.5 3.9 1.1]
 [6.4 2.8 5.6 2.1]
 [5.8 2.8 5.1 2.4]
 [5.3 3.7 1.5 0.2]
 [5.5 2.3 4.  1.3]
 [5.2 3.4 1.4 0.2]
 [6.5 2.8 4.6 1.5]
 [6.7 2.5 5.8 1.8]
 [6.8 3.  5.5 2.1]
 [5.1 3.5 1.4 0.3]
 [6.  2.2 5.  1.5]
 [6.3 2.9 5.6 1.8]
 [6.6 2.9 4.6 1.3]]
[0 1 1 0 2 1 2 0 0 2 1 0 2 1 1 0 1 1 0 0 1 1 1 0 2 1 0 0 1 2 1 2 1 2 2 0 1
 0 1 2 2 0 2 2 1]

평가

```
print(model.score(test_X, test_y))
```
```
1.0
```

분류(Decision Tree)

Decision Tree
질문(Node)에 대한 답(참/거짓)을 반복해 분류
불순도(impurity)가 낮아지는 방향으로 진행(스무고개를 생각하면 될듯)
질문이 너무 많아지면 과적합에 빠질 수 있다.
파라미터 : https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html#sklearn.tree.DecisionTreeClassifier

실습

데이터 준비

모듈 호출
- ```
from sklearn.datasets import load_iris
```

데이터 준비

iris = load_iris()
X = iris.data
y = iris.target

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

트레이닝 테스트 데이터 분할

train_X, test_X, train_y, test_y = train_test_split(X,y,test_size=0.3, random_state=1)

준비

모듈 호출

from sklearn.tree import DecisionTreeClassifier

결정트리 모델 생성
- ```
model = DecisionTreeClassifier()
```

학습

```
model.fit(train_X, train_y)
```

예측

pred = model.predict(test_X)
for i in range(len(test_X)):
    print(f'{test_X[i]} : {pred[i]}')

[5.8 4.  1.2 0.2] : 0
[5.1 2.5 3.  1.1] : 1
[6.6 3.  4.4 1.4] : 1
[5.4 3.9 1.3 0.4] : 0
[7.9 3.8 6.4 2. ] : 2
[6.3 3.3 4.7 1.6] : 1
[6.9 3.1 5.1 2.3] : 2
[5.1 3.8 1.9 0.4] : 0
[4.7 3.2 1.6 0.2] : 0
[6.9 3.2 5.7 2.3] : 2
[5.6 2.7 4.2 1.3] : 1
[5.4 3.9 1.7 0.4] : 0
[7.1 3.  5.9 2.1] : 2
[6.4 3.2 4.5 1.5] : 1
[6.  2.9 4.5 1.5] : 1
[4.4 3.2 1.3 0.2] : 0
[5.8 2.6 4.  1.2] : 1
[5.6 3.  4.5 1.5] : 1
[5.4 3.4 1.5 0.4] : 0
[5.  3.2 1.2 0.2] : 0
[5.5 2.6 4.4 1.2] : 1
[5.4 3.  4.5 1.5] : 1
[6.7 3.  5.  1.7] : 2
[5.  3.5 1.3 0.3] : 0
[7.2 3.2 6.  1.8] : 2
[5.7 2.8 4.1 1.3] : 1
[5.5 4.2 1.4 0.2] : 0
[5.1 3.8 1.5 0.3] : 0
[6.1 2.8 4.7 1.2] : 1
[6.3 2.5 5.  1.9] : 2
[6.1 3.  4.6 1.4] : 1
[7.7 3.  6.1 2.3] : 2
[5.6 2.5 3.9 1.1] : 1
[6.4 2.8 5.6 2.1] : 2
[5.8 2.8 5.1 2.4] : 2
[5.3 3.7 1.5 0.2] : 0
[5.5 2.3 4.  1.3] : 1
[5.2 3.4 1.4 0.2] : 0
[6.5 2.8 4.6 1.5] : 1
[6.7 2.5 5.8 1.8] : 2
[6.8 3.  5.5 2.1] : 2
[5.1 3.5 1.4 0.3] : 0
[6.  2.2 5.  1.5] : 1
[6.3 2.9 5.6 1.8] : 2
[6.6 2.9 4.6 1.3] : 1

평가

```
print(model.score(test_X, test_y))
```
```
0.9555555555555556
```

분류(Random Forest)

여러 개의 결정 트리를 연결(앙상블)
Bagging(Bootstrap AGGregatING)
임의의 부분집합(Forest) -> 각 결정 트리(Decision Tree)의 결과를 더해서 분류
파라미터 : https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html#sklearn.ensemble.RandomForestClassifier

실습

데이터 준비

모듈 호출
- ```
from sklearn.datasets import load_iris
```

iris 데이터 준비

iris = load_iris()
X = iris.data
y = iris.target

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

트레이닝/테스트 데이터 셋으로 분할

train_X, test_X, train_y, test_y = train_test_split(X,y,test_size=0.3,random_state=1)

준비

랜덤포레스트 모듈 호출

from sklearn.ensemble import RandomForestClassifier

랜덤포레스트 모델 생성
- ```
model = RandomForestClassifier()
```

학습

문제와 답을 넣어 줌
```
model.fit(train_X, train_y)
```

예측

pred = model.predict(test_X)
print(test_X)
print(pred)

[[5.8 4.  1.2 0.2]
 [5.1 2.5 3.  1.1]
 [6.6 3.  4.4 1.4]
 [5.4 3.9 1.3 0.4]
 [7.9 3.8 6.4 2. ]
 [6.3 3.3 4.7 1.6]
 [6.9 3.1 5.1 2.3]
 [5.1 3.8 1.9 0.4]
 [4.7 3.2 1.6 0.2]
 [6.9 3.2 5.7 2.3]
 [5.6 2.7 4.2 1.3]
 [5.4 3.9 1.7 0.4]
 [7.1 3.  5.9 2.1]
 [6.4 3.2 4.5 1.5]
 [6.  2.9 4.5 1.5]
 [4.4 3.2 1.3 0.2]
 [5.8 2.6 4.  1.2]
 [5.6 3.  4.5 1.5]
 [5.4 3.4 1.5 0.4]
 [5.  3.2 1.2 0.2]
 [5.5 2.6 4.4 1.2]
 [5.4 3.  4.5 1.5]
 [6.7 3.  5.  1.7]
 [5.  3.5 1.3 0.3]
 [7.2 3.2 6.  1.8]
 [5.7 2.8 4.1 1.3]
 [5.5 4.2 1.4 0.2]
 [5.1 3.8 1.5 0.3]
 [6.1 2.8 4.7 1.2]
 [6.3 2.5 5.  1.9]
 [6.1 3.  4.6 1.4]
 [7.7 3.  6.1 2.3]
 [5.6 2.5 3.9 1.1]
 [6.4 2.8 5.6 2.1]
 [5.8 2.8 5.1 2.4]
 [5.3 3.7 1.5 0.2]
 [5.5 2.3 4.  1.3]
 [5.2 3.4 1.4 0.2]
 [6.5 2.8 4.6 1.5]
 [6.7 2.5 5.8 1.8]
 [6.8 3.  5.5 2.1]
 [5.1 3.5 1.4 0.3]
 [6.  2.2 5.  1.5]
 [6.3 2.9 5.6 1.8]
 [6.6 2.9 4.6 1.3]]
[0 1 1 0 2 1 2 0 0 2 1 0 2 1 1 0 1 1 0 0 1 1 2 0 2 1 0 0 1 2 1 2 1 2 2 0 1
 0 1 2 2 0 1 2 1]

평가

```
print(model.score(test_X,test_y))
```
```
0.9555555555555556
```
- 학습된 것과 실제 값이 95.6% 일치한다.

분류(Ensemble)

여러 개의 모델을 결합하여 결과를 도출하는 모델
Voting : 각각 다른 모델들의 결과를 다수결로 선택
Bagging : 같은 모델을 여러 개 병렬로 실행하여 선형 결합
Boosting : 가벼운 모델을 순차적으로 학습하여 결과 도출

머신러닝 비지도 학습

군집(clustering) - K-mean

k개의 중심(Centroid)을 랜덤으로 지정
- 각 데이터들을 가장 가까운 그룹(cluster)에 할당
- 위의 단계를 반복하여 변경되는 데이터가 없을 때 까지 반복
각 데이터의 그룹과 중심의 거리 차이의 분산을 최소화
파라미터 : https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html#sklearn.cluster.KMeans

실습

데이터 준비

모듈 호출
- ```
from sklearn.datasets import load_iris
```

iris 데이터 준비

iris = load_iris()
X = iris.data
y = iris.target

데이터 분할

모듈 호출

from sklearn.model_selection import train_test_split

트레이닝/테스트 데이터 세트 분할(테스트 사이즈는 30%, 랜덤스테이츠는 1)
- ```
train_X, test_X, train_y, test_y = train_test_split(X,y,test_size=0.3,random_state=1)
```

준비

모듈 호출
- ```
from sklearn.cluster import KMeans
```
K-means 모델 생성
- 분류하고자 하는 개수가 3개이기 때문에 n_clusters=3 (setosa, verginica, vergi~)
- ```
model = KMeans(n_clusters=3)
```

학습

k-mean(군집)은 중심을 알아서 찾기 때문에(비지도) 문제만 넣고 답을 넣어주지 않아도 데이터를 알아서 넣어준다.
- 문제(train_X)만 학습시켜주면 된다.
- ```
model.fit(train_X)
```

예측

pred = model.predict(test_X)
print(test_X)
print(pred)

[[5.8 4.  1.2 0.2]
 [5.1 2.5 3.  1.1]
 [6.6 3.  4.4 1.4]
 [5.4 3.9 1.3 0.4]
 [7.9 3.8 6.4 2. ]
 [6.3 3.3 4.7 1.6]
 [6.9 3.1 5.1 2.3]
 [5.1 3.8 1.9 0.4]
 [4.7 3.2 1.6 0.2]
 [6.9 3.2 5.7 2.3]
 [5.6 2.7 4.2 1.3]
 [5.4 3.9 1.7 0.4]
 [7.1 3.  5.9 2.1]
 [6.4 3.2 4.5 1.5]
 [6.  2.9 4.5 1.5]
 [4.4 3.2 1.3 0.2]
 [5.8 2.6 4.  1.2]
 [5.6 3.  4.5 1.5]
 [5.4 3.4 1.5 0.4]
 [5.  3.2 1.2 0.2]
 [5.5 2.6 4.4 1.2]
 [5.4 3.  4.5 1.5]
 [6.7 3.  5.  1.7]
 [5.  3.5 1.3 0.3]
 [7.2 3.2 6.  1.8]
 [5.7 2.8 4.1 1.3]
 [5.5 4.2 1.4 0.2]
 [5.1 3.8 1.5 0.3]
 [6.1 2.8 4.7 1.2]
 [6.3 2.5 5.  1.9]
 [6.1 3.  4.6 1.4]
 [7.7 3.  6.1 2.3]
 [5.6 2.5 3.9 1.1]
 [6.4 2.8 5.6 2.1]
 [5.8 2.8 5.1 2.4]
 [5.3 3.7 1.5 0.2]
 [5.5 2.3 4.  1.3]
 [5.2 3.4 1.4 0.2]
 [6.5 2.8 4.6 1.5]
 [6.7 2.5 5.8 1.8]
 [6.8 3.  5.5 2.1]
 [5.1 3.5 1.4 0.3]
 [6.  2.2 5.  1.5]
 [6.3 2.9 5.6 1.8]
 [6.6 2.9 4.6 1.3]]
[0 1 1 0 2 1 2 0 0 2 1 0 2 1 1 0 1 1 0 0 1 1 2 0 2 1 0 0 1 1 1 2 1 2 1 0 1
 0 1 2 2 0 1 2 1]

그래프 그리기

df = pd.DataFrame(test_X)
df.columns = ['sepal_length','sepal_width','petal_length','petal_width']
df['category'] = pd.DataFrame(pred)
  
  
centers = pd.DataFrame(model.cluster_centers_)
centers.columns = ['sepal_length','sepal_width','petal_length','petal_width']
center_X = centers['sepal_length']
center_y = centers['sepal_width']
  
plt.scatter(df['sepal_length'], df['sepal_width'], c=df['category'])
plt.scatter(center_X, center_y, s=100, c='r', marker='*')
plt.show()

2022 196
2021 22

2022

[Linux]부트캠프 - 파일 및 폴더 생성

2022-12-21 1 분 소요

파일 및 폴더 생성

[Linux]부트캠프 - 파일 시스템 탐색

2022-12-20 1 분 소요

파일 시스템 탐색

[Linux]부트캠프 - 도움말(man)

2022-12-15 최대 1 분 소요

도움말(man -> manual)

[Linux]부트캠프 - 명령어 기초

2022-12-14 1 분 소요

명령어 기초

[Linux]부트캠프 - 시작

2022-12-13 1 분 소요

유닉스(Unix)

[Swift]특정 코드 지연(delay) 후에 실행시키기

2022-11-17 최대 1 분 소요

특정 코드 지연 실행 - DispatchQueue.main.asyncAfter(deadline: )

[Swift]Naming Conventions, Commenting, Print Statement

2022-11-14 최대 1 분 소요

Naming Conventions

[Mac]안드로이드 폰과 맥북 USB 테더링 성공

2022-11-13 최대 1 분 소요

안드로이드 폰과 맥북에어 M1 USB 테더링 성공

[Xcode]xcode 시뮬레이터를 풀스크린으로 사용하는 방법

2022-11-02 최대 1 분 소요

Simulator 풀 스크린 사용 방법

[BOJ/백준-Python]10807번 - 개수 세기

2022-10-28 1 분 소요

10807번 - 개수 세기

[프로그래머스]Swift - Lv.1 풀이 코드 모음

2022-10-24 최대 1 분 소요

프로그래머스 Lv.1 풀이 코드 모음

[프로그래머스]파이썬 - Lv.1 풀이 코드 모음

2022-09-14 6 분 소요

프로그래머스 Lv.1 풀이 코드 모음

[BOJ/백준-Python]11047번 - 동전 0

2022-08-22 1 분 소요

11047번 - 동전 0

[BOJ/백준-Python]11659번 - 구간 합 구하기 4

2022-08-21 1 분 소요

11659번 - 구간 합 구하기 4

[BOJ/백준-Python]14888번 - 연산자 끼워넣기

2022-08-20 2 분 소요

14888번 - 연산자 끼워넣기

[BOJ/백준-Python]9184번 - 신나는 함수 실행

2022-08-19 1 분 소요

9184번 - 신나는 함수 실행

[BOJ/백준-Python]24416번 - 알고리즘 수업 - 피보나치수 1

2022-08-18 1 분 소요

24416번 - 알고리즘 수업 - 피보나치 수 1

[BOJ/백준-Python]2580번 - 스도쿠

2022-08-17 4 분 소요

2580번 - 스도쿠

[BOJ/백준-Python]9663번 - N-Queen

2022-08-16 1 분 소요

9663번 - N-Queen

[BOJ/백준-Python]15652번 - N과 M (4)

2022-08-15 1 분 소요

15652번 - N과 M (4)

[BOJ/백준-Python]15651번 - N과 M (3)

2022-08-14 1 분 소요

15651번 - N과 M (3)

[BOJ/백준-Python]15650번 - N과 M (2)

2022-08-13 1 분 소요

15650번 - N과 M (2)

[BOJ/백준-Python]25305번 - 커트라인

2022-08-12 1 분 소요

25305번 - 커트라인

[BOJ/백준-Python]25304번 - 영수증

2022-08-11 1 분 소요

25304번 - 영수증

[BOJ/백준-Python]3003번 - 킹, 퀸, 룩, 비숍, 나이트, 폰

2022-08-10 1 분 소요

3003번 - 킹, 퀸, 룩, 비숍, 나이트, 폰

[BOJ/백준-Python]15649번 - N과 M (1)

2022-08-09 1 분 소요

15649번 - N과 M (1)

[BOJ/백준-Python]2004번 - 조합 0의 개수

2022-08-08 1 분 소요

2004번 - 조합 0의 개수

[BOJ/백준-Python]1676번 - 팩토리얼 0의 개수

2022-08-07 최대 1 분 소요

1676번 - 팩토리얼 0의 개수

[BOJ/백준-Python]9375번 - 패션왕 신해빈

2022-08-06 2 분 소요

9375번 - 패션왕 신해빈

[BOJ/백준-Python]1010번 - 다리 놓기

2022-08-05 1 분 소요

1010번 - 다리 놓기

[BOJ/백준-Python]11051번 - 이항 계수 2

2022-08-04 1 분 소요

11051번 - 이항 계수 2

[BOJ/백준-Python]11050번 - 이항 계수 1

2022-08-03 1 분 소요

11050번 - 이항 계수 1

[BOJ/백준-Python]3036번 - 링

2022-08-02 2 분 소요

3036번 - 링

[BOJ/백준-Python]2981번 - 검문

2022-08-01 4 분 소요

2981번 - 검문

[BOJ/백준-Python]1934번 - 최소공배수

2022-07-31 1 분 소요

1934번 - 최소공배수

[BOJ/백준-Python]2609번 - 최대공약수와 최소공배수

2022-07-30 최대 1 분 소요

2609번 - 최대공약수와 최소공배수

[BOJ/백준-Python]1037번 - 약수

2022-07-29 1 분 소요

1037번 - 약수

[BOJ/백준-Python]5086번 - 배수와 약수

2022-07-28 1 분 소요

5086번 - 배수와 약수

[BOJ/백준-Python]1358번 - 하키

2022-07-27 3 분 소요

1358번 - 하키

[BOJ/백준-Python]1004번 - 어린 왕자

2022-07-26 3 분 소요

1004번 - 어린 왕자

[BOJ/백준-Python]1002번 - 터렛

2022-07-24 2 분 소요

1002번 - 터렛

[BOJ/백준-Python]3053번 - 택시 기하학

2022-07-23 1 분 소요

3053번 - 택시 기하학

[BOJ/백준-Python]2477번 - 참외밭

2022-07-22 3 분 소요

2477번 - 참외밭

[BOJ/백준-Python]4153번 - 직각삼각형

2022-07-21 1 분 소요

4153번 - 직각삼각형

[BOJ/백준-Python]3009번 - 네 번째 점

2022-07-20 1 분 소요

3009번 - 네 번째 점

[BOJ/백준-Python]1085번 - 직사각형에서 탈출

2022-07-19 2 분 소요

1085번 - 직사각형에서 탈출

[BOJ/백준-Python]11478번 - 서로 다른 부분 문자열의 개수

2022-07-18 1 분 소요

11478번 - 서로 다른 부분 문자열의 개수

[BOJ/백준-Python]1269번 - 대칭 차집합

2022-07-17 1 분 소요

1269번 - 대칭 차집합

[BOJ/백준-Python]1764번 - 듣보잡

2022-07-15 1 분 소요

1764번 - 듣보잡

[BOJ/백준-Python]10816번 - 숫자 카드 2

2022-07-14 1 분 소요

10816번 - 숫자 카드 2

[BOJ/백준-Python]1620번 - 나는야 포켓몬 마스터 이다솜

2022-07-13 4 분 소요

1620번 - 나는야 포켓몬 마스터 이다솜

[BOJ/백준-Python]14425번 - 문자열 집합

2022-07-12 1 분 소요

14425번 - 문자열 집합

[BOJ/백준-Python]10815번 - 숫자 카드

2022-07-10 1 분 소요

10815번 - 숫자 카드

[BOJ/백준-Python]18870번 - 좌표 압축

2022-07-09 1 분 소요

18870번 - 좌표 압축

[BOJ/백준-Python]10814번 - 나이순 정렬

2022-07-08 1 분 소요

10814번 - 나이순 정렬

[BOJ/백준-Python]1181번 - 단어 정렬

2022-07-07 1 분 소요

1181번 - 단어 정렬

[BOJ/백준-Python]11651번 - 좌표 정렬하기2

2022-07-06 1 분 소요

11651번 - 좌표 정렬하기 2

[BOJ/백준-Python]11650번 - 좌표 정렬하기

2022-07-05 2 분 소요

11650번 - 좌표 정렬하기

[BOJ/백준-Python]1427번 - 소트인사이드

2022-07-04 1 분 소요

1427번 - 소트인사이드

[BOJ/백준-Python]2108번 - 통계학

2022-07-02 2 분 소요

2108번 - 통계학

[BOJ/백준-Python]10989번 - 수 정렬하기 3

2022-06-30 1 분 소요

10989번 - 수 정렬하기 3

[BOJ/백준-Python]2751번 - 수 정렬하기 2

2022-06-29 최대 1 분 소요

2751번 - 수 정렬하기 2

[BOJ/백준-Python]2750번 - 수 정렬하기

2022-06-28 1 분 소요

2750번 - 수 정렬하기

[잡동사니]22년 부산 먹부림 기록

2022-06-28 최대 1 분 소요

22.06.25 ~ 27 부산 먹부림 기록

[BOJ/백준-Python]1436번 - 영화감독 숌

2022-06-24 2 분 소요

1436번 - 영화감독 숌

[BOJ/백준-Python]1018번 - 체스판 다시 칠하기

2022-06-23 4 분 소요

1018번 - 체스판 다시 칠하기

[BOJ/백준-Python]7568번 - 덩치

2022-06-22 2 분 소요

7568번 - 덩치

[BOJ/백준-Python]2231번 - 분해합

2022-06-21 1 분 소요

2231번 - 분해합

[BOJ/백준-Python]2798번 - 블랙잭

2022-06-20 3 분 소요

2798번 - 블랙잭

[BOJ/백준-Python]11729번 - 하노이 탑 이동 순서

2022-06-19 4 분 소요

11729번 - 하노이 탑 이동 순서

[BOJ/백준-Python]2447번 - 별 찍기 - 10

2022-06-18 3 분 소요

2447번 - 별 찍기 - 10

[BOJ/백준-Python]17478번 - 재귀함수가 뭔가요?

2022-06-17 4 분 소요

17478번 - 재귀함수가 뭔가요?

[BOJ/백준-Python]10870번 - 피보나치 수 5

2022-06-16 1 분 소요

10870번 - 피보나치 수 5

[HackerRank(해커랭크)/SQL]내가 푼 MySQL 쿼리 기록 - 3

2022-06-15 1 분 소요

[BOJ/백준-Python]10872번 - 팩토리얼

2022-06-15 1 분 소요

10872번 - 팩토리얼

[HackerRank(해커랭크)/SQL]내가 푼 MySQL 쿼리 기록 - 2

2022-06-14 최대 1 분 소요

[BOJ/백준-Python]9020번 - 골드바흐의 추측

2022-06-14 2 분 소요

9020번 - 골드바흐의 추측

[BOJ/백준-Python]4948번 - 베르트랑 공준

2022-06-13 2 분 소요

4948번 - 베르트랑 공준

[BOJ/백준-Python]1929번 - 소수 구하기

2022-06-12 1 분 소요

1929번 - 소수 구하기

[HackerRank(해커랭크)/SQL]내가 푼 MySQL 쿼리 기록 - 1

2022-06-11 1 분 소요

[BOJ/백준-Python]11653번 - 소인수분해

2022-06-11 1 분 소요

11653번 - 소인수분해

[BOJ/백준-Python]2581번 - 소수

2022-06-10 1 분 소요

2581번 - 소수

[BOJ/백준-Python]1978번 - 소수 찾기

2022-06-09 1 분 소요

1978번 - 소수 찾기

[BOJ/백준-Python]10757번 - 큰 수 A+B

2022-06-08 최대 1 분 소요

10757번 - 큰 수 A+B

[BOJ/백준-Python]2839번 - 설탕 배달

2022-06-06 2 분 소요

2839번 - 설탕 배달

[BOJ/백준-Python]2775번 - 부녀회장이 될테야

2022-06-05 2 분 소요

2775번 - 부녀회장이 될테야

[BOJ/백준-Python]10250번 - ACM 호텔

2022-06-04 4 분 소요

10250번 - ACM 호텔

[BOJ/백준-Python]2869번 - 달팽이는 올라가고 싶다

2022-06-03 2 분 소요

2869번 - 달팽이는 올라가고 싶다

[BOJ/백준-Python]1193번 - 분수찾기

2022-06-02 4 분 소요

1193번 - 분수찾기

[BOJ/백준-Python]2292번 - 벌집

2022-06-01 1 분 소요

2292번 - 벌집

[BOJ/백준-Python]1712번 - 손익분기점

2022-05-31 2 분 소요

1712번 - 손익분기점

[BOJ/백준-Python]1316번 - 그룹 단어 체커

2022-05-31 2 분 소요

1316번 - 그룹 단어 체커

[BOJ/백준-Python]2941번 - 크로아티아 알파벳

2022-05-30 1 분 소요

2941번 - 크로아티아 알파벳

[BOJ/백준-Python]5622번 - 다이얼

2022-05-29 2 분 소요

5622번 - 다이얼

[BOJ/백준-Python]2908번 - 상수

2022-05-28 1 분 소요

2908번 - 상수

[BOJ/백준-Python]1152번 - 단어의 개수

2022-05-27 1 분 소요

1152번 - 단어의 개수

[BOJ/백준-Python]1157번 - 단어 공부

2022-05-26 2 분 소요

1157번 - 단어 공부

[BOJ/백준-Python]2675번 - 문자열 반복

2022-05-25 1 분 소요

2675번 - 문자열 반복

[BOJ/백준-Python]10809번 - 알파벳 찾기

2022-05-24 1 분 소요

10809번 - 알파벳 찾기

[BOJ/백준-Python]11720번 - 숫자의 합

2022-05-23 1 분 소요

11720번 - 숫자의 합

[BOJ/백준-Python]11654번 - 아스키 코드

2022-05-22 1 분 소요

11654번 - 아스키 코드

[BOJ/백준-Python]1065번 - 한수

2022-05-20 1 분 소요

1065번 - 한수

[BOJ/백준-Python]4673번 - 셀프 넘버

2022-05-19 2 분 소요

4673번 - 셀프 넘버

[BOJ/백준-Python]15596번 - 정수 N개의 합

2022-05-18 1 분 소요

15596번 - 정수 N개의 합

[BOJ/백준-Python]4344번 - 평균은 넘겠지

2022-05-17 2 분 소요

4344번 - 평균은 넘겠지

[BOJ/백준-Python]8958번 - OX퀴즈

2022-05-16 1 분 소요

8958번 - OX퀴즈

[BOJ/백준-Python]25083번 - 새싹

2022-05-15 최대 1 분 소요

25083번 - 새싹

[Spark]파이프라인 만들기 코드 요약

2022-03-17 3 분 소요

Spark Bigdata Pipeline

[Spark]스파크 복습 - 4(Streaming/Mlib/번외/파이프라인)

2022-03-17 8 분 소요

Spark 4일차

[Spark]스파크 복습 - 3(DataFrame/Spark SQL)

2022-03-16 2 분 소요

Spark 3일차

[Spark]스파크 복습 - 2(DataFrame/Spark SQL)

2022-03-15 12 분 소요

Spark 2일차

[BOJ/백준-Python]1546번 - 평균

2022-03-15 2 분 소요

1546번 - 평균

[Spark]스파크 복습 - 1(RDD)

2022-03-14 4 분 소요

Spark 1일차

[Spark]하둡과 스파크 개념/설치

2022-03-14 6 분 소요

Hadoop🐘

[BOJ/백준-Python]3052번 - 나머지

2022-03-14 1 분 소요

3052번 - 나머지

[BOJ/백준-Python]2577번 - 숫자의 개수

2022-03-12 1 분 소요

2577번 - 숫자의 개수

[BOJ/백준-Python]2562번 - 최댓값

2022-03-12 1 분 소요

2562번 - 최댓값

[BOJ/백준-Python]10818번 - 최소, 최대

2022-03-12 1 분 소요

10818번 - 최소, 최대

[Linux]Ubuntu 기초

2022-03-11 6 분 소요

Linux

[MongDB]조회문제 숙제 풀이

2022-03-11 4 분 소요

MongoDB 조회 문제

[MongDB]MongoDB 강의 내용 정리

2022-03-10 13 분 소요

MongoDB

[BOJ/백준-Python]1110번 - 더하기 사이클

2022-03-09 3 분 소요

1110번 - 더하기 사이클

[BOJ/백준-Python]10951번 - A+B - 4

2022-03-09 최대 1 분 소요

10951번 - A+B - 4

[Oracle]오라클 강의내용 복습 3일차

2022-03-08 8 분 소요

Oracle 3️⃣

[Oracle]오라클 문제만들기 숙제

2022-03-08 2 분 소요

ORACLE 연습용 문제 만들기 숙제

[BOJ/백준-Python]10952번 - A+B - 5

2022-03-08 1 분 소요

10952번 - A+B - 5

[Oracle]오라클 강의내용 복습 2일차

2022-03-07 14 분 소요

Oracle 2️⃣

[BOJ/백준-Python]2480번 - 주사위 세개

2022-03-07 2 분 소요

2480번 - 주사위 세개

[Oracle]오라클 강의내용 복습 1일차

2022-03-04 9 분 소요

Oracle Day1️⃣

[ML/DL]TensorFlow 머신/딥러닝 기초 복습

2022-03-03 14 분 소요

Tensorflow

[ML]sklearn 머신러닝 기초 및 복습

2022-03-02 20 분 소요

Big Data

[BOJ/백준-Python]2525번 - 오븐 시계

2022-02-15 2 분 소요

2525번 - 오븐 시계

[BOJ/백준-Python]10871번 - X보다 작은 수

2022-02-13 1 분 소요

10871번 - X보다 작은 수

[BOJ/백준-Python]2439번 - 별 찍기 - 2

2022-02-13 1 분 소요

2439번 - 별 찍기 - 2

[BOJ/백준-Python]2438번 - 별 찍기 - 1

2022-02-13 최대 1 분 소요

2438번 - 별 찍기 - 1

[BOJ/백준-Python]11022번 - A+B - 8

2022-02-13 1 분 소요

11022번 - A+B - 8

[BOJ/백준-Python]11021번 - A+B - 7

2022-02-13 1 분 소요

11021번 - A+B - 7

[BOJ/백준-Python]2742번 - 기찍 N

2022-02-13 최대 1 분 소요

2742번 - 기찍 N

[BOJ/백준-Python]2741번 - N 찍기

2022-02-13 최대 1 분 소요

2741번 - N 찍기

[BOJ/백준-Python]15552번 - 빠른 A+B

2022-02-12 1 분 소요

15552번 - 빠른 A+B

[BOJ/백준-Python]8393번 - 합

2022-02-12 최대 1 분 소요

8393번 - 합

[BOJ/백준-Python]10950번 - A+B - 3

2022-02-12 최대 1 분 소요

10950번 - A+B - 3

[BOJ/백준-Python]2739번 - 구구단

2022-02-12 최대 1 분 소요

9️⃣ 2739번 - 구구단

[BOJ/백준-Python]2884번 - 알람 시계

2022-02-11 2 분 소요

2884번 - 알람 시계

파이썬을 이용한 크롤링 연습 2

2022-02-10 8 분 소요

[BOJ/백준-Python]14681번 - 사분면 고르기

2022-02-10 1 분 소요

14681번 - 사분면 고르기

파이썬을 이용한 크롤링 연습 1

2022-02-09 9 분 소요

⛏크롤링(Crawling)

[BOJ/백준-Python]2753번 - 윤년

2022-02-09 1 분 소요

2753번 - 윤년

[Django]장고 복습 4

2022-02-08 8 분 소요

Django 복습 4️⃣

[Django]장고 복습 3

2022-02-07 8 분 소요

Django 복습 3️⃣

[BOJ/백준-Python]9498번 - 시험 성적

2022-02-07 1 분 소요

💯 9498번 - 시험 성적

[BOJ/백준-Python]1330번 - 두 수 비교하기

2022-02-06 최대 1 분 소요

1330번 - 두 수 비교하기

[BOJ/백준-Python]2588번 - 곱셈

2022-02-06 2 분 소요

✖ 2588번 - 곱셈

[BOJ/백준-Python]10430번 - 나머지

2022-02-05 최대 1 분 소요

➗ 10430번 - 나머지

[Django]장고 복습 2

2022-02-04 8 분 소요

Django 복습 2️⃣

[Django]장고 복습 1

2022-02-04 4 분 소요

Django 복습 1

[MySQL]기초 복습

2022-02-04 25 분 소요

MySQL 복습!

[BOJ/백준-Python]10926번 - ??!

2022-02-03 최대 1 분 소요

⁉10926번 - ??!

[BOJ/백준-Python]1008번 - A/B

2022-02-03 1 분 소요

🆎1008번 - A/B

[BOJ/백준-Python]18108번 - 1998년생인 내가 태국에서는 2541년생?!

2022-02-03 최대 1 분 소요

👩‍🦲 18108번 - 1998년생인 내가 태국에서는 2541년생?!

[web]jQuery 복습 3

2022-01-29 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]jQuery 복습 2

2022-01-28 13 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]jQuery 복습 1

2022-01-27 14 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]JavaScript 정리4

2022-01-26 5 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]JavaScript 정리3

2022-01-25 10 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]JavaScript 정리2

2022-01-21 7 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]JavaScript 정리1

2022-01-21 8 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]CSS 기초 정리

2022-01-21 11 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[web]HTML 기초 정리

2022-01-20 8 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[파이썬 통계분석]추론 통계 강의 요약

2022-01-18 12 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[파이썬 통계분석]기술 통계 강의 요약

2022-01-17 19 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Matplotlib]기초 요약

2022-01-15 6 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Pandas]내가 보려고 올린 Pandas 정리6

2022-01-14 14 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Pandas]내가 보려고 올린 Pandas 정리5

2022-01-14 11 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

네이버 검색 창에 블로그가 검색된다.

2022-01-13 최대 1 분 소요

🎈✨경 축✨🎈

[Pandas]내가 보려고 올린 Pandas 정리4

2022-01-13 27 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Pandas]내가 보려고 올린 Pandas 정리3

2022-01-13 7 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Pandas]내가 보려고 올린 Pandas 정리2

2022-01-13 8 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[알고리즘 특강]자료구조/알고리즘 특강 요약 2일차

2022-01-12 13 분 소요

선형 자료구조(1일차에 이어서)

[알고리즘 특강]자료구조/알고리즘 특강 요약 1일차

2022-01-12 10 분 소요

자료구조

[BOJ/백준-Python]10998번 - AXB

2022-01-11 1 분 소요

🆎10998번 - A×B

[BOJ/백준-Python]1001번 - A-B

2022-01-10 1 분 소요

🆎1001번 - A-B

[BOJ/백준-Python]1000번 - A+B

2022-01-09 1 분 소요

🆎1000번 - A+B

[Pandas]pandas 연습

2022-01-07 3 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Pandas]내가 보려고 올린 Pandas 정리1

2022-01-07 14 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[NumPy]내가 보려고 올린 NumPy 정리2

2022-01-07 12 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[NumPy]내가 보려고 올린 NumPy 정리1

2022-01-06 8 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]class 연습

2022-01-05 9 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[BOJ/백준-Python]10172번 - 개

2022-01-05 최대 1 분 소요

🐶10172번 - 개

[Python기초]File In&out 연습

2022-01-04 7 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]file 개념 정리

2022-01-04 6 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]module 연습

2022-01-03 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[BOJ/백준-Python]10171번 - 고양이

2022-01-03 최대 1 분 소요

🐱10171번 - 고양이

[알고리즘 기초]스택과 큐

2022-01-03 1 분 소요

[해당 포스트는 유튜버 나동빈님의 영상을 참고했습니다.]

[BOJ/백준-Python]10718번 - We love kriii

2022-01-02 1 분 소요

❤10718번 - We love kriii

[BOJ/백준-Python]2557번 - Hello World

2022-01-01 최대 1 분 소요

🖐2557번 - Hello World

맨 위로 이동 ↑

2021

[Git]git특강 2일차 정리

2021-12-31 13 분 소요

Today I Learned(TIL)📌 (2021.12.31)

[Git]git특강 1일차 정리

2021-12-31 10 분 소요

Today I Learned(TIL)📌 (2021.12.30)

[Python기초]module

2021-12-30 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]function 연습3

2021-12-30 3 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]built-in functions 정리

2021-12-30 3 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]function 연습2

2021-12-29 2 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]function 연습

2021-12-29 3 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]set 연습

2021-12-29 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]list 연습2

2021-12-29 4 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]string 연습

2021-12-28 4 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]while문 연습(feat.for문)

2021-12-28 2 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]dictionary 연습

2021-12-28 3 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]if, else, elif 연습2

2021-12-27 3 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]for문 연습2

2021-12-27 2 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]for문 연습

2021-12-27 2 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]if, else, elif 연습

2021-12-27 2 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]input 연습

2021-12-27 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]연산자 연습

2021-12-27 최대 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

[Python기초]변수와 포매팅 연습

2021-12-24 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

명령 프롬프트를 활용한 Windows10 정품인증 방법

2021-12-22 1 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

Git과 GitHub의 기초 사용법

2021-12-16 2 분 소요

[Noitce] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

주피터 노트북 기초 사용법 연습

2021-12-14 2 분 소요

[noitce!!] 고쳐야하거나 틀린 것이 있으면 말씀해주세요!

맨 위로 이동 ↑