언어영역/Machine Learning(13)
-
TensorFlow101-14~16 Sigmoid와 Softmax의 차이점
원핫인코딩 범주를 회귀와 같은 방식으로 계산한다면 다양한 품종의 꽃들이 "품종"이라는 한 개의 속성으로 분류될 것이다. 하지만 우리가 원하는 건 품종 중에서도 어떤 품종인지, 즉 "Setosa", "Versicolor", "Virginica"(아이리스 꽃 품종의 종류)인지를 구분하는 것이다. 이를 위해서는 '품종'속성을 새로운 칼럼들(=속성)로 바꿔준다. 이 과정을 원핫인코딩이라고 하며, 아래 예시를 통해 이해하자. 기존 표 꽃잎의 길이 꽃잎의 폭 품종 5.1 3.5 Setosa 4.9 3 Virginica 적용 코드 아이리스 = pd.get_dummies(아이리스) 변환된 표 꽃잎의 길이 꽃잎의 폭 품종.Setosa 품종.Versicolor 품종.Virginica 5.1 3.5 1 0 0 4.9 3 0..
2021.01.02 -
TensorFlow 101-13 회귀모형 인공지능의 원리
Datafit의 과정 (회귀모형에서), 수치의 가중치는 어떻게 찾는 걸까? 이전 과정에서 나는 인공지능이 퍼셉트론, 즉 y=xw+x2w2+...+xnwn+b의 형태로 나타난다는 것을 배웠다. 그렇다면 이 식에서 w와 b는 어떻게 결정되는 걸까? 이번 영상은 그 원리에 대해서 다룬다. 가중치(w)와 편향(b)를 랜덤으로 설정한다. 첫 번째 케이스를 바탕으로 MSE(오차 제곱의 평균, 분산)를 구한다. 가중치와 편향이 늘거나 줄 때 변하는 Loss값을 관찰한다. (dL/dw 또는 dL/db) 0.1보폭(Learning Rate)으로 움직이며 Loss값이 최소가 되는 지점을 찾는다. 간단하다. 하지만 간단하지 않다. 연구를 시작하기에 앞서 첫째, 회귀모형이 Convex Function인지 알아놓아야 한다. 다..
2020.12.31 -
TensorFlow 101-1~101-12
유튜버 '봉수골 개발자 이선비'의 텐서플로우 강의 '생활코드'와 같이 OpenTutorials에서 활동하시는 유튜버 이선비의 텐서플로우 강의를 수강했다. 온라인으로 쉽게 접할 수 없는 고급 지식들을 누구나 이해할 수 있게 설명해주는 이런 강의를 열어주시는 이선비님과 오픈튜토리얼즈에게 너무도 감사하다. 여러모로 도움이 되는 강의였는데, 다만 초심자를 위해 무엇을 뺄 지 고민하는 과정에서 개인적으로는 너무 많은 것들이 빠지지 않았나... 하는 생각이 들었다. 그러다보니 다 묶어서 땡 치고 넘어가는 기분. 더 깊게 공부하고싶은 입장에서는 강의를 듣다가 중간중간 '응?' 하면서 의아해하는 부분이 있었다. 이선비의 강좌 필기와 더불어 개인적으로 조사한 내용들도 추가해서 적어 두었다. 머신러닝에서 LOSS란 무엇인..
2020.12.30 -
TensorFlow 101 공부 시작!
머신러닝 야학 2기를 신청한 입장으로서 이전 과제에 대한 복습은 역시 필수다. 심지어 내가 원하는 공부 내용이다보니 아무래도 자꾸 눈이 간다. 그렇게 머신러닝1의 공부를 마쳤다. 더 많은 것을 알고자 다음 단계로 넘어가면서 코딩을 할 수 있냐는 물음에 잠깐 막혔다. 분명히 html로 몇 자 끄적일 수 있다. 고등학교 땐 R프로그램을 통해 대회에 출전한 적도 있다. 하지만 코딩을 할 수 있나...? 아직 배운 게 많지 않아서 그런지 코딩은 내게는 너무 멀게만 느껴졌다. 하지만 나는 다른 Flow를 선택했다. 바로 Tensorflow다.(OHHHHH) 코딩을 할 줄 모르지만... 내 목표는 오렌지3로 장난감을 만드는 게 아니다. 직접 코드를 쳐 가면서, 자유도 높은 플랫폼에서 나만의 지적 산출물을 만들어내는..
2020.12.26 -
머신 러닝 (①) 필기
Machine Learning 1-12 표 행에는 하나의 예시(instance, observed value, example, record, case), 열에는 하나의 속성(feature, attribute, variable, field)이 적힌다. 대강 아래와 같은 식이다.bdaynameheight(m)weight(kg)20000106csm1.786620010626cys1.6557세상에! 어쩐지 고등학교 당시 R프로그램을 할 때에도 csv파일은 항상 이런 식으로 구성돼있었다. 항상 행과 열을 이렇게 적기로 약속해놨단다. Machine Learning 1-13 독립변수와 종속변수종속변수와 독립변수, 상관관계와 인과관계에 대해 배웠다.종속변수는 결과, 독립변수는 원인이다.상관관계는 인과관계를 포함하는 개념이..
2020.12.26 -
머신 러닝 (①) 교양 ver. 후기
교양의 끝까지 아무것도 하지 않았다. 내용은 분명히 내게 의미있는 내용이었고, 해당 영상에서 내게 내린 지시는 모두 이행했다. 영상 막바지에서 내게 마주하는 문제 상황과 이를 해결할 수 있는 상황을 예시로 들라고 했다. 내가 제시한 예시는 다음과 같다. 나는 지금 시간을 더 잘 활용하고 싶다. 하루를 얼마나 의미있게 보냈는지, 시간을 얼마나 잘 활용했는지에 대해서 점수를 매기고 싶다. 그치만 문제는, 그 이전까지의 필기에 대해서 내가 전혀 신경쓰지 않았다는 것 (...) 때문에 머신 러닝이 무엇인가에 대해서는 대충 알지만 왠지 기억이 흩어질 것 같다는 점이다. 그래도 지금까지는 '교양'의 범주에서 상식적인 범위에서 다뤘기에 까먹어도 알고 있을 정보인 것 같다. 대신 교양과 작별한 지금부터는 여기에 열심히..
2020.12.26