지금, 나는 

Art is anything you can get away with.

반응형

Programming 23

혼자 공부하는 머신러닝 + 딥러닝 [4주차]

Chapter 05 트리 알고리즘 . 자료구조나 알고리즘을 공부해 보면 트리 형태나 노드 형태를 보게 되는데 뭔가 이해하기 쉬우면서도 어려운 구조다 이 책에서는 그래도 쌩으로 구현하는 게 아니라 있는 모델을 잘 활용해서 결과를 내는 느낌이라 학습에는 큰 어려움이 없을 것 같다. 05-1 결정 트리 다루는 데이터의 크기가 몇 천개로 늘었다.. 이전에 공부하는 로지스틱 회귀 모델은 데이터를 직접 학습해 계수와 가중치를 알맞게 조절해 함수를 만들었다. 하지만 특성이 많아질수록 모델을 설명하기 어렵다. 반면 결정 트리 모델은 이유를 설명하기 쉽다. 스무고개처럼 계속 예/아니요 질문으로 분류하며 정답을 맞춰나간다. 위 그림을 보면 각 노드가 어떤 특성으로 나뉘는지 이해하기 쉽다. 테스트 조건에 따라 총 샘플들이 ..

혼자 공부하는 머신러닝 + 딥러닝 [3주차]

Chapter 04 다양한 분류 알고리즘 . 이제부터 정신 차리고 따라가야 한다.. 최소한 이해라도 하려면 04-1 로지스틱 회귀 내가 라는 것을 처음 보게 된 것은 한 딥러닝 입문 책이었다. 그 책에서는 가장 먼저 선형 회귀를 앞세워 보여주면서 이어 로지스틱 회귀를 설명했다. 당시에는 전혀 이해되지 않았는데 사실 지금도 쉽게 이해되지 않는다. 로지스틱도 선형 회귀만큼 중요한가보다. 우리가 '분류'라는 작업을 할 때는 근거가 있어야 한다. 주로 그 근거는 각 데이터의 특성에서 따온다. 우리는 그 특성들이 얼마나 뚜렷한가의 차이로 분류한다. 즉, 확률로 표현할 수 있다. . 앞서 겪었듯 충분히 학습된 선형 회귀는 예측에 신뢰도가 높다. 각 데이터의 특성을 기준으로 패턴을 학습해 하나의 함수로 그룹을 만들 ..

혼자 공부하는 머신러닝 + 딥러닝 [2주차]

Chapter 03은 회귀 알고리즘과 모델 규제이다. 지도 알고리즘은 크게 분류와 회귀로 나뉜다. 회귀는 통계의 꽃받침이라 할 수 있을 정도로 중요한 토대가 되는 개념이다. 간단히 말하면 변수 사이의 상관관계를 분석하고 예측하는 방법이다. 모든 데이터들이 하나의 함수에 적용될 수 없기 때문에 모델 규제를 통해 함수(상관관계)가 보편적인 패턴을 따르도록 제어할 수 있다. 03-1 k-최근접 이웃 회귀 왜인지 모르겠지만 이번에는 농어의 길이, 높이, 두께 데이터로 무게를 예측한다고 한다. 만약 예측의 정확도가 높고 신뢰할만하다면 일의 효율이 엄청나게 좋아질 것 같긴 하다. 주인공은 간단히 해결책을 생각해냈다. 이전 단원에서 사용한 k-최근접 이웃 분류 알고리즘을 응용해 주변 데이터의 평균을 내서 무게를 예측..

혼자 공부하는 머신러닝 + 딥러닝 [1주차]

어쩌다가 SNS에서 혼공학습단 8기를 모집한다는 글을 보게 됐고 마침 머신러닝, 딥러닝 쪽에 관심이 있었고 뭔가 내가 찍먹해보고 싶은 내용들이 담긴 책인 것 같아서 이렇게 하게 되었다ㅎㅎ 전체적으로 크게 어렵지 않고 어느정도 관심 있는 사람들에게는 정말 '찍먹'하기 좋은 난이도의 책이다. 쓰이는 알고리즘 같은 경우에도 책에 사례같은 내용으로 어떤 상황에 어떤 사고 흐름으로 코드를 전개하는 지 보여줘서 이해하기 쉽고 재밌게 공부할 수 있다. (파이썬, 선형대수학, 기초통계학을 어느정도 다루고 공부했다면 어려움 없이 완독할 수 있을 겁니다.) 01-1 인공지능과 머신러닝, 딥러닝 책을 시작하기 앞서 인공지능, 머신러닝, 딥러닝이 무엇인지 소개하는 절이다. 인공지능: 사람처럼 학습하고 추론할 수 있는 지능을 ..

CODE REVIEW를 가장한 후기글_(하).py

글을 이어서 쓰기 전에, 전체 코드를 보고 싶으신 분들을 위해 파일을 올려드립니다. 마음껏 활용해주세요. .format() 프로그래밍을 조금 공부한 사람들은 아마 알 겁니다. 문자열 다루는데 포매팅을 안 쓰는 사람은 드물다는 걸요. . 파이썬은 %, .format(), f-string의 3가지 포매팅 방법을 제공하는데 간단히 소개하자면, 버전이 업데이트 되면서 하나하나 기능도 업그레이드 된 겁니다. 저는 이전까지 %를 사용했었는데 이번에 .format() 사용해보고 어찌나 편리하던지. %의 경우 뒤에 s / d 등 해당 데이터 타입을 결정해줘야 하지만 .format()부터는 그럴 필요가 없다는 점!! (f-string은 코드가 난해해지는 감이 있어서 아직 필요성을 못느꼈습니다..) 절대 경로와 상대 경로..

CODE REVIEW를 가장한 후기글_(상)

뭔가 이렇게 큰 테두리를 잡고 시작해야 편하고 빠르게 만들 것 같아서 한 번 마인드맵을 만들었다. 이렇게 하니까 확실히 반복되는 부분도 보이고 깔끔하게 만들 것 같았다. (근데 왜 중간중간 추가할 기능들이 생각나는지...) 솔직히 구 버전(20년도.ver)을 수정하려 했었는데 너무 막 짜여있어서 새로 시작했다. 일단 본문부터 뼈대를 잡고 필요한 대로 모듈화 했다. 모듈화 프로그램을 짜다보면 반복되는 부분이 나오기 마련이다. 이를 용도에 따라 함수나 클래스로 정의 해 잘 사용하면 편리하고 깔끔해진다. 나는 이 프로그램에서 함수를 쓸까 클래스를 쓸까 고민하다가 굳이 클래스로 작성해야하나 싶어서 결국 함수만 사용했다. 함수로도 충분했다. 클래스랑 함수랑 엄연히 다르긴 한데 클래스는 뭔가 기능이라기보다 속성(?..

단어시험 프로그램 소개 및 사용 방법

서사 2020년에 프로그래밍 필수 교양 강의를 들으면서 종종 백준도 풀고 코드도 짰는데 그러다 '내가 다루던 내부 기능을 다 써보자'해서 만든 프로그램이다. 공부도 할겸 단어 테스트 프로그램을 만들고자 했고 당시에는 떠오르는 대로 구현하다보니 굉장히 rough하게 짰다. 처음부터 끝까지 온리 if~ else~ 구조... 간신히 동작은 하지만 오류가 많은 프로그램을 두고 입대 해버렸다. . . 군대 다녀오고 계획 세우면서 코드 좀 뜯어고치려 했는데 나름 잘 만들어버렸다. 해당 파일은 를 참고해서 만들었음을 밝힙니다. (광고는 아닙니다ㅠ) . 사용 방법 첨부 파일을 압축 해제하면 토익보카_테스트 파일이 생기며 TOEIC_VOCA_TEST_PROGRAM을 실행시켜 테스트를 보실 수 있습니다. ※ 실행파일이 이..

728x90