전체 글

전체 글

    [Django 웹프로젝트] 1. 어쩌다 생애 첫 프로젝트 (2021-04-04)

    [Django 웹프로젝트] 1. 어쩌다 생애 첫 프로젝트 (2021-04-04)

    어쩌다 시작하게 됐다. 설계단계부터 시작하는 건 아니고, 동아리를 새로 들어갔는데, 백엔드를 한명 뽑고 있어서 지원했다. 와서 보니 설계는 다 끝났고 이제 막 게시판 CRUD 정도 마친 상태였다. 나는 살면서 협업 프로젝트는 처음인지라 나중에 공부해야지~ 라며 Git, github도 모르던 상태고 데이터베이스도 쿼리문만 다룰 줄 아는 정도다. 근데 내 블로그 이전 글 '파이썬을 공부하게 된 이유'를 보면 알겠지만 대용량의 트렌젝션을 처리하는 백엔드를 개발해보고 싶다는 생각도 있었고, 혼자만 방에 틀어박혀서 공부하는 것이 내 발전에 그렇게 큰 영향을 미치고 있지도 않다는 생각이 들던 참이었다. 그래서 빈틈 투성이지만 열심히 공부할 각오로 지원해서 시작하게 되었다. 프로젝트 팀장 형이 생각보다 할 줄 아는게..

    [삼성전자 X 관악구] 멘토링 후기

    3월 초, 전역한지 얼마되지 않았을 적에 발견했던 멘토링 프로그램이다. 관악구청 청년지원부(?)에서 삼성전자 현직자 한 분을 멘토로 잡아주셔서 한시간 가량 이야기를 나눌 수 있는 기회를 제공받았다. 그냥 신청하기만 하면 된다!! 그 당시에 신청해서 4/3(토) 11시~12시에 진행했다. 이 멘토링의 후기를 말하기 앞서서 내 개인적인 사정을 조금 설명하고 싶다. 올해 초에 전역을 했는데, 작년에, 그러니까 군복무 한창 하고있을때에 어머니가 암에 걸리셨다는 이야기를 전해들었다. 코로나 시국에 군인은 밖에 잘 나갈 수가 없다. (부대에 갇혀산다. 게다가 마스크 쓰고 훈련받는다...) 어찌저찌 무사전역하고 집에 왔다. 원래는 부모님께서 맞벌이를 하고 계셨는데, 엄마가 일을 못하니까,, 재정적으로 많이 힘들더라...

    Multiple Linear Regression 정리 + 느낌

    Multiple Linear Regression 정리 + 느낌

    """최근 맨 땅에 헤딩하는 식으로 빅데이터를 혼자 공부했었는데, Feature Engineering 할 때, 왜 해당 피쳐를 선택해야하는지, 어떤 건 없애야하는지, 어떤 피처는 만들어서 사용해도 되는지 등에 대한 논리적 근거가 궁금했다. 다른 사람들이 수행한 EDA를 열심히 뜯어봐도 수학적 근거까지는 명시하지 않았기 때문이다. 대충 싸이킷런으로 예측과 분류의 정확도를 올리는 법을 익힌 후에, '아~ 그냥 이게 전부인가..?'라는 생각에 딥러닝에 도전했다,, 텐서플로우를 통해 잠시 공부하다가, 싸이킷런처럼 fit() 하고 결과가 나와버리는 것을 보고,,, 너무,,, 답답했다. 속 알맹이에 뭐가 들어있는지도 모르고 쓰는게 너무 찝찝해서, 모델들을 수학적으로 더 공부해야할 필요성을 느꼈다. 수학적인 부분들을..

    EDA(Exploratory Data Analysis) 흐름 정리

    EDA(Exploratory Data Analysis) 흐름 정리

    최근 몇 일간 빅데이터 분석에 관해 공부를 시작했다. 혼자서 이곳저곳 기웃거리면서 여러가지 개념들을 접했다. 방대한 양의 지식들이 있었고, 전문성을 요하는 수준까지의 깊이도 필요했다. 따라서 먼저 크게 흐름을 잡아보는 것을 목표로 공부해보았다. EDA란 탐색적 정보 분석이다. 주어진 정보에 대한 보편적이고 절대적인 규칙, 성질, 논리 같은 것이 있을 수 없다고 가정한다. 따라서, 말 그대로, 특성이라고 할 만한 것들을 탐색해가는 행위를 말한다. 수학적 전제들과, 기법들이 많지만 이 글에서는 큰 흐름만을 정리해두고, 차후에 조금씩 분석해볼 예정이다. 파이썬에서는 데이터 분석을 위한 여러가지 좋은 패키지를 제공한다. 패키지 정리는 나중에 여건이 되면 하기로..! - numpy : 행렬 연산을 빠르게 처리하기..

    [머신러닝을 위한 파이썬] 3. pandas 활용 예제

    [머신러닝을 위한 파이썬] 3. pandas 활용 예제

    >> 완벽하게 알아야 하는 자료구조 Series DataFrame >> 알아야하는 문법 파일 읽어오기, 저장하기 Series 생성방법 DataFrame 생성방법 DataFrame Col : 추가, 삭제, 이름변경, 새로운 데이터 할당, 선택적 불러오기 loc / iloc Index 변경 (KEY 값 변경) Data drop Operation, BroadCasting inplace, map, apply decribe, unique Groupby & CrossTab & Pivat Table Gierarchical Index Aggregation Transformation Merge & Concat Join 1번과 2번 예제 설명은 여기를 참고 총 3개의 예제가 있다! #1. 답안코드 # 첫번째 방법 : gr..

    [머신러닝을 위한 파이썬] 2. numpy 활용 예제

    이 글은 boostcourse 강의를 듣고 작성한 글입니다. >>알아야하는 문법 numpy 배열 생성법 0 배열 / 1 배열 생성법 shape / reshape concatenate axis indexing VS slicing Operation, Comparison Boolean Index Fancy Index BroadCasting 배열 저장, pickle >>신경 써야하는 부분 numpy는 c스타일 배열 => 기존 파이썬 배열보다 빠르다. numpy 메서드가 복사된 배열을 반환하는지, 참조하는지 구분해야한다!! => 나중에 큰 데이터를 다룰 때 필요 연산 시에 BroadCasting이 어떻게 되는지 알아야된다. shape이 1차원인지 2차원인지 [1,2,3,4,5] => 1차원, [[1,2,3,4,5..

    [머신러닝을 위한 파이썬] 1.행렬 연산 구현해보기

    이 글은 boostcourse 강의를 듣고 정리한 글입니다. 밑에 나오는 구현 예제들은 모두 한줄로 작성이 가능하다! ( 과연 한 줄로 코드를 작성하는 게 더 좋을까...? ) >>완벽하게 알아야 할 자료구조 리스트 튜플 딕셔너리 >> 공부해야 할 문법들 List Comprehension / Generator Enumerate Zip Lambda Map Asterisk 예제는 여기서 확인하자 >>파이썬 답안 코드 #1. def vector_size_check(*vector_variables): return len(set([ len(vector) for vector in vector_variables])) == 1 #2. def vector_addition(*vector_variables): if vect..

    [Python 뜯어보기] 2.극한의 '객체'충 파이썬

    [Python 뜯어보기] 2.극한의 '객체'충 파이썬

    이번 공부를 하면서 얻은 교훈! C 와 Python 의 가장 큰 차이점이 무엇인지 느껴졌다!! C는 함수 호출 시 스택 메모리에 로드하고, 빠져나올 때 의미를 잃어버린다. Python은 함수를 네임스페이스 라는 공간에 정의를 한다. 함수까지도 객체화 해버렸다. 여기서 많은 차이가 발생하는 것 같다. 마치 레고? 로봇? 같은 느낌이다. 우리가 쓰는 모든 변수는 잘 만들어진 로봇의 부품들을 하나하나 가리키는 용도일 뿐이다. C는 주물작업으로 직접 레고 부품을 하나하나 만들고, 만들어진 부품을 내 손으로 직접 쌓는 느낌 Python은 절대 내 손으로는 그 부품을 만질 수 없다. 내가 타워 크레인이 된 것처럼 이미 잘 만들어진 것들을 이리저리 옮겨서 쌓는 느낌이다. C는 장인의 손길이 느껴지는 반면, Pytho..