분류 전체보기
![[Python 기초] 1. 입출력 / 변수 / 조건문](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FdEj9f2%2FbtrAD5FFCo2%2FAAAAAAAAAAAAAAAAAAAAALti4nIWiDvV09dfHup30C3y1Z6LJHURPhbyFsj-rFi0%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1756652399%26allow_ip%3D%26allow_referer%3D%26signature%3D%252F9MHb%252BkR%252FavrcVoJowMmXHdtOJ4%253D)
[Python 기초] 1. 입출력 / 변수 / 조건문
해당 강의는 인하대학교 빅데이터 탐구 동아리 (www.inhabas.com) 에서 신입생을 대상으로한 파이썬 기초 강의 영상입니다. 강의안 : https://fragrant-comfort-49c.notion.site/1-d08477be793e439b8bda7eebe0d6d713 1차시 과제.pptx 과제 업로드시 유의사항!! 각각의 과제는 소스코드파일 .py 와 cmd 실행 결과를 스크린샷한 이미지 파일이 있어야 합니다. 각각의 과제 파일 이름은 ex1.py, ex2.py 등으로 저장해주세요! 이미지 파일 docs.google.com
[Django 웹 프로젝트] 3. 파일 관리 시스템 개선 (2021-04-30)
[배경] 게시판과 게시판에 대한 파일 테이블이 1:n 으로 매핑되어 있다. 근데 문제는 일반게시판 테이블 - 일반게시판 파일 테이블 공모전게시판 테이블 - 공모전게시판 파일 테이블 강의게시판 테이블 - 강의게시판 파일 테이블 이런 식으로 게시판 종류에 따라, 그에 해당하는 파일 테이블이 하나씩 붙어있는 구조였다. 그래서 ORM 상에서도 모든 게시글 도메인과 파일 도메인이 각각 따로 존재했고, 중복되는 코드도 너무 많았다. 예로, board 앱의 views.py 에서 normalBoard - normalBoardFile 에 대한 CRUD 와 유효성 검사 로직이 있으면, contest 의 views.py 에서도 contestBoard - contestBoardFile 에 대한 거의 유사한 로직이 반복되는 것..
![[Django 웹 프로젝트] 2. 장고 폼(forms) 도입 => 코드 간결화 (2021-04-28)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FtyLBm%2Fbtq89MGvLqU%2FAAAAAAAAAAAAAAAAAAAAACkpVpcksqUCBIpxbRw_C-rEliW2khJipor-omVUupZ-%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1756652399%26allow_ip%3D%26allow_referer%3D%26signature%3DbGmK0%252Bo8VnJj35jIEIAnWWbESWA%253D)
[Django 웹 프로젝트] 2. 장고 폼(forms) 도입 => 코드 간결화 (2021-04-28)
[배경]슬슬 진행하고 있던 웹 제작 프로젝트가 거의 끝나서 그 동안 작업했던 과정들을 남겨볼까 한다. 동아리에서 사용할 웹페이지를 제작 중이다. 동아리 내에서 서로 강의하고, 배우는 것을 중요하게 생각해서, 지금은 강의 관련 앱을 구현 중이다. 처음으로 맡았던 부분은 공모전 게시글 CRUD 부분이다. 공모전에 관심이 있는 사람이 게시글을 직접 작성하여 동아리 내에서 같이 참가할 팀원을 모집하는 방식이다. 이 프로젝트에 중간 합류하고 처음하는 작업이었기 때문에, 다른 백엔드 개발 맡으신 분이 어떻게 코드를 짜고 있었는지를 참고하면서 스타일을 최대한 맞추려고 했다. 그런데, 그 분의 코드를 보면서.. 중복되는 코드가 너무 많고, 가독성이 떨어진다고 느꼈다. 1. 중복되는 코드 함수화 예를 들어 게시판..
![Kaggle - [House Prices] 집값 예측 모델링 후기](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2F6GEzQ%2Fbtq6DCMPfLU%2FAAAAAAAAAAAAAAAAAAAAACT35Z_M7k05Vhk3wdEDDDtOl-plkoRzT80RBR3IXj7O%2Fimg.png%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1756652399%26allow_ip%3D%26allow_referer%3D%26signature%3Dnvdh3CidjKZhmF4QpP%252FrERoF9og%253D)
Kaggle - [House Prices] 집값 예측 모델링 후기
학교 동아리에서 데이터 분석, 머신러닝에 관심있는 사람들끼리 모여서 시작했다! 8주 정도에 걸쳐서 진행했다. 처음에는 한 달 동안은 네이버 부스트 코스를 통해서 파이썬을 이용한 기본적인 데이터 분석 방법들을 익혔다. 나는 심심해서 네이버 부스트 코스에 있던 모든 머신러닝 관련 수업을 들었던 상태였다. 그래서 팀원들에게 부스트 코스로 공부하자고 했다. 처음에는 이왕 프로젝트를 진행하는 김에 공모전에 도전해보자고 다들 얘기를 했었다. 그래서 전주시 빅데이터 공모전에, 세부 지역별 인구 피라미드 예측 모델을 설계하려고 했다. 주 2회 회의를 진행했다. 1번은 파이썬을 통해 라이브러리 등을 공부했던 내용을 공유하는 것이었고, 다른 회의에는 공부했던 내용을 기반으로 전주시에서 제공하는, 여러 기초 데이터들을 분석..
![[Django 웹프로젝트] 1. 어쩌다 생애 첫 프로젝트 (2021-04-04)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdna%2FxPFqn%2Fbtq1JAUBLlk%2FAAAAAAAAAAAAAAAAAAAAADdQYfZBg6rXAsVxK_WoEAzKXnGcbicyxiiOxP5Blaf7%2Fimg.jpg%3Fcredential%3DyqXZFxpELC7KVnFOS48ylbz2pIh7yKj8%26expires%3D1756652399%26allow_ip%3D%26allow_referer%3D%26signature%3DAVVXVz%252BQ2NNAHhrWpC%252F2SXjVrZQ%253D)
[Django 웹프로젝트] 1. 어쩌다 생애 첫 프로젝트 (2021-04-04)
어쩌다 시작하게 됐다. 설계단계부터 시작하는 건 아니고, 동아리를 새로 들어갔는데, 백엔드를 한명 뽑고 있어서 지원했다. 와서 보니 설계는 다 끝났고 이제 막 게시판 CRUD 정도 마친 상태였다. 나는 살면서 협업 프로젝트는 처음인지라 나중에 공부해야지~ 라며 Git, github도 모르던 상태고 데이터베이스도 쿼리문만 다룰 줄 아는 정도다. 근데 내 블로그 이전 글 '파이썬을 공부하게 된 이유'를 보면 알겠지만 대용량의 트렌젝션을 처리하는 백엔드를 개발해보고 싶다는 생각도 있었고, 혼자만 방에 틀어박혀서 공부하는 것이 내 발전에 그렇게 큰 영향을 미치고 있지도 않다는 생각이 들던 참이었다. 그래서 빈틈 투성이지만 열심히 공부할 각오로 지원해서 시작하게 되었다. 프로젝트 팀장 형이 생각보다 할 줄 아는게..
[삼성전자 X 관악구] 멘토링 후기
3월 초, 전역한지 얼마되지 않았을 적에 발견했던 멘토링 프로그램이다. 관악구청 청년지원부(?)에서 삼성전자 현직자 한 분을 멘토로 잡아주셔서 한시간 가량 이야기를 나눌 수 있는 기회를 제공받았다. 그냥 신청하기만 하면 된다!! 그 당시에 신청해서 4/3(토) 11시~12시에 진행했다. 이 멘토링의 후기를 말하기 앞서서 내 개인적인 사정을 조금 설명하고 싶다. 올해 초에 전역을 했는데, 작년에, 그러니까 군복무 한창 하고있을때에 어머니가 암에 걸리셨다는 이야기를 전해들었다. 코로나 시국에 군인은 밖에 잘 나갈 수가 없다. (부대에 갇혀산다. 게다가 마스크 쓰고 훈련받는다...) 어찌저찌 무사전역하고 집에 왔다. 원래는 부모님께서 맞벌이를 하고 계셨는데, 엄마가 일을 못하니까,, 재정적으로 많이 힘들더라...

Multiple Linear Regression 정리 + 느낌
"""최근 맨 땅에 헤딩하는 식으로 빅데이터를 혼자 공부했었는데, Feature Engineering 할 때, 왜 해당 피쳐를 선택해야하는지, 어떤 건 없애야하는지, 어떤 피처는 만들어서 사용해도 되는지 등에 대한 논리적 근거가 궁금했다. 다른 사람들이 수행한 EDA를 열심히 뜯어봐도 수학적 근거까지는 명시하지 않았기 때문이다. 대충 싸이킷런으로 예측과 분류의 정확도를 올리는 법을 익힌 후에, '아~ 그냥 이게 전부인가..?'라는 생각에 딥러닝에 도전했다,, 텐서플로우를 통해 잠시 공부하다가, 싸이킷런처럼 fit() 하고 결과가 나와버리는 것을 보고,,, 너무,,, 답답했다. 속 알맹이에 뭐가 들어있는지도 모르고 쓰는게 너무 찝찝해서, 모델들을 수학적으로 더 공부해야할 필요성을 느꼈다. 수학적인 부분들을..

EDA(Exploratory Data Analysis) 흐름 정리
최근 몇 일간 빅데이터 분석에 관해 공부를 시작했다. 혼자서 이곳저곳 기웃거리면서 여러가지 개념들을 접했다. 방대한 양의 지식들이 있었고, 전문성을 요하는 수준까지의 깊이도 필요했다. 따라서 먼저 크게 흐름을 잡아보는 것을 목표로 공부해보았다. EDA란 탐색적 정보 분석이다. 주어진 정보에 대한 보편적이고 절대적인 규칙, 성질, 논리 같은 것이 있을 수 없다고 가정한다. 따라서, 말 그대로, 특성이라고 할 만한 것들을 탐색해가는 행위를 말한다. 수학적 전제들과, 기법들이 많지만 이 글에서는 큰 흐름만을 정리해두고, 차후에 조금씩 분석해볼 예정이다. 파이썬에서는 데이터 분석을 위한 여러가지 좋은 패키지를 제공한다. 패키지 정리는 나중에 여건이 되면 하기로..! - numpy : 행렬 연산을 빠르게 처리하기..