본문 바로가기

데이터 사이언스 노트5

판다스(Pandas)란? 판다스(Pandas)란?  이제 본격적으로 데이터 분석 , 코드와 관련된 것을 포스팅 할까 생각을 하였습니다. 데이터 분석을 진행하면서 엄청 사용하는 파이썬 라이브러리들이 있습니다. 그 중 하나가 바로 오늘 소개할 판다스죠!  여기서 잠깐 '라이브러리'란 무엇일까요. 먼저 , 인터넷에서 나오는 라이브러리에 대한 설명을 보면  라이브러리란?라이브러리는 혼자서 동작하는 완전한 프로그램이 아닌, 특정한 부분 기능만을 수행하도록 제작된, 컴파일되어 기계어의 형태로 (또는 대상 플랫폼에 따라서는 바이트코드로) 존재하는 프로그램- 나무위키   만약 , 배경지식이 없을 경우 무슨 뜻인지 잘 이해가 안 갑니다. 그래서 간단하게 설명을 하자면 , 저희는 프로그램을 만들 때 꼭 모든 기능들을 만들지 않죠.  예를 들어서 .. 2024. 7. 15.
데이터 분석 방법론 데이터 분석 방법론 대학에서 주최하는 대회나 , 각종 공모전에서 데이터 분석을 진행하면서 몇번 찾아본 것이 있었는데 , 바로 데이터 분석의 절차에 대한 내용이였습니다. 데이터 분서을 진행하면서 얻은 성찰이나 패턴 같은 것은 노트에 정리하기 쉽습니다. 하지만 데이터 분석을 진행하는 과정에서 현재 자신이 어떤 단계에 있는지 , 앞으로 어떤 방향으로 할 것인지에 대해서는 기록하기가 쉽지 않습니다 , 그리고 분석에서 얻은 성찰이나 그러한 사실들을 파악해 두기 위해서는 어떤 단계에서 어떤 것을 얻었는지 알아야 하지만 , 분석이 몇분만에 끝나는 것이 아니기 때문에 계속해서 머릿속에 저장해두기는 쉽지 않죠. 분석의 절차와 같은 경우 , 필요에 따라서 이전 단계로 돌아갈 수도 있고 , 같은 과정을 몇번씩 반복해서 진행.. 2024. 2. 13.
데이터와 DIKW 피라미드 知彼知己 百戰不殆 (지피지기 백전불태) 적을 알고 나를 알면 백번 싸워도 위태로움이 없다. - 손자병법 3장 모공 꽤 유명한 말이기도 하고 , 여러 미디어에서도 한번쯤은 본적이 있는 내용이죠. 데이터과학에서도 위처럼 말할 수 있는지 모르겠지만 그래도 , 데이터 과학을 공부하는 거라면 우리가 다루어야 할 "데이터"라는 상대를 잘 알고 , 또 나의 현재 실력을 잘 파악하고 부족한 점이 뭔지를 잘 안다면 더 나은 성장을 할 수 있을 것 같네요! 그래서 이번에는 데이터란 무엇인지 , 그리고 데이터가 우리가 활용할 수 있는 모양으로 단계적으로 변해가는 단계를 표현한 DIKW 피라미드에 대해서 포스팅 하려고 합니다!. 데이터란 문자 , 숫자 , 소리 , 그림 , 영상 , 단어 등의 형태로 된 의미 단위이다. 보통 .. 2024. 2. 3.
데이터 사이언스와 데이터 사이언티스트 요즘 TV광고라든지 , 아니면 유튜브 , 블로그 같은데서 광고를 보면 개발자 관련 광고가 많이 보이네요. 프론트엔드 , 백엔드 , 게임등등 여러가지 분야가 보이는데 그 안에서도 , AI , 데이터 이 두가지 분야가 전공을 하고 있는 저로서는 많이 눈에 띄더라고요. 데이터 과학자는 21세기 가장 섹시한 직업 2012년 10월 하버드 비즈니스 리뷰(HBR)에서는 위와 같은 말을 했고 , 많은 분야에서 데이터 과학자(데이터 사이언티스트)에 대한 중요성을 말하는 듯이 , 상당히 자주 접할 수 있는 이름이 되었는데요 , 그러면 데이터 과학자란 어떤것일까요? 데이터 과학자(데이터 사이언티스트)란 데이터 과학자가 하는 역할은 , 해당 분야에서 비즈니스 문제나 문제 현상에 대해서 데이터를 통해서 분석하여 , 이해하고 .. 2024. 1. 29.