ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 데이터분석의 기본
    pandas 2024. 11. 5. 12:43

    1. 데이터 구조 이해하기

    데이터 수집 -> 데이터 구조화 -> 데이터 전처리 -> 데이터 분석

     

    >데이터 수집

    인터넷(크롤링), 데이터베이스(SQL),open APL, 파일

     

    >데이터 구조화

    JSON, CSV, Plain Text

     

    >데이터 전처리

    Python, JAVA

     

    >데이터 분석

    데이터 분석(EDA)

    데이터 시각화

     

    대체로 현업에서는 이러한 4단계를 이어서 간다고 하니 이해하는 것이 중요할 듯합니다.

    데이터의 기본은 코딩이지만 한 번 만든다면 앞으로도 꾸준히 그 값들을 활용하는 것이 가능하니 웹이나 어플 개발자처럼 까지는 코딩을 잘하실 필요가 없습니다.

     


    코딩의 기본기와 이해도를 넓히려는 중급자들에게 가장 추천을 하는 바입니다.

    저도 현재 코딩의 기초만을 알고 있지만 배우면서 조금씩 블러그에 정리해보려고 합니다.

    ( 취업할때 블로그에 공부하면서 작성한 것, 보여줄 수도 있고...ㅎㅎ )

     

    1. 기본적인 코드 구조와 논리적 사고 훈련

    데이터 분석에서는 기본적으로 데이터 수집, 처리, 분석, 시각화 같은 과정이 반복되며, 이 과정에서 다양한 코드 구조(예: 조건문, 반복문, 함수, 예외 처리 등)를 활용하게 됩니다. 이런 구조는 웹개발이나 어플 개발에도 필수적이지만, 데이터 분석에서는 이를 반복적으로 사용하므로 코딩의 기초를 자연스럽게 다지기에 좋습니다.

    2. 직관적이고 실용적인 결과물

    데이터 분석은 시각적이고 측정 가능한 결과물(예: 그래프, 통계치)을 즉각 확인할 수 있어 학습 동기를 부여해 줍니다. 데이터를 분석하고 시각화하는 과정을 통해 작은 코드 변경이 결과에 어떻게 영향을 주는지 체감할 수 있습니다.

    3. Python과 R 같은 데이터 분석 특화 언어 학습 

    (R == excel을 제작한 언어)

    데이터 분석을 시작하면 보통 Python과 Pandas, Numpy, Matplotlib 등의 라이브러리나 R을 배우게 됩니다. 이 언어와 도구들은 문법이 비교적 간결하고 직관적이어서 배우기 수월하고, 데이터와의 상호작용을 통해 프로그래밍 개념을 이해하기 쉽게 합니다. 이를 통해 기초부터 고급까지의 개념을 차근차근 쌓을 수 있습니다.

    4. 연산 효율과 코드 최적화 학습

    분석할 데이터의 크기가 커지면 성능과 효율성에 대한 고려가 필요해집니다. 이를 위해 메모리 관리, 연산 시간 단축 방법 등을 배우게 되는데, 이는 다른 개발 분야에서도 중요한 개념이므로 이후 다른 분야로 넘어갈 때 큰 도움이 됩니다.

    5. 점진적 확장 가능성

    데이터 분석에서 더 나아가고 싶다면 머신러닝, 데이터 엔지니어링, 혹은 웹 대시보드 개발까지 확장할 수 있습니다. 데이터 분석 지식을 통해 기초 코딩 실력을 쌓은 후에 웹 개발 또는 어플 개발로 확장하기가 수월합니다.

Designed by Tistory.