수업 복습33 데이터 분석 활용 - 가상 쇼핑몰 데이터 예제 # 데이터 프레임 형태로 불러오기 import pandas as pd retail = pd.read_csv('/content/drive/MyDrive/데이터 분석/데이터/OnlineRetail.csv') # 출력 row 갯수 설정 pd.options.display.max_rows = 6 retail 먼저 데이터 프레임 형태로 데이터를 불러옵니다 이때 출력되는 row 갯수를 6개로 설정해서 첫 3개, 마지막 3개가 출력될 수 있도록 해줍니다 데이터의 형태를 보면 541909개의 데이터와 8개의 컬럼으로 구성되어 있는걸 볼 수 있습니다 retail.info() 컬럼의 정보를 확인해 보면 데이터의 type과 컬럼명을 확인할 수 있습니다 주문 번호와 국가, 아이디가 나오는걸로 보아 사이트를 통.. 2024. 4. 17. Matplotlib 1. Matplotlib 파이썬 기반 시각화 라이브러리 한글에 대한 지원이 완벽하지 않음 pandas와 연동이 용이함 https://matplotlib.org !pip install matplotlib # MATLAB과 비슷하게 명령어 스타일로 동작하는 함수의 모음 import matplotlib.pyplot as plt import numpy as np # 리스트의 값들은 y값들이며, x값은 자동으로 만들어줌 plt.plot([1,2,3,4]) plt.show() 먼저 matplotlib 을 install 해서 다운받아 줍니다 그리고 필요한 모듈들을 import 해서 활용할 수 있게 설정해 준 뒤 임의의 데이터를 입력해 확인해 봅니다 data = np.arange(1,100) plt.plot(data).. 2024. 4. 15. 판다스 1. 판다스 '웨스 맥키니'가 개발한 라이브러리 데이터 작어블 쉽고 직관적으로 할 수 있도록 설계된 빠르고 유연한 자료구조(데이터 프레임)를 제공하는 모듈 !pip install pandas import pandas as pd 판다스를 install 하고 import를 통해서 pd로 바꾸어 줍니다 1-1. Series와 DataFrame 1차원 표데이터는 시리즈, 2차원 표데이터는 데이터 프레임 표의 데이터 부분을 values라고 부름 표의 행 이름을 index라고 부름 표의 열 이름을 columns라고 부름 시리즈는 index, valuese로 이루어져 있고, 데이터 프레임은 index, columns, values로 이루어져 있음 시리즈와 데이터 프레임의 value는 넘파이의 ndarray 기반 da.. 2024. 4. 1. 넘파이 1. 넘파이(Numpy) 더보기 넘파이(Numpy)는 파이썬에서 사용되는 과학 및 수학 연산을 위한 강력한 라이브러리입니다. 주로 다차원 배열을 다루는 데에 특화되어 있어, 데이터 분석, 머신러닝, 과학 계산 등 다양한 분야에서 널리 사용됩니다. 넘파이 배열은 C 언어로 구현되어 있어 연산이 빠르고 효율적입니다. 특히 큰 데이터셋에서 수치 연산을 수행할 때 뛰어난 성능을 보입니다. 또한 메모리 사용을 최적화하고 효율적으로 관리합니다. !pip install numpy 먼저 필요로 하는 모듈인 numpy를 install 해줍니다 2. 넘파이의 주요 특징과 기능 2-1. 다차원 배열(N-dimensional array) 더보기 넘파이의 핵심은 다차원 배열인 ndarray 입니다. 이 배열은 동일한 자료형을 .. 2024. 4. 1. 이전 1 2 3 4 ··· 9 다음