목록Basic (70)
HappyWeasel
조건으로 검색하기 numpy array와 마찬가지로 masking 연산이 가능하다. import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(5, 2), columns=["A", "B"]) print(df["A"] 0.3)) ''' 0 False 1 True 2 True 3 True 4 True dtype: bool ''' print(df.query("A 0.3")) ''' A B 1 ..
구조화된 데이터를 효과적으로 처리하고 저장할 수 있는 파이썬 라이브러리. Array 계산에 특화된 numpy를 기반으로 만들어져서 다양한 기능들을 제공한다. Series numpy array가 보강된 형태 Data와 Index를 가지고 있다. 즉, numpy array에 없는 index가 추가 된 것이다. import pandas as pd data = pd.Series([1, 2, 3, 4], index=['a', 'b', 'c', 'd']) data['b'] # 2 # index가 정수가 아닐 수도 있다. 딕셔너리로 만들 수 있다. population_dict= { 'korea': 5180, 'japan': 12718, 'china': 141500, 'usa': 32676 } population = ..
Numerical Python Python에서 대규모 다차원 배열을 다룰 수 있게 도와주는 라이브러. 파이썬 리스트로도 계산 할 수 있지만 numpy는 list에 비해서 빠른 연산을 지원하고 메모리를 효율적으로 사용한다. 리스트와 다르게 array는 단일 타입으로 구성된다. list(range(10)) # [0,1,2,3,4,5,6,7,8,9] import numpy as np np.array([1,2,3,4,5]) #리스트를 array로 변환 #array([1,2,3,4,5]) 배열 만들기 np.array([1, 2, 3, 4, 5]) # array([1, 2, 3, 4, 5]) np.array([3, 1.4, 2, 3, 4]) # array([3. , 1.4 , 2. , 3. , 4.]) # 리스트 ..
words = ['real', 'man', 'rhythm'] r_words = [word for word in words if word.startwith('r')] # filter를 사용 def starts_with_r(word): return word.startswith('r') #lambda 사용 starts_with_r = lambda word: word.startswith('r') # starts_with_r 함수의 return 값이 True만 가져온다. r_words = filter(starts_with_r, words) filter도 map과 동일하게 연산을 하겠다고 약속만 한 상태이다. # CSV 모듈을 임포트합니다. import csv def get_titles_of_long_books(b..
def get_eng_title(row) split = row.split(',') return split[1] #row마다 get_eng_title 함수를 돌면서 return 데이터를 eng_title에 저장한다. eng_title = map(get_eng_title, movies) # lambda 이용 eng_title = map( lambda row: row.split(',')[1] movies ) map의 장점 map은 실제로 리스트 결과를 가지고 있는 것이 아니라 map이라는 object만 가지고 있다. 계산을 하겠다고 약속만 한 상태이다. 사용자가 해당 결과가 필요할 때 계산 후 결과를 알려준다. 이에 대한 이점으로 미리 계산을 하지 않으므로 결과가 필요없으면 시간 소요x, 메모리 낭비 x # ..
def square(x): return x * x # 위와 동일 square = lambda x: x * x def get_eng_title(row): split = row.split(',') return split[1] sorted(movies, key=get_eng_title) #위와 동일 get_eng_title = lambda row: row.split(',')[1] sorted(movies, key=get_eng_title) #위와 동일 sorted(movies, key=lambda row: row.split(',')[1]) #assert def square1(x): return x * x square2 = lambda x: x * x # 두 값이 같으면 통과(True), 아니면 에러(False..
import csv with open('movies.csv') as file: reader = csv.reader(file, delimiter=',') for row in reader: print(row[0])
집합을 의미한다. 특징 순서가 없다 set = {1,2,3} / set = {3,2,1} : 동일한 집합이다. 중복이 없다 set = {1,2,3,3,4,4,5} / set = {1,2,3,4,5} 로 인식한다. 원소 추가/삭제 num_set = {1,3,5,7} num_set.add(9) # 9를 추가 num_set.update([3,15,4]) # 새로운 원소들로 덮어씌운다 num_set.remove(7) # 7을 삭제 (값이 반듯이 존재해야한다. 오류발생) num_set.discard(13) # 13을 삭제(값이 없으면 무시) 집합 연산 set1 = {1,3,5,7} set2 = {1,3,9,27} union = set1 | set2 #합집합 intersection = set1 & set2 # 교집..