Set
Coding Practice/Python2024. 7. 19. 15:34Set

파이썬에서 집합을 다룰 일이 생긴다면 어떤 함수를 써야할까?바로 Set함수이다.Set함수는 기본적으로 제공되는 함수라 따로 라이브러리에서 import할 필요는 없다.그럼 본격적으로 알아보자! List to Set집합을 어떻게 만들어야하는지는 간단하다.List에 set()함수를 사용하기만 하면 된다.s1 = set([1, 2, 3])print(s1)#{1, 2, 3} set 자료형의 특징은 중복과 순서가 없다는 것이다.List 나 tuple의 경우 순서가 있어 인덱싱(indexing)이 가능하나, set은 불가능하다.인덱싱이 필요하다면 list()나 tuple()함수를 통해 다시 변환을 먼저 해줘야한다. 집합은 왜 사용할까?당연하게도, 대부분의 경우 교집합, 합집합, 차집합이 필요한 경우에 많이 사용하게 ..

List - 요소 별 Count
Coding Practice/Python2024. 7. 16. 19:02List - 요소 별 Count

List는 가장 기본이 되는 자료구조이다.종종, List 내 요소들에 대해 Counting을 알고 싶어질 때가 있는데,그럴 땐 Collections 라이브러리의 Counter 함수를 활용하면 된다.List의 요소가 문자열이 아닌 숫자여도 동일하게 사용하면 된다.from collections import Counter# 예시 리스트elements = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple', 'kiwi', 'kiwi']# Counter를 사용하여 요소별 개수 세기element_counts = Counter(elements)# 결과 출력print(element_counts)#Counter({'apple': 3, 'banana': 2, 'orange..

Data Frame - to_list(), tolist()
Coding Practice/Python2024. 7. 13. 11:44Data Frame - to_list(), tolist()

데이터 프레임(Data Frame)을 사용하면서 많이 사용하는 부분 중 하나인 List 변환에 대해서 알아보고자 한다.to_list() and tolist()데이터 프레임을 List로 변환하는 것은 to_list() 함수 혹은 tolist() 함수를 통해 변환할 수 있다.코드는 다음과 같다.import pandas as pddf = pd.read_csv("./서울특별시 은평구_원룸 및 오피스텔 현황_20240704.csv", encoding='cp949')#대지위치={Column name}df.대지위치.to_list()df.대지위치.tolist()그렇다면 to_list()와 tolist() 함수의 차이점은 무엇일까?사실 데이터 프레임의 Series 객체에..

Data Frame - 읽기, 저장, 전체 출력
Coding Practice/Python2024. 7. 10. 16:03Data Frame - 읽기, 저장, 전체 출력

데이터프레임(Data Frame)은 파이썬에서 데이터를 다루기 위해서는 필수적으로 사용하는 자료구조이다.데이터프레임을 사용하다보면 기초적인 부분이지만 아주 유용하게 쓰이는 부분 몇 가지를 정리하고자 한다.데이터프레임은 Padnas 라이브러리를 사용하면 대부분의 작업들은 손쉽게 할 수 있다.개인적으로, 컴퓨터 활용 능력 1급이 있지만... 파이썬으로 데이터프레임을 다루는 것이 훨씬 직관적이고 편리한 것 같다.읽기먼저, 가장 기본적인 데이터 프레임을 읽고 쓰는 것이다.데이터 프레임을 읽는 것 즉, 불러오는 것은 read_csv()함수를 활용하면 된다.import pandas as pdpd.read_csv("{file path and name}.csv", header=None)pd.read_csv("{file..

UnicodeDecodeError 'utf-8'
Errors2024. 7. 7. 14:41UnicodeDecodeError 'utf-8'

오늘은 자주 발생하지만 간단한 오류인  오류에 대해 알아보고자 한다. 한글 파일을 데이터 프레임으로 불러오려다 보면 다음과 같은 오류가 발생하는 경우가 있다. 해당 오류는 한글 파일을 utf-8 형식으로 decoding하지 못해 발생하는 오류로 해결 방법은 간단하다.다음 코드처럼 파일을 불러올 때, encoding을 utf-8이 아닌 cp949로 변경해주면 된다.import pandas as pdpd.read_csv("./서울특별시 은평구_원룸 및 오피스텔 현황_20240704.csv", encoding='cp949')

Language Model
Lectures/Basic NLP2024. 4. 17. 12:30Language Model

2024.04.15 - [Lectures/Basic NLP] - Count based Word Representation Count based Word Representation2024.03.02 - [Lectures/Basic NLP] - Introduction & Word Vectors Introduction & Word Vectors Before the Start 스탠포드 강좌는 딥러닝을 배우는 모든 이들의 바이블이 아닐까? Andrew Ng(앤드류 응) 교수님 강좌를 듣고 나서 Clazyhand.tistory.com이번 글에서는, Word Representation 기법들 중 Machine-learning 알고리즘에 속하는 방식들을 알아보고자 한다.그러나, 그 전에 언어 모델에 대해서 알아야하기에..

Count based Word Representation
Lectures/Basic NLP2024. 4. 15. 02:03Count based Word Representation

2024.03.02 - [Lectures/Basic NLP] - Introduction & Word Vectors Introduction & Word VectorsBefore the Start 스탠포드 강좌는 딥러닝을 배우는 모든 이들의 바이블이 아닐까? Andrew Ng(앤드류 응) 교수님 강좌를 듣고 나서 CS224N과 CS224W존재를 알게 되었다. 그전까지는 인터넷을 돌아다니며 여lazyhand.tistory.com이전글에서 언급했듯이, 앞으로 Word Embedding에 대해 차근차근 소개할 예정이다.가장 먼저, 소개할 부분은 Deep-learning의 근간이 되는 Machine-learning 알고리즘으로는 볼 수 없는 방식이다.물론, Machine-learning 알고리즘이 아닐 뿐 이를 통..

History of Neural Network
Deep Learning2024. 4. 4. 23:33History of Neural Network

오늘은 Deep Learning의 기초인 Neural Network의 역사에 대해 알아보고자 한다. Neural Network의 역사는 다음과 같다. A neuron (or a perceptron) (1958~) 사람의 신경망을 본떠서 만든 모델로, (1) weighted sum of inputs과 (2) an activation function으로 구성되어 있다 Input에 대한 각 가중치 그리고 이에 대한 Bias의 합들을 weighted sum을 한 후, activation function을 통해 예측 결과를 도출한다. 처음 Perceptron이 고안되었을 때는 Step function이라는 현재는 사용하지 않는 activation function을 사용했다. Step function은 정말 단순하..

image