[Python] Selenium 사용하는 법(feat. chromedriver 설치)
·
Python
0. Selenium 이란? 웹 크롤링을 하는 과정에서 로그인이 필요한 경우, 또는 해당 웹사이트가 프로그램을 통한 접근을 막은 경우, 동적으로 생성된 정보를 가져와야하는 경우 등 requests, beautifulsoup로는 페이지를 수집하는 것에 한계가 있다. 셀레니움(Selenium)은 이럴 때 브라우저를 조작할 수 있게 도와주는 라이브러리이다. 원래 Selenium은 웹 애플리케이션을 테스트하기 위한 목적으로 만들어진 포터블 프레임워크지만 웹 크롤링을 할 때 직접 브라우저를 자동 제어하는 것에 큰 도움이 되었기 때문에 웹 크롤링에 많이 쓰이게 되었다. 1. 셀레니움 라이브러리 설치 먼저 터미널을 이용해 셀레니움 라이브러리를 설치해주자.pip install selenium 주피터 노트북에서 앞에..
[파이썬] Numpy 정리
·
Python
데이터 사이언스를 위한 라이브러리¶1. Numpy¶Numpy란 "Numerical Python"의 약자로 대규모 다차원 배열과 행렬 연산에 필요한 다양한 함수를 제공하는 라이브러리이다. 파이썬의 list를 개선한 형태인 Numpy의 ndarray 객체는 더 많은 데이터를 더 빠르게 처리할 수 있도록 도와준다.넘파이는 N차원 배열 객체, 선형대수학, 푸리에 변환 및 난수 기능, 범용적 데이터 처리를 위한 다차원 컨테이너 등의 기능을 제공한다. Numpy를 사용하기 위해 아래와 같이 선언해주면 된다.In [2]:import numpy as npnp.__version__Out[2]:'1.20.3' Tip! 만약 모든 출력을 보고 싶다면 아래와 같이 적어주면 된다.In [3]:from IPython.core.i..
[파이썬] heapq 힙큐 사용하기
·
Python
Heapq DocumentPython docs homepage 1. Heap 이란?힙은 최댓값과 최솟값을 찾는 연산에 특화된 완전 이진트리이다. 힙의 종류로는 최소힙과 최대힙이 있는데, 자료값이 낮은 것이 루트로 오면 최소힙, 자료값이 높은 것이 루트로 오면 최대힙이라고 한다. 이를 이용해 우선순위를 쉽게 정할 수 있다는 장점이 있다.이런 우선순위 힙을 이용한 대표적인 예로는 우선순위 힙을 사용한 개선된 다익스트라 알고리즘이다. 파이썬에서 힙을 사용하기위해 heapq를 선언하는 방법은 아래와 같다.import heapq 2. heapq의 메소드heapq.heapify(iterable)원래 있던 리스트를 힙으로 사용하기위해서는 먼저 힙화(heapify)를 진행해야하는데, 위의 메소드를 사용해 쉽게 진..
[파이썬] any()와 all()
·
Python
1. any()any는 반복 가능한 자료형을 파라미터로 받으며, 이 파라미터 중에 하나라도 True면 True를 반환한다. 만약 모두 False라면 False를 반환하는 함수이다. OR연산과 비슷한 성격을 갖고 있다. 아래는 True를 반환하는 예이다. 두 번째 예시를 보면 0, False는 거짓이지만 1이 참이기 때문에 True를 리턴하는 것을 확인할 수 있다.any([1,2,3,4,5]) # True 반환any([0, False, 1]) # True 반환 0, ""(빈 문자열), [](빈 배열) 모두 False를 의미하기에 모두 False를 반환한다.any([0, False, 0]) # False 반환any([]) # False 반환any(["", 0]) # F..
[파이썬] 파이썬 기초 요약
·
Python
파이썬 속성 강좌출처"Data Science from scratch" - 저자 Joel Grus1. 기본기 다지기파이썬에는 설계 원칙에 대한 일종의 교리인 'The Zen of Python'이 있다.여기서 가장 중요한 것은 "어떤 일에든 명확한-바람직하고 유일한 방법이 존재한다"라는 말이다.명확한 방식으로 쓰여진 코드를 일반적으로 '파이썬스럽다(Pythonic)'이라고 한다. 이제부터 파이썬에 대해 알아보자."아름다움이 추함보다 좋다. 명시가 암시보다 좋다. 단순함이 복잡함보다 좋다."2. 파이썬 설치python.org 또는 아나콘다(Anaconda) 배포판3. 가상환경matplotlib 라이브러리 사용하여 데이터 시각화를 해야하는데,matplotlib은 파이썬에서 기본적으로 제공하는 라이브러리가 아니기..
[파이썬] 배열에 사용되는 함수
·
Python
1. append()배열에 요소를 추가한다.arr = [1, 2, 3]arr.append(4)arr.append(3)print(arr)-출력값> [1, 2, 3, 4, 3] 2. remove()해당 요소를 제거한다.myWord = ["123", "456", "789"]myWord.remove("456")print(myWord)- 출력값> ['123', '789'] 3. set()중복 제거 가능arr = [1, 1, 1, 2, 2, 3, 4, 5, 5, 6, 7, 7]arr = set(arr)print(arr)arr = list(arr)print(arr)- 출력값> {1, 2, 3, 4, 5, 6, 7}> [1, 2, 3, 4, 5, 6, 7] 4. index()해당요소가 배열의 몇 번째에 위치하는 ..