본문 바로가기

FOR

Web Crawler 011 - Adding Links to Queue - 링크를 웨이팅 리스트에 추가하기. 이번 시간에는 이전 시간에 이어서 웹페이지에서 찾아낸 링크들을 waiting list 에 추가하는 함수를 만들어 보도록 하겠습니다. 어떤 특정 사이트에 있는 전체 웹페이지들을 크롤링하기 위해서 해당 사이트의 홈페이지를 들어가고 거기서 링크를 타고 타고 가서, 해당 사이트의 모든 링크들을 찾을 것입니다. 이렇게 찾아낸 링크 값들을 waiting list 에 넣게 하는 스파이더와 waiting list 에 저장이 된 링크들을 각각 따로 크롤링 할 스파이더들을 만들어야 합니다. 이와 같은 일련의 과정중 전자인 찾은 링크들을 waiting list ( queue) 에 넣어주기 위한 함수를 만들것 입니다. 우선 아래와 같이 찾은 링크를 인자로 받는 함수를 선언해 줍니다. ▼만약 전달 받은 링크의 url 값이 qu.. 더보기
[PYTHON 3] Tutorials 23. Downloading Files from the web - 파일 다운로드 하기 using 파이썬 안녕하세요. 이번 시간에는 지난 시간의 이미지(사진) 다운받기에 이어 파일을 다운받아 보도록 하겠습니다. 이미지 다운과는 약간 다르지만, 크게 어렵지는 않으니 느긋하게 읽어보시면 쉽게 이해할 수 있을 겁니다. 그럼 시작하겠습니다. 주식 분석을 위한 시세 자료를 다운 받기 할 예정입니다. 이제까지는 import 뒤에 불러올 모듈명을 바로 적어 주었습니다. 그런데 아래 그림은 앞에 from 을 적어주고 import 뒤 모듈명을 적어 주었네요. 이는 추후에 클래스를 다룰때 보다 자세히 설명드려야 할 사항이므로 지금은 그냥 넘어가셔도 무방합니다. ▼ 주식 관련 CSV(Comma Separated Value)파일을 찾아보았는데, 야후 파이낸스에 올라와 있더군요. 그래서 'finance.yahoo.com'으로 접속.. 더보기
[PYTHON 3] Tutorials 7. for - 반복문 안녕하세요. 이번 시간에는 파이썬의 반복문을 알아보고자 합니다. 반복문 중에서도 'for' 반복문을 다룰까 합니다. 반복문(Loop)의 기본 개념은 동일한 일을 사람이 하면 쉽사리 지칠만한 일을 컴퓨터가 하면 수천, 수만, 많게는 무한대까지 같은일을 시킬 수 있게 해 주는 명령입니다. 각설하고 시작하겠습니다. 우선 foods 라고 하는 List(배열)을 만들고 거기에 속할만한 단어들을 넣어 주었습니다. 현재 foods 에는 총 5개의 음식이 들어 있군요. 파이썬에서 사용하는 반복문(loop) 중 for 의 기본 형태는 위와 같습니다. in foods: => foods 안에 있는 것들을 for f => 각각을 f 라고 임의로 지정하고 반복을 하라. 는 의미입니다. 즉, foods 안의 값들을 임의의 값 f.. 더보기