본문 바로가기

python 3

Web Crawler 012 - Domain Name Parsing - 도메인 네임 파싱하기. 안녕하세요. 이번 시간에는 크롤러가 어느 웹사이트를 크롤링 할지를 정해주는 도메인 네임에 대해 알아보고자 합니다. 인터넷은 참으로 광범위한 공간이죠. 만약 이러한 공간을 특별한 조건없이 크롤링하게 한다고 하면 어떻게 될까요? 아마도 내 컴퓨터의 모든 자원은 전세계 인터넷을 뒤지고 다니느라 바빠질 것입니다. 이러한 무한 루프를 방지하기 위해서는 특정한 조건을 주어 이 범위를 만족하는 사이트들만 크롤링 하라고 명령을 내려야 할 것입니다. 그래서 필요한 것이 도메인 네임입니다. 제 블로그를 기준으로 얘기를 하자면, 여기의 주소는 https://creativeworks.tistory.com 입니다. 여기에서 도메인 네임은 tistory.com 이 됩니다. 만약 tistory.com 을 제가 혼자 다 사용하고 있.. 더보기
[PYTHON 3] Tutorials 4. Slicing up Strings 안녕하세요. 이번에는 문자열(strings)을 slicing up 하는 것을 다뤄보겠습니다. 우선 터미널을 열고 파이썬 인터프리터를 구동시킵니다. user 라는 변수에 문자열 "Barack Obama" 라고 하는 임의의 값을 할당해 주었습니다. 사람들은 숫자를 세어 보라고 하면 1부터 카운팅을 하지만, 컴퓨터는 0부터 카운팅을 합니다. 이는 비단 다른 컴퓨터 언어도 마찬가지이므로 기억해 두시면 좋겠습니다. 변수 user 의 첫번째 값이 뭔지 확인해 보려고 user[0] 을 입력하니 'B' 라고 알려주네요. 이번에는 user 안의 8번째(0부터 카운팅하니 8번째가 되겠죠?)값은 대문자 'O' 이네요. 물론 왼쪽부터 알아볼 수도 있지만, 오른쪽에서도 위의 그림처럼 slicing up 할 수 있습니다. 여기에.. 더보기