최신글모든게시글모음 인기글(7일간 조회수높은순서)
m-5.jpg
현재접속자

어여 어서 올라오세요

대청마루(자유게시판)

동네 사람들의 정담이 오고가는 대청마루입니다. 무슨 글이든 좋아요.

robots.txt를 현명하게 사용하는 방법

홈페이지 최용우............... 조회 수 3132 추천 수 0 2012.09.15 08:57:19
.........

robots.txt를 현명하게 사용하는 방법

Search Quality팀 석인혁, Chao Ma


검색엔진
자신의 사이트를 많은 사람에게 알릴 수 있는 가장 좋은 방법 중 하나입니다. 이를 활용하기에 앞서 고려해야 할 것은 여러분들의 사이트에 있는 정보를 얼마 만큼 외부에 제공할 것인가를 설정하는 일입니다.

만약 여러분의 사이트에 검색엔진을 통해 색인이 생성되지 않도록 하려는 콘텐츠가 있다면, robots.txt 파일을 사용하여 웹을 색인하는 검색엔진 로봇(이하 "검색봇")을 차단하거나 필요한 부분만을 검색엔진에 나타나게 할 수 있습니다. 검색봇은 자동으로 작동하며, 한 사이트의 하위 페이지에 접근하기 전에 먼저 특정 페이지에 대한 접근을 차단하는 robots.txt 파일이 있는지 여부를 확인합니다. 이번 기회를 통하여 여러분들에게 올바르게 robots.txt를 사용하는 방법을 제공하고자 합니다.

robots.txt 의 배치

robots.txt는 HTML 파일이 아닌 일반 텍스트 파일로 도메인의 root에 있어야 하며 반드시 'robots.txt'로 저장되야 합니다. 검색봇은 도메인의 root에 있는 robots.txt 파일만을 체크하기 때문에 하위 디렉토리에 있는 파일은 유효하지 않습니다.

예를 들어 http://www.example.com/robots.txt는 유효한 위치이지만, http://www.example.com/mysite/robots.txt는 유효하지 않습니다.

robots.txt 사용 예제:
User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/

Disallow: /~name/

robots.txt 파일을 사용하여 전체 웹사이트를 허용/차단하기


전체 웹사아트를 검색엔진이 색인하도록 허용하고자 할 때에는 다음과 같이 robots.txt
일을 추가합니다.
User-agent: *
Disallow:

또 다른 해결 방법으로는 단순하게 robots.txt를 사이트로부터 제거 하는 것입니다.

검색엔진에서 사이트를 삭제하고 향후 어떤 검색봇도 접근하지 못하게 하려면 robots.txt 파일에 다음 내용을 추가합니다.
User-agent: *
Disallow: /

주의) 이 경우 검색봇이 차단되어 사이트가 더이상 검색엔진에 나타나지 않게 됨으로 검색엔진을 통 들어오게 되는 사용자들에게 불이익을 제공하게 됩니다.

각 포트에는 전용 robots.txt 파일이 있어야 합니다. 특히 http와 https 모두를 통해 사용자들에 콘텐츠를 제공하려면 이 두 가지 프로토콜에 대해 각각의 robots.txt 파일이 있어야 합니다.

예를 들어 검색봇을 통해 https 페이지를 제외한 모든 http 페이지에 대한 수집을 허용하려면 다음 robots.txt 파일들을 각의 프로토콜에 사용해야 합니다.

http 프로토콜의 경우
(http://yourserver.co.kr/robots.txt):
User-agent: *
DIsallow:

https 프로토콜의 경우
(https://yourserver.co.kr/robots.txt):

User-agent: *
Disallow: /

robots.txt 파일을 사용하여 페이지 차단하기

예를 들어, 검색봇이 특정 디렉토리(: board )의 모든 페이지를 검색하지 않도록 차단하려면 다음과 같이 robots.txt를 사용 하시면 됩니다.
User-agent: *
Disall
ow: /board/

Googlebot이 특정 형식(: .gif)의 파일을 모두 검색하지 않도록 차단하려면 다음과 같이 robots.txt를 사용 하시면 됩니다.
User-Agent: Googlebot
Disallow: /*.gif$

Googlebot이 ?가 포함된 URL 즉, 도메인 이름으로 시작되거나 임의의 문자열 또는 물음표로 구성된URL 검색을 차단하려면 다음과 같이 하시면 됩니다.
User-agent: Googlebot
Disallow: /*?

구글은 웹마스터 도구의 일원으로 robots.txt 분석 도구를 사용자들에게 제공하고 있습니다. robots.txt 분석도구는 여러분의 robots.txt 화일을 검색봇이 읽는 그대로 인식하여 그 결과를 여러분들께 제공하고 있습니다. robots.txt의 올바른 사용으로 사이트 방문자에게 보다 쉬운 접근 방법을 제공하는 동시에 필요한 부분을 보호, 차단할 수 있기 바랍니다.

List of Articles
번호 제목 글쓴이 날짜 조회 수
126 홈페이지 프로그램 설치없이 png 파일 만들기 최용우 2024-03-19 12
125 홈페이지 AVAST에서 경고문이 뜹니다. [1] 장목사 2022-01-19 47
124 홈페이지 프로그램 설치 없이 웹페이지에서 GIF만들기 다람지 2020-12-24 56
123 홈페이지 캐논 프린터 5b00 에러 완벽 해결 file [1] IUbunam 2020-07-22 179
122 홈페이지 윈도우7 부팅시 사용자계정 선택 화면을 없애기 file cyw 2015-02-11 1746
» 홈페이지 robots.txt를 현명하게 사용하는 방법 최용우 2012-09-15 3132
120 홈페이지 파일첨부 100%에서 증발 하는 문제 해결 최용우 2012-03-27 2237
119 홈페이지 XE1.5.1 업그레이드 -Fatal error가 날 경우 [1] 최용우 2012-02-18 2152
118 홈페이지 XE1.5.1 업그레이드 전 준비사항 최용우 2012-02-18 1450
117 홈페이지 무분별한 스팸글 등록으로부터 임시해결 팁 file 최용우 2011-10-29 1471
116 홈페이지 로그인 & 파일 첨부 문제 최용우 2011-10-09 1115
115 홈페이지 XE1.4.5.10 file 최용우 2011-09-05 1650
114 홈페이지 소시랑 한줄메모 스킨 file 최용우 2011-09-02 2516
113 홈페이지 납치태그를 모두 금지단어로 등록시켰습니다. 최용우 2011-07-01 1505
112 홈페이지 회원가입 할때 닉네임 필요없이 이름만 입력 받으려면 최용우 2011-06-26 1563
111 홈페이지 관리자 아이디로 embed를 볼 수 없을 때 xe 2011-06-26 1319
110 홈페이지 유용한 컴퓨터 팁 30개 최용우 2011-06-25 2566
109 홈페이지 유용한 컴퓨터 팁 22개 최용우 2011-06-25 2749
108 홈페이지 홈페이지 접속시 XE를 바로 실행하기(XE를 /xe/ 폴더에 설치한 경우) 최용우 2011-06-18 1672
107 홈페이지 CD를 ISO(이미지파일)로 변환하는 방법 file 김한영 박사 2011-06-03 5752
106 홈페이지 포토샵 택스트 크기 조절하기 file 나무 2011-05-02 2233
105 홈페이지 웹톡 설정 file 최용우 2011-04-13 1856
104 홈페이지 XE Core 1.4.5 업데이트 정보 [1] 영자 2011-03-31 4420
103 홈페이지 AMR파일 변환 [1] 최용우 2011-02-05 5186
102 홈페이지 대한민국 인터넷 보안 정책 유감 이경희 2011-02-03 1392
101 홈페이지 QR코드 생성 file QR코드 생성 2010-07-24 7546
100 홈페이지 [HTML] IE8에서 IE6,7 과 동일하게 보이게 하기 나모 2010-07-18 2242
99 홈페이지 홈페이지 접속수 올리는 13가지 비결 - 최용우 2010-04-26 2099
98 홈페이지 방문수(Visits)와 순방문자(UV)| 최용우 2010-04-26 2398
97 홈페이지 익스플로러나 메신저에서 한글 입력이 제대로 안될 때 최용우 2010-02-15 3348
96 홈페이지 너도나도 다 아는 팁... 한/영키 안먹힐때 [1] 오델라가푸 2010-02-03 2658
95 홈페이지 컴퓨터가 느려졌을 때 이렇게 해보세요 버터 2010-01-12 5355
94 홈페이지 플레너 기념일 설정 방법 최용우 2009-12-11 2287
93 홈페이지 홈페이지 로딩속도를 빨라지게 하는 10가지팁 우리아기 2009-11-29 2285
92 홈페이지 인터넷 옵션 각 항목별 설정 설명 최용우 2009-11-23 6331
    본 홈페이지는 조건없이 주고가신 예수님 처럼, 조건없이 퍼가기, 인용, 링크 모두 허용합니다.(단, 이단단체나, 상업적, 불법이용은 엄금)
    *운영자: 최용우 (010-7162-3514) * 9191az@hanmail.net * 30083 세종특별시 금남면 용포쑥티2길 5-7 (용포리 53-3)
XE Login