IT 세상 236

구글 검색엔진의 해부학

Abstract 이 논문을 통해 우리는 구글(Google)이라는, 하이퍼텍스트를 통해 나타나는 구조적 특징을 대폭 사용한 대형 검색 엔진의 프로토타입을 제시하고자 한다. 구글은 웹을 능률적으로 긁어와서 인덱싱(색인화)한 다음 (crawling & indexing) 기존의 시스템보다 훨씬 더 만족스런 검색 결과를 나타낼 수 있도록 디자인되었다. 최소 2천 4백만 페이지로 이뤄진 하이퍼링크 데이타베이스와 풀 텍스트로 이뤄진 구글의 프로토 타입은 http://google.stanford.edu의 주소로 이용해 볼 수 있다. 검색엔진을 제작한다는 것은 상당히 도전적인 과제다. 검색 엔진은 수억에서 수십억 개의 웹 페이지와 수억-수십억 개의 용어들을 함께 인덱싱한다. 또한 검색엔진은 매일 수천 만 개의 질의어에 ..

트랙백이란?

정보컴퓨터광주스터디모임 서 발췌했어욤~! 트랙백이 무엇인가? 간단히 말해서, 트랙백은 웹사이트 간에 서로 뭔가를 알려줄 수 있는 수단을 제공하기 위해 만들어진 것입니다. A라는 사람이 B라는 사람에게, "B님께서 관심을 가지실 만한 거예요."라고 말해주는 방법입니다. 그렇게 하기 위해서는, A라는 사람이 B라는 사람에게 "트랙백 핑" (TrackBack Ping)을 보냅니다. [트랙백 핑: 여기서 핑이란 어떤 한 웹서버에서 다른 웹서버로 보내는 작은 메시지를 의미합니다.] A라는 사람이 B라는 사람 웹로그의 어떤 글에 대해 코멘트하는 글을 자신의 웹로그에 올렸다고 합시다. 그렇다면 이것은 "원격 코멘트" (remote comments)의 형태입니다. ― B의 웹로그에 직접 코멘트를 쓰는 것이 아니라, A..

IT 세상 2007.11.11