검색 5

역 카테고리 빈도에 의한 계층적 분류체계에서의 문서의 자동 분류

1. 역 카테고리 빈도에 의한 계층적 분류체계에서의 문서의 자동 분류 조광제, 김준태 동국대학교 컴퓨터공학과 Automatic Text Categorization on Hierarchical Category Structure by using ICF(Inverted Category Frequency) Weighting Kwangje Cho and Juntae Kim Department of Computer Engineering, Dongguk University 요 약 본 논문에서는 문서의 자동 분류를 위한 색인어 가중치 계산 방법으로 색인어의 카테고리 분리도를 반영하는 역카테고리빈도(Inverted Category Frequency, ICF)를 정의하고, 이를 이용한 계층적 분류체계에서의 문서 분류 방법..

도대체 블로그로 돈은 어떻게 버는거야?

블로그로 돈을 버는 시대가 되었다. 이미 예전부터 인터넷이 전 세계의 매체가 되면서 인터넷 조금만 하면 돈버는 세상이 된것이다. 나도 요즘 쫓아 해보려 블로그 시작했는데... 생각만큼 쉽지가 않다. 에드센스라는 곳에 가입을 해서 광고글을 받아내야 한다. 허나, 벌써 3번 낙방하였다. 가입이 된다해도, 문제다. 기존 에드센스 유저들이 하나같이 수익이 10분의 1로 떨어졌다 하니.. 그래도, 어찌하랴.. 이것이 무한 경쟁시대..자유경쟁시대의 산물인 것을... -------------------------------------------------- 안녕하세요 Lee Hyun Min님, Google 애드센스에 관심을 가져 주셔서 감사합니다. 귀하의 신청서를 검토한 결과 유감스럽게도 지금으로서는 신청서를 승인할..

여러이야기 2007.11.22

구글 검색엔진의 해부학

Abstract 이 논문을 통해 우리는 구글(Google)이라는, 하이퍼텍스트를 통해 나타나는 구조적 특징을 대폭 사용한 대형 검색 엔진의 프로토타입을 제시하고자 한다. 구글은 웹을 능률적으로 긁어와서 인덱싱(색인화)한 다음 (crawling & indexing) 기존의 시스템보다 훨씬 더 만족스런 검색 결과를 나타낼 수 있도록 디자인되었다. 최소 2천 4백만 페이지로 이뤄진 하이퍼링크 데이타베이스와 풀 텍스트로 이뤄진 구글의 프로토 타입은 http://google.stanford.edu의 주소로 이용해 볼 수 있다. 검색엔진을 제작한다는 것은 상당히 도전적인 과제다. 검색 엔진은 수억에서 수십억 개의 웹 페이지와 수억-수십억 개의 용어들을 함께 인덱싱한다. 또한 검색엔진은 매일 수천 만 개의 질의어에 ..