본문 바로가기

IT 세상/검색이야기

(22)
통합 검색솔루션 대표기업 ㈜와이즈넛(대표 박재호, http://www.wisenut.com)이 2009년도 상반기 실적이 대폭 개선 통합 검색솔루션 대표기업 ㈜와이즈넛(대표 박재호, http://www.wisenut.com)이 2009년도 상반기 실적이 대폭 개선되었다고 밝혔다. 올 상반기의 수주 및 매출 실적 모두 전년 대비 2배 가까운 증가세를 나타냈으며, 역대 최대 실적을 보인 2007년을 상회한다고 전했다. ㈜와이즈넛은 상반기 동안 공공분야와 민간분야 전반에 걸쳐 실적 호조를 보이고 있다. 특히, 과거부터 전통적으로 강세를 보인 공공분야에서는 서울시청 행정포털, 한국고용정보원 포털, 문화체육관광부 정책포털, 국가지식포털 등 대민 포털과 국회도서관, 한국교육학술정보원(KERIS) 등 대용량 검색을 필요로 하는 주요 공기관의 검색사업을 주도하고 있다. 최근에는 민간분야에서 과거 외산 솔루션을 선호하던 기업들의 국산화 바람을 타고 ..
역 카테고리 빈도에 의한 계층적 분류체계에서의 문서의 자동 분류 1. 역 카테고리 빈도에 의한 계층적 분류체계에서의 문서의 자동 분류 조광제, 김준태 동국대학교 컴퓨터공학과 Automatic Text Categorization on Hierarchical Category Structure by using ICF(Inverted Category Frequency) Weighting Kwangje Cho and Juntae Kim Department of Computer Engineering, Dongguk University 요 약 본 논문에서는 문서의 자동 분류를 위한 색인어 가중치 계산 방법으로 색인어의 카테고리 분리도를 반영하는 역카테고리빈도(Inverted Category Frequency, ICF)를 정의하고, 이를 이용한 계층적 분류체계에서의 문서 분류 방법..
루씬 데모실행 및 분석 따라하기만 해보세요 루씬을 알 수 있습니다.
구글 검색엔진의 해부학 Abstract 이 논문을 통해 우리는 구글(Google)이라는, 하이퍼텍스트를 통해 나타나는 구조적 특징을 대폭 사용한 대형 검색 엔진의 프로토타입을 제시하고자 한다. 구글은 웹을 능률적으로 긁어와서 인덱싱(색인화)한 다음 (crawling & indexing) 기존의 시스템보다 훨씬 더 만족스런 검색 결과를 나타낼 수 있도록 디자인되었다. 최소 2천 4백만 페이지로 이뤄진 하이퍼링크 데이타베이스와 풀 텍스트로 이뤄진 구글의 프로토 타입은 http://google.stanford.edu의 주소로 이용해 볼 수 있다. 검색엔진을 제작한다는 것은 상당히 도전적인 과제다. 검색 엔진은 수억에서 수십억 개의 웹 페이지와 수억-수십억 개의 용어들을 함께 인덱싱한다. 또한 검색엔진은 매일 수천 만 개의 질의어에 ..
루씬으로 만든 데스크탑 검색엔진 "regain" http://regain.sourceforge.net/index.php 루씬으로 만든 데스크탐 검색엔진
검색으로 세상을 바꾼 구글 스토리 구글 멋져요~~~!! 구글 같은 회사를 만들어 볼거여...