Information Retrieval

검색엔진

Vertical Search Engine: 온라인에 있는 전체 내용이 아니라 특정 문서 형식, 특정 주제에 한정한 검색. 더 자세한 결과를 더 정확하게 검색할 수 있다. e.g. 논문 검색시 구글 스칼라 검색

검색 엔진의 역할

  • indexing
  • querying
  • ranking

강의

CS276 IR and Web Search by Chris Manning, Dan Jurafsky Pandu Nayak

PageRank

HITS: 초기에 아카데믹으로만 접근하고 사업화 하지 않아 페이지랭크에 비해 유명하지 않음. 또한 미리 계산하는 페이지랭크와 달리 검색시 계산해야 하는 부담이 있다.

BM25

수식을 그래프로 표현1해서 설명. 루씬 BM25 도입 이후 소개.

BM25는 문서 길이 정규화document length normalization 수식을 포함하기 때문. b는 document length normalize degree를 제어한다. 낮을수록 문서 길이에 영향을 받지 않고 score 일정(사실상 tfidf와 동일)

기존에 블로그에 정리했던 글:

Last Modified: 2022/01/19 02:21:51

is a collection of Papers I have written.
© 2000 - Sang-Kil Park Except where otherwise noted, content on this site is licensed under a CC BY 4.0.
This site design was brought from Distill.