블로그 에세이

검색 알고리즘의 원리

구글에서 밝히는 검색 알고리즘에 대해서 알아 봅니다.
원문 출처:
https://www.google.com/intl/ko/search/howsearchworks/algorithms/
사용자는 질문에 대한 답을 원하지, 수십억 개의 웹페이지를 원하는 것이 아닙니다. 그래서 Google의 순위 시스템은 유용하고 관련성 높은 검색결과를 신속하게 제공할 수 있도록 수천억 개의 웹페이지를 검색 색인에 정렬해 둡니다.


이러한 순위 시스템은 사용자가 어떤 항목을 찾고 있는지, 어떤 정보가 사용자에게 반환되는지 분석하는 일련의 알고리즘으로 구성되어 있습니다. 또한 Google은 검색 기능을 개선하면서 Google 서비스의 효과적인 작동을 위하여 검색 알고리즘이 검색어와 검색결과를 보다 세부적으로 분석하도록 했습니다.

다음은 Google에서 웹의 유용한 정보를 표시하기 위해 검색 알고리즘을 활용하는 몇 가지 방법입니다.

검색어를 페이지와 맞추기
다음으로 검색어와 일치하는 정보가 포함된 웹페이지를 검색합니다. 사용자가 가장 기본적인 수준에서 검색을 실행하면, Google 알고리즘이 색인에서 검색어를 검색하여 적절한 페이지를 찾습니다. 알고리즘은 해당 키워드가 페이지에서 제목이나 텍스트 본문 등 어떤 위치에 얼마나 자주 표시되는지 분석합니다.

단어 분석
우수한 답변을 제공하려면 검색어의 의미를 이해하는 것이 중요합니다. 따라서 관련 정보가 포함된 페이지를 찾기 위한 첫 번째 단계는 검색어에 포함된 단어가 무엇을 의미하는지 분석하는 것입니다. Google은 색인에서 어떤 일련의 단어를 찾아봐야 하는지 해석하기 위한 언어 모델을 구축합니다.

여기에는 철자 오류를 해석하는 것과 같이 간단한 단계가 포함되어 있으며, 더 나아가 자연 언어 이해에 관한 몇몇 최근 연구 결과를 적용하여 사용자가 입력한 검색어의 유형을 인식할 수 있게끔 하고 있습니다. 예를 들어 사용자가 검색하는 단어의 정의가 여러 개인 경우에도 Google의 동의어 시스템을 통해 Google 검색에서 사용자가 의도하는 단어를 파악할 수 있습니다. 이 시스템은 5년 동안 개발한 성과로, 모든 언어에서 실행된 검색의 30% 이상에서 검색결과를 현저히 개선했습니다.

검색 알고리즘검색 알고리즘

#IT

 연관글 목록 

[소프트웨어/스크립트천국] - 메타태그와 사이트 방문자

[컴퓨터/인터넷/네트웍/IT] - 미국내 미국적 검색엔진 점유 순위

[컴퓨터/인터넷/네트웍/IT/소시얼네트웍(SNS)] - 중국포털 과 검색엔진

[컴퓨터/인터넷/네트웍/IT] - 구글 개인용 검색엔진

[컴퓨터/인터넷/네트웍/IT] - 유입경로로 보는 모바일 검색엔진

[컴퓨터/인터넷/네트웍/IT/소시얼네트웍(SNS)] - 중국검색엔진 목록

[컴퓨터/인터넷/네트웍/IT] - 검색엔진의 내블로그 유입순위

[컴퓨터/인터넷/네트웍/IT/소시얼네트웍(SNS)] - 일본검색 사이트 목록

[컴퓨터/인터넷/네트웍/IT] - 포털과 검색결과 근접정도

[컴퓨터/인터넷/네트웍/IT] - 잘나간 인기 검색어(키워드) 모음

[소프트웨어/무료프로그램천국] - 무료소프트웨어 검색기


댓글 보기