본문 바로가기

IT/Search Engine

[펌글] '검색 최적화 전도사' 나선 구글 3인방

원글은 여기

대충 아래로 요약되고 있는 데~~~~
메타 디스크립션
robots.txt를 올바르게 설정하기
이미지 설명 넣기
웹페이지 제목 달기 


‘검색 최적화 전도사’ 나선 구글 3인방
정보라 borashow@bloter.net | 2012. 02. 03

“검색엔진을 무시하는 건 광고를 찍어놓고 한 채널로만 보여주는 것과 비슷합니다. 어디에도 광고를 보여주지 않는 것일 수도 있습니다.”

구글코리아 홍보담당자는 동료 직원에게 검색 최적화를 주제로 한 글을 받았다. 엔지니어는 그 글을 구글코리아 블로그에 게재하길 부탁했다. 한 번이면 끝날 줄 알았지만, 지난해 5월까지 1년 반 동안 7편의 글이 쌓였다. 지난해에는 한국 웹마스터와 만나는 자리를 마련하고 싶다고 연락해왔다.

이동휘 구글 소프트웨어 엔지니어와 석인혁 검색품질분석가 겸 엔지니어, 백창현 검색품질전문가, 3인방의 이야기다. 소속 팀도 다르고 업무도 다른 3인방은 왜 모인 것일까.

▲이동휘 소프트웨어 엔지니어, 석인혁 검색품질분석가, 백창현 검색품질분석가(왼쪽부터)

사실 3인방이 국내 웹마스터에게 검색 최적화 방법을 알리기 위해 노력하는 모습은 의아할 정도이다. 3인방은 구글의 20% 프로젝트의 일환으로 ‘웹마스터를 위한 검색이야기’를 연재했다. 서울에서 근무할 때는 국내 웹마스터 수십 군데에 전화를 걸어 사이트 운영 상황을 물었다. 때로는 직접 찾아가기도 했다. 그러다 “한국의 웹마스터를 만나보라”라며 올 1월30일 ‘2012 웹마스터 컨퍼런스’에 매트 커츠 구글 검색그룹 총괄 엔지니어도 불러왔다.

이동휘 씨는 “2010년 G20이 있을 무렵, 한국에서 별도의 웹사이트를 만들었는데 정작 검색이 안 되는 상황을 목격했다”라고 ‘웹마스터를 위한 검색이야기’를 연재하기 시작한 배경을 설명했다.

“검색 시스템에서 가장 첫 단계가 웹문서 수집(크롤링)입니다. 그 다음은 색인과 순위 매기입니다. 일단, 크롤링하지 못하면 그 다음 단계는 무용지물입니다. 아무리 좋은 검색 알고리즘이 있어도 문서를 수집하지 못하면 색인과 순위 매기기는 시도조차 못하는 셈이죠. 한국의 웹 검색 품질이 좋지 않은 이유 중 하나가 바로 크롤링하기 어렵기 때문입니다.”

국내 웹사이트는 검색엔진이 접근하는 것을 막아두거나 검색엔진을 전혀 돕지 않는다는 이야기다. 대체로 국내 웹사이트는 검색엔진을 제어하는 robots.txt를 잘못 설정해서 검색엔진이 접근하지 못하는 형편이다. 정부기관 웹사이트의 상당수는 검색엔진의 접근을 막고 있다. 웹페이지 정보를 제대로 입력하지 않아 검색엔진이 웹문서를 수집해도 해당 페이지가 어떤 정보를 담고 있는지 파악하지 못하는 경우도 부지기수라고 3인방은 설명했다.

설명을 듣고 시험삼아 구글에서 ‘대한민국국회’(Korean Assembly)를 검색해봤다. 일단 검색 결과에서 위키피디아가 눈에 띈다. 국회 웹사이트가 위키피디아보다 위에 나타나지만, 해당 페이지에 대한 설명이 아예 없어 공식 웹사이트인지 알 수 없었다. 정부가 그토록 공들여 치른 2010년 G20 서울 정상회의(G20 Seoul, G20 Korea)도 검색해보면 문화체육관광부가 만든 공식 웹사이트보다 G20 멕시코와 위키피디아가 먼저 보인다. 국회 웹사이트와 마찬가지로 웹페이지에 대한 설명은 없다.

검색엔진이 정확한 웹사이트를 찾아줬지만, 검색 결과만 봐서는 신뢰할만한 웹사이트인지 알 수 없었다. 이와 같은 일을 외국인이 국내 웹사이트를 검색할 때 종종 겪는다고 석인혁 씨는 설명했다. “외국인이 한국에 대한 정보를 찾을 때 검색하면 대표 웹사이트나 원문이 게재된 곳 대신 주로 위키피디아나 대학교 논문이 검색 결과에 나옵니다. 보다 정확한 정보를 전달하기엔 어려운 게지요.”

검색엔진 최적화가 필요한 것도 위와 같은 이유에서다. ‘트래픽을 늘리는 방법’이 아니라 ‘필요한 사람들에게 웹사이트를 노출하는 법’이 검색엔진 최적화라고 3인방은 강조했다. 검색엔진 최적화가 구글뿐 아니라 여타 국내외 다른 검색엔진에도 자기 웹사이트를 노출하는 데 도움이 될 것이라고도 말했다.

특히 한국어뿐 아니라 여러 언어를 지원하는 웹사이트를 보면 유독 한국어 버전일 때만 설명이 부족한 경향이 있다고 3인방은 꼬집었다. 웹페이지 제목이나 이미지 설명, 메타 디스크립션 등을 국내 이용자 대상으로는 제대로 제공하지 않는 것이다. robots.txt를 올바르게 설정하기, 이미지 설명 넣기, 웹페이지 제목 달기 등 기본적인 검색 최적화 방법조차 적용하지 않는 게 국내 웹사이트의 현 주소라고 3인방은 안타까워했다.

석인혁 씨는 웹사이트에서 검색엔진을 막아두고도 “구글에서 우리 웹사이트 검색이 막혀 있다”라고 연락하는 웹마스터도 있다고 말했다. “웹사이트를 만들 때는 홍보를 위한 이유가 90% 이상이라고 생각해요. 그런데 검색엔진을 무시하거나 신경을 쓰지 않는 건 마치 광고를 찍어두고 어디에도 보여주지 않는 행동과 비슷한 것 아닐까요.”

앞으로 웹사이트를 운영하고 관리하는 방향이 바뀌어야 하는 것은 아닐까. 백인혁 씨는 “예전에는 홈페이지가 있다는 게 중요하고 예쁘게 만드는 게 중요했다면, 이제는 중요한 정보를 얼마나 많은 사람에게 전달하는지가 중요해졌다”라고 말했다. 웹상에 존재하는 URL이 1조개가 넘는 상황이니 이 말에 고개가 절로 끄덕여진다.

3인방은 ‘웹마스터를 위한 검색이야기’가 장기 프로젝트는 되지 않길 바란다고 말했다.

“2012 웹마스터 컨퍼런스에서 웹마스터들에게 다양한 피드백을 받았으니, 연락도 해보고 만남의 자리도 기획해보려 합니다. 앞으로 크고 작은 노력이든 계속 하겠지만, 우리가 바라는 건 이런 일을 안 해도 되는 날이 오면 좋겠어요.”

 2008 BLOTER.NET. CC BY-NC-ND. | http://www.bloter.net/archives/94717