내가 쓴 글을 구글이 싫어할지 모른다 - 검색에 노출이 되지 않을 때

노출이 잘 되고 잘 되지 않는 글(데이터)은 무슨 차이가 있나

만약에 구글과 같은 검색 사이트나 다음, 네이버 같은 대형 포털 사이트가 내가 작성한 글을 좋아하지 않는다면 어떻게 되는 걸까? 아니 좋아하는 것은 둘째치고 싫어한다면 어떻게 되는 거지? 아니 도대체 좋아하고 싫어하고 근거나 기준이 있기는 한 거야?라는 생각이 문득 들었습니다. 왜인지 열심히 작성하고 있는 글이 나 혼자만 알고 남들이 모른다면 보람도 재미도 없을뿐더러 글의 가치가 낮게 평가받고 있는 부분이니 글을 잘 써서 가치를 인정받고 싶은 마음이 생기는 것은 비단 저만 가진 생각은 아니라고 생각합니다.

Photo by Green Chameleon on Unsplash

그렇다면 정말로 지금 쓰고 있는 이 글이나 동시에 무수히 만들어지고 인터넷에 올라오는 글(데이터)은 어떻게 판단되고 측정되고 있는 걸까요? 도대체 어느 어떻게 해야 가치가 있다고 인정받을 수 있는 글(데이터)을 만들어 낼 수 있는 건지 알고 계신가요? 단순히 검색을 통해 콘텐츠를 소비만 하는 입장에서는 별 고민 없이 접근했던 부분이 소비되는 콘텐츠를 만들려고 보니 고민할 부분도 알아야 할 부분도 많다는 것을 새삼 느꼈습니다.

 

다시 주제로 돌아와서 우리의 삶을 풍요롭게 해주는 검색은 무엇을 기준으로 글(데이터)을 판단하는 걸까요? 의외로 결론은 간단합니다. 당연한 이야기지만 잘 쓰고 유용한 글입니다. 이게 다입니다. 응?이라고 하실지 모르겠지만 정말 이게 다입니다. 한 가지 더 필요한 것이 있다면 그것은 바로 시간입니다. 정리하면 검색에 잘 노출되는 글은 잘 만들어져 있고 유용한 정보를 가져야 하며 시간이 조금 된 글입니다. 나중에는 결론이 바뀔지도 모르겠지만 지금까지 수집한 자료와 정리한 내용들을 취합해서 결론을 내리면 앞서 말한 답을 찾게 됩니다. 조금 더 상세하게 결론을 내리면 다음과 같습니다.

 

- 구글에서 검색이 잘 되는 글은 잘 쓰여 있고 유용한 정보를 가지고 있어야 하며 시간이 필요하다.

- 다음에서 검색이 잘 되는 글은 잘 쓰여 있고 유용한 정보를 가지고 있어야 한다.

- 네이버에서 검색이 잘 되는 글은 없다. 언젠가 검색이 될 수도 있다. (티스토리 한정)

 

앞서 내린 결론을 정반대로 생각하고 이야기한다면 잘 쓰지도 않고 유용하지 않고 더군다나 글(데이터)이 만들어진지도 조금의 시간밖에 안된 글은 구글이 싫어할지 모르는 글이 됩니다. 정확히는 검색이 좋아하지 않는 글입니다.

 

지금 여기서 말하는 검색은 단순히 검색이 되는 것을 말하는 것이 아닙니다. 사용자에 쓸모 있게 보이고 유입될 수 있게 되는 상황 자체를 검색이라는 단어로 통틀어 말하는 부분이니 구글 서치 콘솔, 네이버 웹 마스터, 다음 사이트 등록 같은 색인을 활용할 수 있게 해주는 도구를 이용해 등록 후 난 검색 잘 되는데? 이렇게 말하시면 할 말은 없습니다.

검색이 잘 쓰고 유용하며 시간이 지난 글을 좋아하는 이유

이유를 설명하기 이전에 먼저 검색 엔진이  "잘 쓴", "유용한" 그리고 "시간이 지난"이라는 3가지 어휘를 어떻게 정의하고 받아들이는지 이야기를 하는 게 좋을 것 같습니다.

잘 쓴: 데이터가 긴 글(데이터)

웹 크롤러를 통해 데이터를 수집하는 경우, 기본적으로 가져가는 정보가 몇 가지 있는데 그중 하나가 데이터의 총길이입니다. 왜 데이터의 길이를 가져가는 걸까요? 웹 크롤러가 처음 만난 글(데이터)을 좋은지 나쁜지 판단할 수 있는 근거는 거의 없습니다. 사람도 처음 본 사람을 무작정 좋은 사람이다 나쁜 사람이다 판단할 수 없는 것처럼요. 그래서 처음 본 글(데이터)은 제목과 길이가 중요합니다. 데이터를 많이 가지고 있을수록 보고 판단할 수 있는 부분이 많기 때문에 새로운 글(데이터)일수록 데이터가 긴 것을 선호합니다.

유용한: 방문자가 체류 시간이 긴 글(데이터)

검색 엔진은 여러 가지 수단과 방법을 통해 사용자의 정보를 수집합니다. 그중 하나가 바로 웹 페이지에 머물러 있던 시간인데 그 시간을 체류 시간이라고 합니다. 검색 엔진은 사람에게 유용한 글(데이터)인지 아닌지 판별할 수 있는 방법이 없습니다. 0과 1만 아는 컴퓨터는 유용하다고 판단을 내릴 수 있는 기준이 필요한데 그 기준을 사용자의 체류 시간입니다. 글(데이터)의 길이와 상관없이 체류 시간이 길었다면 그만큼 사용자에게 필요한 정보라고 판단하고 많은 사람들이 유용한 정보를 볼 수 있게 검색에 자주 노출시킵니다.

시간이 지난: 등록/수정 시간이 지난 글

일반적으로 새 것은 좋은 물건일 확률이 높지만 검증이 되었다는 가정하에 이야기할 수 있는 부분이지 무차별적으로 만들어지는 글(데이터)을 대상으로는 새 것은 좋다고 표현하기 힘듭니다. 그렇기 때문에 글(데이터)이 등록되고 얼마간의 시간을 두면서 몇몇의 사람을 대상으로 "잘 쓴", "유용한" 글(데이터)인지 검증을 한 뒤 가치를 판단해 글(데이터)이 유용하게 쓰일 수 있도록 검색에 노출시킵니다. 단 등록된 글(데이터)에 수정이 발생하면 검색 엔진은 완전히 처음부터는 아니지만 글(데이터)의 내용이 어떻게 수정이 되었는지 모르기 때문에 다시 검증을 합니다. 

길이가 길고 체류 시간이 긴 등록/수정 시간이 지난 글(데이터)을 좋아하는 검색 엔진

검색 엔진이 "잘 쓴", "유용한", "시간이 지난" 글(데이터)을 좋아하는 이유는 검색이 가지는 본연의 의미를 위해서다. 검색 엔진은 기본적으로 사람에게 유용하게 잘 쓰일 데이터를 잘 노출시켜주어야 한다. 그래서 검색엔진은 나름의 가치 척도를 만들어 적용시키다 보니 몇 가지의 척도의 근간을 만들 수 있는 부분을 찾을 수 있었고 그 부분들이 앞에서 제시한 3가지의 어휘들이다. 그렇기 때문에 검색 엔진은 잘 쓰고 유용하게 쓰일 시간이 지난 글(데이터)을 좋아하고, 이 판단 기준이 바뀐다면 가치의 척도는 언제든 바뀔 수 있고 개선되어 나갈 것이다.

정리하기

검색엔진이 자주 노출시키고 좋아하는 글(데이터)은 결국 누구나 다 좋아할 수 있고 유용한 정보이다. 지금 당장 검색에 노출이 잘 안되고 유입이 없다고 실망하지 말자. 검색엔진이 아직 우리의 가치를 판단 못하고 있을 뿐 정성 들여 글을 쓰고 얼마간의 시간 동안 꾸준히 반복한다면 우리는 좋은 글을 쓸 수 있고 검색엔진이 아닌 여러 사람들이 우리가 쓴 글을 인정해줄 것이다.

반응형

댓글

Designed by JB FACTORY