'2008/07/14'에 해당되는 글 2건
- 2008/07/14 엔지니어로서의 감성을 자극하는 동영상(2)
- 2008/07/14 큐로보가 구글을 이기기 힘든 이유(4)
암튼 이 로봇은 원래 수명이 6개월 정도일 것으로 예상했는데, 3년이 넘게 활동하고 있다고 하는 기사를 예전에 읽었던 기억이 나네요... 혼자 화성에서 홀로 돌아다니는 로봇... 왠지 불쌍해 보이기도 하고..-_-a..
정말 영상을 보면서.. 우와아아~~ 하는 느낌을 받았습니다. 저런걸 어떻게 다 만들었지 라는 생각도 들고.. 우리나라도 언젠가.. 저런걸 쏘아올릴 날이 올까요?^^
큐로보라는 한국형 검색엔진이 나왔다는 글을 읽었습니다. 시멘틱 웹 기반이라고 주장하면서 ... 구글은 단순 순위만 보여주는데 큐로보는 의미 단위로 보여주기에 더 정확한 검색이 가능하다라고 하면서 말이죠..
예전에 그 뉴스를 봤을 때 .. 그냥 언론 플레이 한번 해서 이목을 끄는 거구나 .. 하고 지나쳤었는데 오늘 Qrobo(큐로보) 한국형 검색엔진란 글을 보고 생각난김에 조금 적어보겠습니다. ( 어이쿠.. 글 적고 보니 후글님 블로그였군요..^^; 정말 번데기 앞에서 주름잡는 기분이..;;; )
검색의 정확도에 대해서
사실 어떤 검색이 정확한 검색이냐.. 사용자의 요구를 정확히 반영하는 검색이냐에 대해서는 아직 답이 없다고 보는게 맞을것 같습니다. 경우에 따라서 네이버 검색이 더 좋을 수도 있고, 구글이 좋을 수도 있고.. Case by Case 입니다.
예를들어 신촌에서 맛있는 음식점을 찾는다고 하면 구글에서 찾기란 정말 힘듭니다. 네이버 지식인에서 검색해서 보는게 더 정확한 검색을 수행할 수 있습니다.
큐로보라는 검색 엔진의 내부가 어떻게 구성되어 있는지는 모르겠는데, 키워드들간의 연관관계를 구축해서 특정 키워드가 검색되면 그 키워드의 연관 키워드를 제시하고, 검색 결과에 대해서는 클러스터링을 하거나 해서 결과치를 보여주는 걸로 추정됩니다.
절대 이게 쉽다는 건 아닙니다 -_-;; 빡셉니다..이거도.. 하지만 그게 큐로보만의 기술은 또 아닙니다. 이미 수많은 업체에서 이미 했고, 실제 구축사례도 여럿있습니다. 그래서 처음 큐로보 소개 기사를 읽었을 때.... 언론 플레이 좀 하는 분이 저 회사에 있나보구나 하는 생각을 했던겁니다.
그리고 큐로보의 경우는 약간 치명적으로... 키워드 검색이 아니면 연관 검색어 제시를 해주질 못합니다. 즉.. 꽃, 다이어리 같은 단어 입력시에는 연관어를 보여주는데... 좀 길게.. 구로 된 .. '견습 마법사의 실험실' 같은 구를 입력하면. .. 아주 빈약한 검색 결과를 보여줍니다..;;
( 대충 내부가 어떻게 되어 있는지.. . . 짐작이 가시나요?^^;;;; )
구글의 강점은 다른 곳에 있다.
어디 검색 엔진을 통해 검색을 했더니 구글보다 검색 결과가 더 좋더라. 그러니 이 회사는 이제 구글을 이길 수 있다 라고 하는 기사를 가끔 보게 되는데.... 구글의 강점은 검색 결과의 정확도에만 있는게 아닙니다..;;;
지역적인 몇몇의 검색 결과에서 구글보다 우선순위를 차지할 수는 있습니다. 가령 도서 검색을 한다고 하면 국내 출판 서적들은 yes24나 알라딘에서 직접 검색하는게 더 좋습니다. 관련 도서들도 보여주고 말이죠..
하지만, 전세계로 영역을 확대한다면 어떨까요?
하루에 구글이 처리하는 데이터량이 과연 얼마일까요? 1
사실 구글의 검색 알고리즘인 Page Rank 기법은 핵심 부분이 다 알려져 있습니다. 어떤 원리로 어떤 페이지가 상위에 위치하게 되는지도 다 알려져 있고 말이죠. 그런데, 왜 아무도 구글과 같은 사이트를 안만들었을까요? 물론 특허도 걸려 있겠지만, 특허 회피하는거야 뭐 간단할 테고.. 누군가 한번 정도는 그런걸 만들었을 것 같은데.. 그럼 구글과 동일한 검색 결과를 얻을 수도 있을텐데.....
바로 그 정도의 데이터를 처리하고, 또 그 정도의 속도를 내기가 힘들기 때문입니다.
거의 불가능해 보이는 그 막대한 데이터 처리량과 처리 속도가 바로 구글의 강점입니다.
서버만 확충하면 구글 정도의 속도를 낼 수 있다~! 라고 외치는 분도 있을지 모르겠네요. 구글에서 사용하는 서버는 메인 프레임급의 무지막지하게 생긴 서버가 아니라... PC 타입의 서버입니다..;; 그냥 지금 여러분이 집에서 사용하는 PC와 비슷한 ( 혹은 그것보다 떨어지는 것도 다수?;; ) 것들에 자체적인 OS 설치해서 서버로 돌리고 있습니다..;;
그러니까.. 자본의 문제가 아니라.. 기술의 문제라는 거죠.... 돈으로 장비 구입해서 해결할 문제가 아닌거죠..;;;;
하긴... 그 기술 개발을 위해서 사람이 필요하고, 그런 사람을 고용하기 위해서 돈이 필요하고.. 그 돈을 위해서.. 우선 사람들의 관심을 끌어모아 수익 모델을 만들어야 하는건지도 모르겠네요... 닭이 먼저냐 달걀이 먼저냐 문제군요..^^:
- 예전에 구글 나이트에서 한 이야기로는... 하루에 처리하는 데이터량은... 비밀이랍니다..--;; 말해줄 수 있는건.. 세상에서 가장 많은 량의 데이터를 하루에 처리하고 있다라는 것 정도?;; [본문으로]
-
라디오스타
2008/07/14 11:17
저는 큐로보의 직원이 아닙니다만..
우선, 검색 결과에 대해서는 사실 큐로보는 아직 서비스 초반입니다.
때문에 당연히 네이버나 구글 같은 것에 비해 크롤된 데이터 양도 적지 않겠습니까?
이게 첫번째 변명..^^:;
두번째는 사실 단어검색이야.. 말씀하신 알고리즘으로 가능하겠지만..
문장(구나, 절 단위)은 키워드로만 적용해서는 안되지 않습니까?
제 추정에 아직 이쪽 알고리즘은 아직 구체화 되지 못한 듯 싶습니다.
그리고 구글의 강점 중 하나인 바로 서버!!!
제가 그래서 사실 예전에 WIS 에서 큐로보 부스에 계셧던 과장님에게
여쭤봤습니다 ㅋㅋ
"구글의 정말 핵심 성공 비결은 제 생각에 바로 서버와 플렛폼에 있다.
큐로보는. 구글보다 몇배의 데이터를 처리할 수 있을 만한 서버와 플렛폼이
필요할 것이다. 이쪽에 대한 해결책이 있느냐~" 라고 여쭤본 결과
사실 아직 개발 하고 있진 않으나, 개발할 예정이다 라고 하셨습니다
좋은 글입니다 잘 봤습니다
-
Magicboy
2008/07/14 13:19
아.. 오랜만입니다^^
어느정도 언론플레이는 .. 저도 업계 사정을 대충 아니 그냥 그렇구나 하고 넘어가는데..왠지 너무 과도하게 포장을 하려는 거 같아서 한번 적어봤습니다.
뭐 우리나라 업체가 잘되면 좋죠^^
-
-
longtag
2008/07/14 18:51
전 큐로보 직원입니다. ^^;
지금의 상태로는 큐로보가 구글을 이기기는 힘들겠죠..
그런데 아시겠지만 기사 제목은 기자들이 맘대로 그렇게 쓰더라구요.
뭐.. 저희도 그런 자극적인 제목이 맘에 드는건 아니지만.. ㅜㅜ;
암튼 저희도 말씀하신 부분들을 이미 알고 있구요,
정말 좋은 검색 만들려고 노력많이 하고 있습니다.
꾸준히 지켜봐 주시길 부탁드립니다~
Trackback : http://blog.magicboy.net/trackback/581
-
[WIS 2008] 의미검색, 한뼘검색 Qrobo를 선보인 시맨틱스 부스...
| 2008/07/14 10:40
국내 검색 시장의 포화... 아니 네이버에 의한 과도한 독점이 지속되고 있는 상황에서 새로운 검색 엔진을 선보이려고 한다는 것 자체가 의아해 보였던 게 사실이다. 하지만 의미검색과 한뼘검색이라는 차별성으로 검색 엔진 경쟁에 뛰어들 채비를 하고 있는 시맨틱스(SEMANTICS)는 검색 시장을 바라보는 시각이 좀 달랐던 것 같다. 지난 6월 17일부터 20일까지 나흘간 열리는 국내 최대의 IT 관련 전시회인 WIS에서 손꼽힐 정도로 큰 부스 규모를 자랑..
-
[시맨틱웹 특집] 온톨로지를 구현한 Qrobo. 오 놀라워라
| 2008/07/14 11:18
늦었습니다. 아무튼 저번 포스팅에 말 했듯이 이번엔 시맨틱웹이란 것에 대해서 조금씩 알아보겠습니다. 시맨틱웹이란 짧게 말하자면 이전에도 말씀 드렸다시피 매우 '인간적인' 웹이라 할 수 있는 웹입니다. 많은 이론이 있지만 오늘은 그 중의 하나인 '온톨로지'라는 기능을 구현한 Qrobo에 대해서 한번 써보고자 합니다. (현재 Qrobo는 알파 테스트 중입니다, 로그인을 해야만 사용 가능합니다.) 참고로 저는 Qrobo의 직원이 아닙니다 ㅋ -------..
-
구글이 처리하는 웹페이지 갯수는 얼마나 될까?
| 2008/07/14 15:53
해외 유명 블로그 TechCrunch 에 구글 관련 내용이 올라왔습니다. 이 소식을 발빠르게 전해 주시는 여러 블로거님들 덕분에 금방 소식을 접하게 되었습니다. (참 좋은 세상입니다. ^^) Google Processing 20,000 Terabytes A Day, And Growing (TechCrunch) 구글, 하루에 20000 테라바이트(TB)의 자료를 처리한다고? (학주니닷컴) 구글이 20 petabyte의 데이터를 얼마만에 처리할까? 그럼..






Recent Comment