웹 2.0 시대의 기회 시맨틱 웹

2008. 8. 9. 13:01잡다한 이야기들/책을 통한 감수성!

사용자 삽입 이미지사용자 삽입 이미지


지은이 : 김중태
출판사 : 디지털미디어 리서치

이 책은 2006년에 초판발행된 책으로 시맨틱 웹, 웹 2.0에 대해 다루고 있다. 작가인 김중태씨는 국내 PC통신 역사와 문화를 정리한 전문가이고 국내 처음으로 블로그 문화를 다룬 서적을 출간하였고 블로그 문화보급에 힘썼다. IT칼럼리스트와 강사로 활동하고 있는 분이다.

생각해보면 Web 2.0이란 말은 2004년부터 대두되기 시작하였다.(o'reilly의 부사장이 데일 도허티씨아 컨퍼런스도중 개념적으로 언급한 내용임.) 그런데 이책 등록일은 2004년이고 2006년 출판을 하였다. 뭐 IT트렌드에 맞춰가는 출판사의 노력과 늦게나마 편집한 김중태님의 산물일 것이다.

2년후 출판이란 늦다면 늦은 그럼 시간이지만, 요즘 웹 2.0이 아주 크게 대두되고 있는 시점에서 2006년에 잘 정리된 개념들은 당시치고는 꽤 정리된 듯 하다.

웹이 구현된 초기에는 하이퍼링크 기술자체만으로도 혁명적이고 충분했지만 웹이 유통되는 정보의 양이 늘자 초기의 단순 웹기술에는 한계가 생겼다. 그리고 사람들은 대량의 정보를 알아서 처리해주는 발전된 웹을 꿈꾸게 되었다. 이 과정에서 나온 개념이 바로 시맨틱웹(Semantic Web-뜻살린 웹)이라는 개념과 기술이다.

시맨틱 웹이란 웹의 창시자인 팀 버너스 리에 의해 1998년에 제안된 차세대 웹의 이름으로 지속적인 연구와 회의를 통해 발전하고 있다. 팀 버너스 리는 "맨텍 웹은 현재 웹의 확장으로 잘 정의된 의미를 제공함으로써 사람과 컴퓨터가 좀더 협력을 잘할 수 있는 웹"이라고 설명하고 있다.

이 설명에는 컴퓨터끼리 정보를 주고 받을때 잘 정리된 좀더 많은 정보를 추가로 제공해 정보해석력을 높이고, 이를 통해 자동화 처리를 향상시킨 것이다. 이때 컴퓨터끼리 주고 받는 정보는 Meta data를 이용한다.


웹의 기본 철학은 정보의 공개와 공유를 통한 인간의 행복이다. 팀 버너스 리가 꿈꾼 웹은 언제 어디서나 정보에 접근할 수 있는 완벽한 정보의 연결이다. 웹의 본질은 연결성이며 연결정신이 곧 웹 정신이다. 연결을 위해서는 공개가 필요하다.  그래서 링크를 위해서는 공개와 공유 두가지 정신을 전제로 한다.

이런 점에서 네이버라는 대형포탈사이트는 여러 면에서 욕을 많이 먹고 있다. 웹 정신의 기본 정신을 위반했을뿐더러(사실 이부분은 그냥 경쟁에서 진 다른 싸이트들의 변명일지도 모른다..) 스스로는 다른 검색엔진을 마음껏 퍼오면서도 자신들의 정보는 퍼가지 못하도록 검색을 차단해 놓았다. 이로인해 예전 다른 싸이트들에서 걸어놓은 네이버 링크들은 전부 무용지물이 되었고 이런 상황이 대두되자 전체적인 웹 링크가 깨지고 만 것이다.
한때 네이버는 지식인 게시물 주소를 시간에 따라 계속 변하게 하여 퍼갈 수 없도록 만들었다고 한다.
네이버의 단적인 면은 다른 사이트의 문서를 복사해 네이버내 글을 작성하면 글만 저장되고 그림, 동영상 원본은 다른사이트에 전가하는 나쁜 기술로 네티즌의 원망을 사기도 했다고 한다. 반대로 다른 사이트에서 블로그나 기타 서비스의 그림파일, 동영상 링크는 막아놓았다. 이는 불필요한 트래픽은 다른 사이트에 넘기면서 광고료를 챙기고, 자료는 외부에서 링크되지 않는 나쁜 기술을 선보이는 곳이라는 평을 들었다.(물론 지금은 여러면에서 조금씩 나아지고 있다.)

예전 단순링크의 문제점은 쓰레기 정보의 증가와 처리문제, 정보의 생산/관리/재활용문제, 정보의 검색 배포 수집문제가 생긴다. 이를 해결하기 위해 등장한 것이 시맨틱 웹이며 이는 자동화를 이용한 처리 향상이요 이는 곧 인공지능이다.

이의 기술기반은  RDF기반의 OWL(Ontology Web Language - 존재론 웹언어)가 있고 지금도 연구가 되고 있다.

웹2.0과 시맨틱웹의 차이점이 궁금해 하는 사람이 있을 것이다.
이 둘의 등장은 다르다.
시맨틱 웹의 경우 팀버너스리가 1998년부터 내세우는 차세대 웹으로 발전되고 있는 것이다.
웹 2.0은 2004년 10월 미국 샌프란시스코의 웹 2.0 컨퍼런스에서 오라일리의 부사장 데일 도허터씨가 2004년까지의 웹 거품 현상 중에서 살아남은 기업들의 특징을 모아 정리한 것이 웹 2.0의 정리이다. 이는 새로운 패러다임으로 취급된다. "살아남은 기업들의 특징"에서 알 수 있듯이 경제적 관점이 많이 포함되어 있다.
이에 비해 시맨틱 웹은 팀버너스리의 기본 웹의 사상이 많이 포함되어 있다.
기본적으로 웹 2.0과 시맨틱웹의 목적지는 인간을 위한 자동화란 점에서 거의 동일하다.
둘의 차이점 공통점을 요약하자면
"시맨틱 웹이 목적지를 향한 기술에 관심을 두고 있다면 웹 2.0은 시맨틱웹의 기술을 어떻게 응용하여 경제와 인간생활에 적용시킬 것인가에 관심을 두고 있다는 정도의 차이가 있다.

웹 2.0/시맨틱웹에 사용되는 기술을 보면  XML, RDF, Ajax, RSS등이 있다. 이에 간단하게 알아보자.

XML : html에서 확장된 마크업 랭귀지로 기존의 html이 문서를 화면에 예쁘게 보여주기 위해 태그를 사용한 것이라면 xml은 눈에 보이지 않는 문서의 구조나 의미도 태그로 정의할 수 있다. xml은 문서의 자료구조, 태그의 의미등을 설명하므로 기계가 구조를 파악할 수 있고 자동화에 편리하다. 또한 문서 작성자가 태그를 만들고 정의할 수도 있다. xml의 경우 정의한 태그를 사람이 이해하기는 어렵지 않으나 기계가 자동적으로 의미를 이해하기는 어렵다. 특히 태그 사이의 의미 연관성을 추론하기란 어렵다. 이는 임의로 만든 태그의 사용법은 알 수 있어도 어떤 의미를 담고 있는 태그인지 파악하기는 어렵다. 이런 문제를 해결하기 위해 등장한 기술이 RDF이다.

RDF : resource description framework의 약자로 특정 자원에 대한 숨은 자료를 설명하는 xml기반의 프레임 워크이다. RDF는 자원, 속성, 속성값을 묶어서 하나의 단위로 취급하는 기술로 정보를 구성하는 자원에 대한 세밀한 설명과 관계 파악을 쉽게 해준다.

Meta data : 숨은 자료라고 해석되며 이는 자료에 대한 정보이다. 이는 웹 문서에 대한 정보를 뜻한다. 사람의 경우 문서의 내용을 보지만 사람들눈에 보이지 않는 곳에 문서의 작성시각, 문서크기, 문서형태등 다양한 정보가 문서파일에 포함되어 있다. 이를 메타 데이터 라고하는데 이를 이용하여 문서에 대한 분류 및 자동화, 재활용을 이용할 수 있다. tag(꼬리표)를 이용하여 단일 분류 체계의 문제점을 다중 분류 체계로 해결하고 있는 중이다.

Ajax : 요즘 대두되고 있는 기술로 다양한 포털 사이트등에서 사용되고 있다. 필요한 정보를 비동기적으로 받아들여 동적이며 빠른 웹을 표현할 수 있다. 비동기식 자바스크립트 + xml의 약자이다. Ajax하나가 한 종류의 기술이 아니라 여러기수의 복합된 기술 덩어리이다. Ajax에 사용된 기술을 보면 xhtml과 css를 통한 동적표시, dom을 사용한 상호작용, xml을 이용한 자료교환, 이를 결합시켜 정리하는 자바스크립트등이 고루 섞여 있다. 브라우저와 서버사이의 통신은 xml을 이용하고 사용자가 보는 브라우저 화면의 인터페이스로는 자바스크립트를 이용하는 기술로 정의할 수 있다. 기술적으로 요약하면 웹서버-브라우저의 구조사이에 Ajax가 중간에 위치한 구조로 바귄다고 생각하면 된다. 이는 서버의 응답을 계속 기다리지 않고 비동기적으로 작업을 수행하여 대기시간이 줄고 이에 따라 서버의 부담도 줄어든다. 이전의 사용에서는 서버에 정보를 요청하면 서버에서 처리결과를 보내줄때까지 기다려야 했지만 Ajax의 경우 일일이 서버에 묻지 않고 Ajax를 읽은 브라우저가 스스로 생각하면서 작업을 한다. 브라우저 안의 자바스크립트는 부지런하게 사용자가 지시한 일을 하고, 서버와의 통신 작업은 백그라운드 작업으로 한다. xml 자료를 관리하기 때문에 페이지를 다시 불러올 필요도 없다.
이 Ajax는 인터넷 상의 RIA인터넷 기술을 대체할 기술로 주목받고 있다.(기존의 플레시 플렉스는 로딩 및 속도에 많은 차이가 있고 Ajax가 확장성이 높고 자료관리도 유용하다. 또한 액티브 엑스처럼 익스플로러에서만 작동하는 페쇄성도 없어진다.

RSS : 기존 인터넷 사용자가 정보를 얻기 위한 수단으로는 직접 해당 사이트를 방문하여 글을 읽거나 일일이 정보를 검색하여 이용자가 찾아들어가야하는 방식이 었다. 하지만 RSS를 이용한다면 필요한 정보를 직접 구독받아 사용할 수 있다. 웹 2.0의 대두되는 기술중 하나로 블로그의 확산과 함께 빠르게 보급되었다. RSS기술을 이용한다면 정보습득에 대한 시간이 엄청나게 절약된다. 단점은 해당사이트에서 지원할 경우에만 등록하여 사용할수 있지만 최근 추세는 거의 대부분의 사이트들이 RSS를 지원해나가는 추세이다. (RSS구독기를 사용해야 하는데 그방법등에 대해서는 나중에 리뷰를 언급하던지 하겠다.~)

위 기술들을 표현하기에는 너무 짧지만, 기회가 된다면 하나의 기술에 대해 길게 글을 써보고 싶다.


이 책에서는 이밖에도 앞으로의 웹 방향 및 트렌드, 웹의 중요성등을 강조하고 있다.
하지만 책내용에 있듯이 기술이란 '준비하는 시간은 오래걸려도 새로운 기술의 등장은 빠르다.'

매우 기초적인 내용들이 언급되어 있지만 2008년에 새로운 기술에는 적용되지 않는다.
책내용을 생각해보면 김중태씨가 하신 말씀이 어떻게 보면 다 들어 맞았다고 생각한다.
그리고 지금 웹은 또다른 방향으로 발전하고 있다.

2004~2008까지의 웹 트랜드 및 기술동향등에 대해 관찰하기에는 좋은 책이었다.