이전 글에서, 희철님이 말씀하신 것처럼, 시맨틱 웹을 가능하게 하는데는 두 가지 흐름이 중요합니다.
- 정보의 개념
- 정보간의 관계
이번 시간에는 우선, 그 개념에 대한 이야기를 해보겠습니다. 온톨로지라는 말은 이제 많이들 들어보셨을겁니다. Pim Borst라는 사람은, 온톨로지의 정의를 이렇게 내립니다.
온톨로지는 공유된 개념의 정형화된 명세이다.
Ontologies are defined as a formal specification of a shared conceptualization.
좀 더 자세한 논의는 온톨로지란 무엇인가라는 글이 좀 더 도움이 되실것 같네요.
온톨로지를 조금 더 쉽게 정의하는 방법, Semantic Vocabulary
각설하고, 그럼 과연 온톨로지는 어떻게 정의할 수 있을까요? 방법은 다양합니다. 웹의 표준을 만들어가고 있는 W3C에서도 다양한 표준을 정의하고 있습니다. RDF , OWL... 하지만, 간단히 말해 RDF는 정보의 가장 기본적인 속성만을 표현하는 기본 요소에 불과합니다. 그리고 이런 RDF에 구체화된 타입이나 관계속성을 부여하는 RDF Schema나, OWL 같은 메타데이터로 온톨로지를 만드는 것은(모델링이라고 부릅니다) 너무 어려운 일입니다.
하지만, 대안은 있습니다. 누군가 미리 만들어 놓은 것을 사용하면 되지요. 그런것들을 Vocabulary라고 부릅니다. 이런 Vocabulary는 RDF, RDF-S , OWL 등을 사용해서 학계나, 표준단체에서 이미 만들어놓은 것들을 말합니다. (대부분 RDF를 기반으로 정의되기에, RDF의 Application이라고도 부릅니다.) 이런 Vocabulary들은, 대부분 실제 적용할 수 있는 구체적이고, 높은 추상화 수준의 개념을 미리 정의해놓았기에, 상황에 맞게 가져다 쓰면 되는것이지요.
즉, 왜 Vocabulary를 알고, 써야 하느냐고 묻는다면
- 독자적으로 온톨로지를 정의하기 어려우므로
- 합의된 표준이므로 Meaning을 Share할 수 있으므로
라고 답할 수 있겠네요.
이런 Vocabulary에는 여러 종류가 있습니다. 이 글에서는 간략히 무엇이 있는지, 대표적인 것들만 간단히 그 특징을 살펴보겠습니다.
FOAF
요즘 Social Network Service들에 대한 관심이 커지면서, 각광을 받고 잇는 Vocabulary입니다. Identity와 Social Relationship , 쉽게 말해 '나와 내 친구들'에 대한 정보를 기술한다고 보면 되겠네요. 구글의 Open Social API와 같은 흐름은, 각각의 SNS가 FOAF기반으로 정의해 공개하는 데이터들을 자유롭게 엮어냄으로써 주목을 받고 있습니다. FOAF가 다루는 범위는 꽤 자세합니다. 이름,메일주소,홈페이지 같은 간단한 정보부터, 관심사, 직장, 메신저 주소같은 개인정보들을 자세히 다루고 있지요. 그리고 그 가운데서, 각각의 Identity를 기반으로 데이터가 이합집산하는 흐름도 눈여겨볼만 합니다.
싸이월드와 미투데이 , 트위터의 사용자들이 서비스의 경계를 넘어 '친구'가 되는 세상. 그리고 그 가운데, 사용자의 Identity가 정보의 주도권을 가지는것 (Open Identity). 바로 FOAF가 꿈꾸는 네트워크이겠지요?
- FOAF Project Sitee
- FOAF-O-Matic 간단하게 FOAF 메타데이터 만들어보기 (한국어 지원)
- 시맨틱 소셜 네트워크를 향해, Part 1: 시맨틱 소셜 네트워크와 FOAF(Friend Of A Friend)
SIOC
SIOC은 커뮤니티를 위한 Vocabulary입니다. 흔히 말해, 게시판이나 포럼 , 카페와 같은 서비스들(블로그도요!)을 연상하시면 될것 같네요. 이런 커뮤니티 서비스를 이루는 축인, 사용자, 글 , 공간을 정의해놓았습니다. 사용자 부분은 FOAF와 연동이 되며, 컨텐츠 부분은 ATOM-OWL 이나 RSS 1.0과 같은 데이터 포맷으로 정의될 수 있지요. 이런 SIOC을 통해, 웹에 널리 퍼져있는 커뮤니티들은 이제 서비스나, 도메인이라는 경계를 넘어서, 자유롭게 연결됩니다.
다음 카페, 내 블로그 , 루비 사용자 포럼 등의 여러 커뮤니티가 주제에 따라 하나로 연결된다면 어떨까요? SIOC이 꿈꾸는 것은 그렇게 사용자와 정보 , 그 공간이 엮이고 섞이는 연결고리인것입니다.
- SIOC Project Site
- SIOC 1 Page Guide (각각 사용자, 경영진, 개발자를 위한 1페이지짜리 pdf 로 된 가이드를 다운받아 볼수 있습니다)
- SIOC: 시맨틱 웹 기술을 이용한 커뮤니티 간의 연결
SKOS
SKOS는 좀 더 추상적인 단위를 다룹니다. 바로, 정보에 대한 속성들, 주제-분류-폭소노미-계층 구조등을 모델링하게 되지요. 사실, 직접 자신의 도메인에 적합한 온톨로지를 정의하다 보면, 이러한 추상화단위를 위한 속성을 제각기 정의할 수 밖에 없습니다. 개념과 개념과의 관계를 정의할 필요가 반드시 생기기 때문이지요. 그럴 경우에 SKOS는 구원 투수가 되어줍니다. 그리고 이런 광범위한 용도때문에 다른 Vocabulary들과도 찰떡궁합처럼 맞아떨어지지요.
정보의 적확한 의미를 정의하기는 어려워도, 일단 그 느슨한 '구조'만이라도 담아내고자 하는 것이 SKOS가 지닌 목적이 아닌가 싶습니다.
DC
더블린 코어 메타데이터 (Dublin Core Metadata , 이하 DC)는 사실, 유래가 깊은 Vocabulary입니다. 기존에도 정보자원에 대한 메타 데이터를 정의하고자 하는 시도들이 많았는데, 그 중 하나로 1995년 OCLC와 NCSA라는 단체들이 더블린에서 워크샵을 가지고 제정한 것이 DC라고 하네요. 때문에 현재도 많이 사용되는 DC는 기본 데이터의 경우, 컨텐츠의 저작에 관련된 기초적인 요소들을 정의하고 있습니다. 그런 특성때문에, 다른 Vocabulary들에서도 심심치 않게 불려다니고 있구요^^;
Microformat
마이크로 포맷은 그야말로, 가장 단순한 방법에서부터 메타데이터를 정의해나가자는 움직입니니다. 그들 스스로도, 메타 데이터 포맷을 위한 설계 원칙(design principles for formats)라고 명시하고 있구요. 가장 간단한 형태로 개방된 데이터 포맷 표준들을 점차 늘려나가자는 목표에서 실용적인 움직임을 계속하고 있습니다.
따라서, 메타데이터들이 다루는 범위도 상당히 한정적이고, 때문에 무척 실용적입니다. hCard , hCal, XFN, rel-tag등 다양한 표준들이 생겨나고 도입도 적극적인편이지요. 이렇게 HTML안에 단순한 온톨로지를 심어넣는 움직임은, 그간의 접근방식과는 다르다고 할 수 있겠는데요. 때문에 2006년경부터 W3C에서도 다른 방법들(GRDDL,RDFa등의)을 제시하고 있습니다.
-
- About 페이지에 그들이 지향하고자 하는 바가 잘 나와있습니다^^
그럼, 각 Vocabulary에 대해서는, 여러개의 글로 나누어 자세히 다루어보도록 하겠습니다. 그전에, 다음 글에서는 RDFa , GRDDL , SPARQL과 같은 시맨틱웹의 새로운 변화를 견인하고 있는 기술들에 대해 한번 다루어 봐야 겠습니다^^
이 글은 스프링노트에서 작성되었습니다.
이올린에 북마크하기
이올린에 추천하기
