본문 바로가기

IT전문가

시맨틱 웹3.0

시맨틱 웹

개요

우리가 현재 사용하고 있는 웹(World Wide Web)은 Tim Berners-Lee에 의해 제안되고, 1991년 처음 공개되고 난 이후 큰 발전을 이루었습니다. 웹을 사용하는 사용자와 웹 상의 정보가 크게 증가하면서 사회적, 경제적으로 모든 면에서 강력한 영향력을 가지게 되었습니다만, 정보의 양이 증가하면서 다양하게 산재되어 있는 웹 상의 자원들 중에서 정확한 정보를 찾거나 응용 프로그램을 활용하는데 어려움이 있고, 자동화 되지 않아 불편함이 생기는 등의 한계를 드러내고 있습니다.
이러한 문제는 현재 웹 상의 대부분의 데이터가 사람이 이해하는 의미를 가지고 있고 기계는 데이터의 의미가 아닌 구문의 형태를 인식하는 수준에서만 조작하고 처리할 수 있기 때문입니다.

Tim Berners-Lee는 W3C를 중심으로 웹 상에 존재하는 정보들의 의미를 사람과 기계(컴퓨터)가 이해하고 처리할 수 있도록 하는 시맨틱 웹(Semantic Web)이라는 차세대 웹 기술을 제안하였습니다.

 The Semantic Web is an evolving extension of the World Wide Web in which the semantics of information and services on the web is defined, making it possible for the web to understand and satisfy the requests of people and machines to use the web content.
[ Berners-Lee, Hendler and Lassila, Scientific America, May 2001]

시맨틱 웹이 주도하는 핵심 아이디어는 기계가 이해할 수 있고 처리할 수 있는 웹 콘텐트(데이터)의 의미를 만드는 것입니다. 이는 현재의 웹에서 보다 확장되어, 웹 상의 자원과 정보의 의미를 기계가 처리할 수 있는 형태로 표현합니다. 이를 통해 보다 정교하고 높은 기능성을 가진 자동화 된 툴의 개발을 가능하게 합니다. W3C에서는 이를 한 마디로 표현하여 시맨틱 웹 정의를 다음과 같이 하고 있습니다.

 The Semantic Web is a web of data. [W3C]

즉 시맨틱 웹은 데이터의 웹이라고 할 수 있습니다. 시맨틱 웹은 다양한 소스로부터의 데이터를 통합하기 위한 공통적인 형태를 가지고 있으며, 이를 통해 웹의 정보가 어플리케이션, 기업, 커뮤니티 등에서 공유되고 재사용될 수 있는 공통 프레임워크를 제공합니다.

현재의 웹 VS. 시맨틱 웹

현재의 웹 콘텐트는 사람이 이해하고 사용하는데 적합합니다. HTML로 작성된 문서는 하이퍼링크를 통해 콘텐트들 간의 연결이 가능하지만 자연어로 기술된 메타 정보를 기계는 단순한 텍스트로 해석할 수 밖에 없습니다. 웹에서의 검색을 예로 들면, 키워드 기반의 검색은 많은 검색 결과 중에 정확한 결과를 찾기 어렵고, 사람이 결과를 해석하고, 결합해야 합니다. 또한 검색의 결과를 또 다른 소프트웨어에 의해 읽혀지거나 접근될 수가 없습니다.

시맨틱 웹은 보다 쉽게 기계가 처리 가능한 형태로 데이터를 표현합니다. 예를 들어, XML에 기반한 시맨틱 표현 언어인 RDF는 데이터가 가지는 개념과 관계 정보를 Subject, Predicate, Object의 형태로 표현하여 기계가 그 의미와 개념을 해석할 수 있게 합니다. 그리고, 이러한 데이터의 표현을 통해 이점을 얻을 수 있도록 지능화된 기술을 사용합니다. 기계가 데이터에 대한 의미를 해석하고, 공통된 포맷을 통해 타 응용 프로그램들 간에 공유하여 사용자에게 보다 쉽고, 정확하고, 자동화된 서비스를 제공할 수 있게 합니다. 이러한 시맨틱 웹은 기존의 웹과 전혀 상반되거나 경쟁 구도에 있는 대체기술이 아니며, 기존의 웹 기술에 기반하여 점차 확장되고 발전시키는 것이 바람직한 방향이라고 할 수 있을 것입니다.

시맨틱 웹 기술과 표준

시맨틱 웹은 다음과 같은 기술들로 구성되어 있습니다.

    • Explicit Metadata
      메타데이터와 추론에 필요한 규칙 등을 XML(eXtensible Markup Language), RDF(Resource Description Framework)와 같은 언어와 어휘로 표현합니다.
    • Ontologies
      온톨로지(ontology)라는 지식 표현 기술을 이용하여 데이터의 의미와 관계 정보를 체계적으로 표현합니다.
    • Logical reasoning
      추론은 온톨로지와 함께 결합된 관계 정보들로부터 새로운 정보를 도출해 내는 것을 가능하게 합니다.

아울러 W3C는 시맨틱 웹 액티비티 그룹 산하의 워킹그룹을 통하여 다음과 같은 관련 표준을 개발하고 있습니다.

    • RDF (Resource Description Framework)
    • GRDDL (Gleaning Resource Descriptions from Dialects of Languages)
    • RDFa in XHTML
    • SPARQL Query Language for RDF:
    • OWL (Web Ontology Language

 


[그림 1. 시맨틱 웹 기술 계층 구조] [출처 – W3C, 2007]

아래는 관련한 용어 설명입니다.

    • URI (Uniform Resource Identifier): 웹 상의 자원을 식별하기 위한 객체의 명칭, 위치 등의 표현입니다.
    • XML(eXtensible Markup Language): 메타 정보 표현 언어인 XML, XML 상에서의 동일한 요소나 속성을 구분하기 위해 쓰이는 이름인 Namespace, XML 문서의 마크업 방식에 대한 정의인 XML Schema 등과 같은 다양한 표준을 의미합니다.
    • RDF(Resource Description Framework): RDF는 정보 자원이나 자원의 구조를 표현하는 언어입니다.
    • RDFS: RDF의 Schema 정보로 경량의 온톨로지를 표현합니다.
    • SPARQL: RDF 질의를 위한 언어입니다.
    • RIF(Rule Interchange Format): 규칙의 정의와 교환을 위한 계층입니다.
    • OWL: 특정 도메인에 대한 공유되는 일반적인 이해와 개념, 개념과의 관계를 표현하기 위한 언어입니다.
    • Logic: 기존에 정의된 정보들을 바탕으로 새로운 결론을 도출하는 추론 기능 등을 의미합니다.
    • Proof / Trust: 웹의 정보에 대한 신뢰를 제공하는 부분입니다.

 

웹 2.0, 웹 3.0, 그리고 시맨틱 웹

[그림 2. 웹 환경의 변화] [출처 – SEMTECH, 2007]

웹 2.0은 2004년 웹 2.0 컨퍼런스가 개최된 이후로 급 성장을 하면서 차세대 웹 기술로 각인되고 있습니다. 현재 통용되는 웹 2.0이라는 용어는 시맨틱 웹과 같은 특정 기술을 지칭하는 말이 아닌, 현재 인터넷 업계의 신기술이 지향하는 경향을 일컫는 말입니다. 팀 버너스 리가 시맨틱 웹을 제안했을 때 “차세대 웹”이라는 표현을 사용하여. 많은 사람들이 시맨틱 웹을 웹 2.0과 혼동하기도 합니다.

웹 2.0은 플랫폼(platform)으로서 웹과 사용자의 중요성을 부각시켰지만, 컴퓨터의 의해와 처리를 간과하였습니다. 때문에, 웹 2.0의 정보 공유 수단으로 시맨틱 웹 기술이 주목 받기도 하고, 시맨틱 웹을 웹 3.0으로 인식하는 공감대가 생기기도 하였습니다. 웹 2.0과 시맨틱 웹이 경계가 분명한 기술을 아니지만, 웹 2.0은 의미 기술을 기반으로 하는 시맨틱 웹으로 진화될 것으로 많은 연구자들이 보고 있습니다.

응용 분야

현재 시맨틱 웹에 대한 시도는 아래와 같이 의미적 메타데이터 체계를 구축하고 이를 활용하고자 하는 다양한 분야에서 활발하게 진행되고 있습니다.

    • 커뮤니티, 블로그
    • 데이터 통합
    • 포탈 및 검색
    • 시맨틱 웹 서비스
    • 기업 소프트웨어
    • 지식 관리
    • 비즈니스 인텔리전스
    • 가상 커뮤니티에 대한 연결
    • 멀티미디어 데이터 관리
    • 콘텐트 어댑테이션 및 명명

 

참고 자료

[1] Berners-Lee, Tim; James Hendler and Ora Lassila (May 17, 2001). “The Semantic Web”. Scientific American Magazine.
[2] Antoniou, Grigoris (2004-04-01). “A Semantic Web Primer”. The MIT Press.
[3] 한국시맨틱정보기술협회 (2008-01). “시맨틱 기술 사례 현황 조사”

출처 http://blog.saltlux.com/info-center/%EC%8B%9C%EB%A7%A8%ED%8B%B1-%EC%9B%B9/