Architektura sémantického webu
Architektura sémantického webu je znázorněna na obrázku níže. První vrstva, URI a Unicode, navazuje na důležité vlastnosti existujícího WWW. Unicode je standard kódování mezinárodních znakových sad a umožňuje používat všechny lidské jazyky
na webu (psát je i číst) v jedné standardizované podobě. Uniform Resource
Identifier (URI) je řetězec ve standardizovaném tvaru, který umožňuje jednoznačně identifikovat zdroje (např. dokumenty). Podmnožinou URI je Uniform Resource
Locator (URL), který obsahuje mechanismus přístupu a (síťové) umístění dokumentu - například http://www.example.org/. Další podmnožinou URI je URN, který umožňuje identifikovat zdroj bez uvedení jeho umístění a způsobu dereference - příkladem je urn:isbn:0-123-45678-9. Použití URI je pro distribuovaný internetový systém důležité, protože poskytuje srozumitelnou identifikaci všech zdrojů. Mezinárodní variantou URI je Internationalized Resource Identifier (IRI), který umožňuje používat v identifikátoru znaky Unicode a pro nějž je definováno mapování na URI. Ve zbytku textu lze všude, kde používáme URI, použít také IRI jako obecnější pojem.

Architektura sémantického webu ve vrstvách
Extensible Markup Language (XML) vrstva spolu s jmennými prostory XML a definicemi XML schema zajišťuje, že se na sémantickém webu používá společná syntaxe. XML je obecný značkovací jazyk pro dokumenty obsahující strukturované informace. Dokument XML obsahuje elementy, které mohou být zanořené a mohou mít atributy i obsah. Jmenné prostory XML umožňují v jednom dokumentu XML specifikovat různé značkovací slovníky. XML schema slouží k vyjádření schématu konkrétní množiny dokumentů XML.
Základním formátem reprezentace dat pro sémantický web je Resource Description Framework (RDF). RDF je rámec pro reprezentaci informací o zdrojích ve formě grafu. Původně bylo určeno především pro reprezentaci metadat o zdrojích WWW, jako je název, autor a datum změny webové stránky, ale lze je použít i pro ukládání jakýchkoli jiných dat. Je založeno na trojicích subjekt-predikát-objekt, které tvoří graf dat. Veškerá data na sémantickém webu používají RDF jako primární jazyk reprezentace. Normativní syntaxí pro serializaci RDF je XML ve formě RDF/XML. Je definována i formální sémantika RDF.
RDF samo o sobě slouží jako popis grafu tvořeného trojicemi. Kdokoli může definovat slovník termínů používaných pro podrobnější popis. Aby bylo možné standardizovaně popisovat taxonomie a další ontologické konstrukty, bylo v rámci RDF vytvořeno RDF Schema (RDFS) spolu s jeho formální sémantikou. RDFS lze použít k popisu taxonomií tříd a vlastností a k vytváření lehkých ontologií.
Podrobnější ontologie lze vytvářet pomocí Web Ontology Language OWL. OWL je jazyk odvozený z deskripčních logik a nabízí více konstruktů než RDFS. Je syntakticky vložen do RDF, a stejně jako RDFS tedy poskytuje další standardizovaný slovník. OWL existuje ve třech variantách - OWL Lite pro taxonomie a jednoduchá omezení, OWL DL pro plnou podporu deskripční logiky a OWL Full pro maximální výrazovou sílu a syntaktickou volnost RDF. Protože je OWL založeno na deskripční logice, není překvapivé, že je pro něj definována formální sémantika.
RDFS a OWL mají definovanou sémantiku a tuto sémantiku lze použít pro odvozování v ontologiích a znalostních bázích popsaných pomocí těchto jazyků. Aby bylo možné poskytovat pravidla nad rámec konstruktů dostupných v těchto jazycích, standardizují se pro sémantický web také pravidlové jazyky. Vynořují se dva standardy - RIF a SWRL.
Pro dotazování nad daty RDF a také nad ontologiemi RDFS a OWL se znalostními bázemi je k dispozici dotazovací jazyk RDF (SPARQL). SPARQL je jazyk podobný SQL, ale používá trojice RDF a zdroje jak pro část dotazu určující shodu, tak pro vracení výsledků dotazu. Protože jsou RDFS i OWL postaveny na RDF, lze SPARQL použít i k přímému dotazování ontologií a znalostních bází. Všimněte si, že SPARQL není jen dotazovací jazyk, ale také protokol pro přístup k datům RDF.
Očekává se, že veškerá sémantika a pravidla budou vykonávány na vrstvách pod Proof a výsledek bude použit k dokazování odvození. Formální důkaz spolu s důvěryhodnými vstupy pro důkaz bude znamenat, že výsledkům lze věřit, jak ukazuje horní vrstva na obrázku výše. Pro spolehlivé vstupy mají být použity kryptografické prostředky, například digitální podpisy pro ověření původu zdrojů. Nad těmito vrstvami pak lze vybudovat aplikaci s uživatelským rozhraním.
Ve zbytku této kapitoly popíšeme některé z těchto technologií - RDF, RDFS, OWL a SPARQL.