Ontologi (informationsvetenskap) -
Ontology (information science)

Allmänna aspekter Relaterade fält och underfält

Inom datavetenskap och informationsvetenskap omfattar en ontologi en representation, formellt namn och definition av kategorierna, egenskaperna och relationerna mellan begreppen, data och enheter som styrker en, många eller alla diskursområden . Mer enkelt är en ontologi ett sätt att visa egenskaperna hos ett ämnesområde och hur de är relaterade, genom att definiera en uppsättning begrepp och kategorier som representerar ämnet.

Varje akademisk disciplin eller fält skapar ontologier för att begränsa komplexiteten och organisera data till information och kunskap. Nya ontologier förbättrar problemlösning inom den domänen. Översätta forskningsrapporter inom varje område är ett problem underlättas när experter från olika länder att upprätthålla en kontrollerad vokabulär av jargong mellan var och en av deras språk.

Etymologi

Det sammansatta ordet ontologi kombinerar - , från grekiska ὄν , ( gen. Ὄντος, ontos ), dvs "varande; det som är", vilket är nuvarande ledordet av verbet εἰμί , eimí , dvs "att vara, jag är ", och -λογία , -logia , dvs" logisk diskurs ", se klassiska föreningar för denna typ av ordbildning.

Medan etymologin är grekisk, uppstod den äldsta befintliga uppteckningen av själva ordet, New Latin form ontologia , 1606 i verket Ogdoas Scholastica av Jacob Lorhard ( Lorhardus ) och 1613 i Lexicon philosophicum av Rudolf Göckel ( Goclenius ).

Den första förekomsten på engelska av ontologi som spelades in av OED ( Oxford English Dictionary , online edition, 2008) kom i Archeologia Philosophica Nova eller New Principles of Philosophy av Gideon Harvey .

Översikt

Vad ontologier inom både informationsvetenskap och filosofi har gemensamt är försöket att representera enheter, idéer och händelser, med alla deras inbördes beroende egenskaper och relationer, enligt ett system av kategorier. På båda områdena finns det ett stort arbete med ontologiska problem (t.ex. Quine och Kripke inom filosofi, Sowa och Guarino inom datavetenskap) och debatter om i vilken utsträckning normativ ontologi är möjlig (t.ex. grundläggande och koherentism inom filosofi, BFO och Cykla i artificiell intelligens). Tillämpad ontologi anses vara en andlig efterträdare till tidigare arbete inom filosofi, men många nuvarande ansträngningar handlar mer om att upprätta kontrollerade vokabulär av trånga domäner än de första principerna , förekomsten av fasta essenser eller om bestående objekt (t.ex. perdurantism och endurantism ) kan vara ontologiskt mer primärt än processer .

Varje fält använder ontologiska antaganden för att utforma tydliga teorier, forskning och tillämpningar. Exempelvis är definitionen och ontologin av ekonomi ett primärt problem inom marxistisk ekonomi , men också på andra ekonomiska delområden . Ett exempel på ekonomi som förlitar sig på informationsvetenskap förekommer i fall där en simulering eller modell är avsedd att möjliggöra ekonomiska beslut, till exempel att bestämma vilka kapitaltillgångar som riskerar och hur mycket (se riskhantering ).

Konstgjord intelligens har behållit mest uppmärksamhet när det gäller tillämpad ontologi på delområden som bearbetning av naturligt språk inom maskinöversättning och kunskapsrepresentation , men ontologiredaktörer används ofta inom en rad områden som utbildning utan avsikt att bidra till AI.

Historia

Ontologier uppstår ur den gren av filosofin som kallas metafysik , som behandlar frågor som "vad finns?" och "vad är verklighetens natur?". En av fem traditionella grenar av filosofin, metafysik, handlar om att utforska tillvaron genom egenskaper, enheter och relationer som de mellan detaljer och universaliteter , inneboende och yttre egenskaper eller essens och existens . Metafysik har varit ett pågående diskussionsämne sedan registrerad historia.

Sedan mitten av 1970-talet har forskare inom artificiell intelligens (AI) insett att kunskapsteknik är nyckeln till att bygga stora och kraftfulla AI-system. AI -forskare hävdade att de kunde skapa nya ontologier som beräkningsmodeller som möjliggör vissa typer av automatiserade resonemang , som bara var marginellt framgångsrika . På 1980-talet började AI-samhället använda termen ontologi för att hänvisa till både en teori om en modellerad värld och en komponent i kunskapsbaserade system . I synnerhet introducerade David Powers ordet ontologi för AI för att hänvisa till verkliga världen eller robotgrunder, och publicerade 1990 litteraturöversikter med betoning på grundad ontologi i samband med uppmaningen om papper för en AAAI Summer Symposium Machine Learning of Natural Language and Ontology, med en utökad version publicerad i SIGART Bulletin och inkluderad som förord ​​till förfarandet. Vissa forskare, som hämtat inspiration från filosofiska ontologier, betraktade beräkningsontologi som ett slags tillämpad filosofi.

År 1993 använde den allmänt citerade webbsidan och artikeln "Toward Principles for the Design of Ontologies Used for Knowledge Sharing" av

En ontologi är en beskrivning (som en formell specifikation av ett program) av de begrepp och relationer som formellt kan existera för en agent eller en gemenskap av agenter. Denna definition överensstämmer med användningen av ontologi som uppsättning begreppsdefinitioner, men mer generell. Och det är en annan känsla av ordet än dess användning i filosofi.

Gruber försökte ta avstånd från ontologier från taxonomier och liknande ansträngningar inom kunskapsmodellering som är beroende av klasser och arv (1993):

Ontologier likställs ofta med taksonomiska hierarkier av klasser, klassdefinitioner och subsumptionsrelationen , men ontologier behöver inte begränsas till dessa former. Ontologier är inte heller begränsade till konservativa definitioner  - det vill säga definitioner i traditionell logisk mening som bara introducerar terminologi och inte lägger till någon kunskap om världen. För att specificera en konceptualisering måste man ange axiom som begränsar möjliga tolkningar för de definierade termerna.

Som förfining av Grubers definition sade Feilmayr och Wöß (2016): "En ontologi är en formell, uttrycklig specifikation av en gemensam konceptualisering som kännetecknas av hög semantisk uttrycksfullhet som krävs för ökad komplexitet."

Komponenter

Samtida ontologier delar många strukturella likheter, oavsett vilket språk de uttrycks i. De flesta ontologier beskriver individer (instanser), klasser (begrepp), attribut och relationer. I detta avsnitt diskuteras var och en av dessa komponenter i tur och ordning.

Vanliga komponenter i ontologier inkluderar:

Individer
Instanser eller objekt (de grundläggande eller "marknivå" -objekten)
Klasser
Uppsättningar, samlingar, koncept, klasser i programmering , typer av objekt eller sorters saker
Attribut
Aspekter, egenskaper, funktioner, egenskaper eller parametrar som objekt (och klasser) kan ha
Förhållanden
Sätt på vilka klasser och individer kan relateras till varandra
Funktionsvillkor
Komplexa strukturer bildade av vissa relationer som kan användas i stället för en enskild term i ett uttalande
Begränsningar
Formellt angivna beskrivningar av vad som måste vara sant för att något påstående ska accepteras som input
Regler
Uttalanden i form av en if-then (antecedent-consequent) mening som beskriver de logiska slutsatser som kan dras från ett påstående i en viss form
Axiom
Påståenden (inklusive regler) i en logisk form som tillsammans utgör den övergripande teori som ontologin beskriver inom sitt tillämpningsområde. Denna definition skiljer sig från "axiom" i generativ grammatik och formell logik . I dessa discipliner innehåller axiom endast uttalanden som påstås vara a priori kunskap. Som det används här inkluderar "axiom" också teorin som härrör från axiomatiska uttalanden
evenemang
Att ändra attribut eller relationer

Ontologier kodas vanligtvis med ontologispråk .

Typer

Domänontologi

En domänontologi (eller domenspecifik ontologi) representerar begrepp som tillhör ett världsområde, såsom biologi eller politik. Varje domänontologi modellerar vanligtvis domänspecifika definitioner av termer. Till exempel har ordet kort många olika betydelser. En ontologi om domänen för poker skulle modellera " spelkort " betydelsen av ordet, medan en ontologi om domänen för hårdvara skulle modellera " hålkort " och " grafikkort " betydelser.

Eftersom domänontologier skrivs av olika människor representerar de begrepp på mycket specifika och unika sätt och är ofta oförenliga inom samma projekt. När system som förlitar sig på domänontologier expanderar behöver de ofta slå samman domänontologier genom att manuellt justera varje enhet eller använda en kombination av programvarusammanfogning och handinställning. Detta utgör en utmaning för ontologidesignern. Olika ontologier inom samma domän uppstår på grund av olika språk, olika avsedd användning av ontologierna och olika uppfattningar av domänen (baserat på kulturell bakgrund, utbildning, ideologi, etc.).

För närvarande är sammanslagning av ontologier som inte är utvecklade från en gemensam övre ontologi en i stort sett manuell process och därför tidskrävande och dyr. Domänontologier som använder samma övre ontologi för att tillhandahålla en uppsättning grundläggande element för att specificera betydelserna för domänontologi -enheterna kan slås samman med mindre ansträngning. Det finns studier om generaliserade tekniker för sammanslagning av ontologier, men detta forskningsområde pågår fortfarande, och det är en ny händelse att se frågan kringgås genom att ha flera domänontologier som använder samma övre ontologi som OBO Foundry .

Övre ontologi

En övre ontologi (eller grundontologi) är en modell för de gemensamt delade relationerna och objekten som i allmänhet är tillämpliga inom ett brett spektrum av domänontologier. Det använder vanligtvis en kärnordlista som överskrider termerna och tillhörande objektbeskrivningar när de används i olika relevanta domänontologier.

Standardiserade övre ontologier tillgängliga för användning inkluderar BFO , BORO -metod , Dublin Core , GFO , Cyc , SUMO , UMBEL , Unified Foundational Ontology (UFO) och DOLCE . WordNet har ansetts vara en övre ontologi av vissa och har använts som ett språkligt verktyg för att lära sig domänontologier.

Hybrid ontologi

Den gelliska ontologin är ett exempel på en kombination av en övre och en domänontologi.

Visualisering

En undersökning av ontologivisualiseringsmetoder presenteras av Katifori et al. En uppdaterad undersökning av metoder och verktyg för ontologivisualisering publicerades av Dudás et al. De mest etablerade ontologivisualiseringsmetoderna, nämligen indragna träd- och grafvisualiseringar utvärderas av Fu et al. Ett visuellt språk för ontologier som representeras i OWL specificeras av Visual Notation for OWL Ontologies (VOWL) .

Teknik

Ontologiteknik (även kallad ontologibyggnad) är en uppsättning uppgifter relaterade till utveckling av ontologier för en viss domän. Det är ett underfält inom kunskapsteknik som studerar ontologins utvecklingsprocess, ontologins livscykel, metoderna och metoderna för att bygga ontologier och de verktyg och språk som stöder dem.

Ontologiteknik syftar till att tydliggöra kunskapen i mjukvaruapplikationer och organisatoriska procedurer för en viss domän. Ontologiteknik erbjuder en väg för att övervinna semantiska hinder, till exempel de som är relaterade till definitionerna av affärsbegrepp och programvaruklasser. Kända utmaningar med ontologi är:

 1. Att se till att ontologin är aktuell med domänkunskap och termanvändning
 2. Tillhandahåller tillräcklig specificitet och koncepttäckning för intresseområdet, vilket minimerar innehållets fullständighetsproblem
 3. Att se till att ontologin kan stödja dess användningsfall

Redaktörer

Ontologi -redaktörer är applikationer som är utformade för att hjälpa till med att skapa eller manipulera ontologier. Det är vanligt att ontologiredaktörer använder ett eller flera ontologispråk .

Aspekter av ontologiredaktörer inkluderar: visuella navigationsmöjligheter inom kunskapsmodellen , slutsatser och informationsutvinning ; stöd för moduler; import och export av utländska kunskapsrepresentationsspråk för ontologimatchning ; och stöd från meta-ontologier som OWL-S , Dublin Core , etc.

Inlärning

Ontologiinlärning är det automatiska eller halvautomatiska skapandet av ontologier, inklusive att extrahera en domäns termer från naturligt språktext. Eftersom att bygga ontologier manuellt är extremt arbetskrävande och tidskrävande, finns det stor motivation att automatisera processen. Informationsutvinning och textbrytning har undersökts för att automatiskt länka ontologier till dokument, till exempel i samband med BioCreative -utmaningarna.

språk

Ett ontologispråk är ett formellt språk som används för att koda en ontologi. Det finns ett antal sådana språk för ontologier, både proprietära och standardbaserade:

 • Common Algebraic Specification Language är ett generellt logikbaserat specifikationsspråk som utvecklats inom IFIP-arbetsgruppen 1.3 "Foundations of System Specifications" och är ett de facto standardspråk för mjukvaruspecifikationer. Det tillämpas nu på ontologispecifikationer för att tillhandahålla modularitet och struktureringsmekanismer.
 • Gemensam logik är ISO -standard 24707, en specifikation av en familj av ontologispråk som kan översättas till varandra exakt.
 • Den Cyc -projektet har sin egen ontologi språk som kallas CYCL , baserat på första ordningens predikatkalkyl med några högre ordningens förlängningar.
 • DOGMA (Developing Ontology-Grounded Methods and Applications) antar det faktaorienterade modelleringsmetoden för att ge en högre nivå av semantisk stabilitet.
 • Det gelliska språket innehåller regler för sin egen förlängning och integrerar därmed en ontologi med ett ontologispråk.
 • IDEF5 är en mjukvaruteknisk metod för att utveckla och underhålla användbara, exakta, domänontologier.
 • KIF är en syntax för första ordningens logik som är baserad på S-uttryck . SUO-KIF är en derivatversion som stöder Suggested Upper Merged Ontology .
 • MOF och UML är standarder för OMG
 • Olog är en kategoriteoretisk metod för ontologier, med betoning på översättningar mellan ontologier med hjälp av funktioner .
 • OBO , ett språk som används för biologiska och biomedicinska ontologier.
 • OntoUML är en ontologiskt välgrundad profil för UML för konceptuell modellering av domänontologier.
 • OWL är ett språk för att göra ontologiska uttalanden, utvecklade som en uppföljning från RDF och RDFS , liksom tidigare ontologiska språkprojekt inklusive OIL , DAML och DAML+OIL . OWL är avsett att användas över World Wide Web , och alla dess element (klasser, egenskaper och individer) definieras som RDF -resurser och identifieras av URI: er .
 • Rule Interchange Format (RIF) och F-Logic kombinerar ontologier och regler.
 • Semantic Application Design Language (SADL) fångar en delmängd av uttrycksfullheten hos OWL , med hjälp av ett engelskliknande språk som matats in via ett Eclipse Plug-in.
 • SBVR (Semantics of Business Vocabularies and Rules) är en OMG -standard som antagits inom industrin för att bygga ontologier.
 • TOVE Project , TOronto Virtual Enterprise -projekt

Publicerade exempel

 • Arabic Ontology , en språklig ontologi för arabiska, som kan användas som ett arabiskt Wordnet men med ontologiskt rent innehåll.
 • AURUM - Informationssäkerhetsontologi, en ontologi för kunskapsdelning av informationssäkerhet, som gör det möjligt för användare att tillsammans förstå och utvidga domänkunskapskroppen. Det kan fungera som grund för automatiserad informationssäkerhetsrisk och efterlevnadshantering.
 • BabelNet , ett mycket stort flerspråkigt semantiskt nätverk och ontologi, lexikaliserat på många språk
 • Basic Formal Ontology, en formell övre ontologi utformad för att stödja vetenskaplig forskning
 • BioPAX, en ontologi för utbyte och driftskompatibilitet av data från biologisk väg (cellulära processer)
 • BMO, en e-Business Model Ontology baserad på en genomgång av företagsontologier och affärsmodellitteratur
 • SSBMO, en starkt hållbar affärsmodell Ontologi baserad på en genomgång av den systembaserade naturvetenskapliga och samhällsvetenskapliga litteraturen (inklusive företag). Inkluderar kritik av och betydande tillägg till Business Model Ontology (BMO).
 • CCO och GexKB, Application Ontologies (APO) som integrerar olika typer av kunskap med Cell Cycle Ontology (CCO) och Gene Expression Knowledge Base (GexKB)
 • CContology (Customer Complaint Ontology), en e-business ontologi för att stödja online klagomålshantering
 • CIDOC konceptuell referensmodell , en ontologi för kulturarv
 • COSMO, en Foundation Ontology (nuvarande version i OWL) som är utformad för att innehålla representationer av alla primitiva begrepp som behövs för att logiskt specificera betydelsen av en domänenhet. Den är avsedd att fungera som en grundläggande ontologi som kan användas för att översätta bland representationerna i andra ontologier eller databaser. Det började som en sammanslagning av de grundläggande elementen i OpenCyc- och SUMO -ontologierna och har kompletterats med andra ontologiska element (typer, relationer) för att inkludera representationer av alla ord i Longman -ordlistan som definierar ordförråd .
 • Computer Science Ontology , en automatiskt genererad ontologi av forskningsämnen inom datavetenskap
 • Cyc , en stor Foundation Ontology för formell representation av diskursens universum
 • Disease Ontology , utformad för att underlätta kartläggning av sjukdomar och associerade tillstånd till särskilda medicinska koder
 • DOLCE , en beskrivande ontologi för språklig och kognitiv teknik
 • Drammar, dramatikens ontologi
 • Dublin Core , en enkel ontologi för dokument och publicering
 • Financial Industry Business Ontology (FIBO), en affärskonceptuell ontologi för finansindustrin
 • Grundläggande, grundläggande och språkliga ontologier
 • Grundläggande modell för anatomi , en ontologi för mänsklig anatomi
 • Friend of a Friend , en ontologi för att beskriva personer, deras aktiviteter och deras relationer till andra människor och objekt
 • Genontologi för genomik
 • Gellish English dictionary , en ontologi som innehåller en ordbok och taxonomi som innehåller en övre ontologi och en lägre ontologi som fokuserar på industriella och affärsmässiga tillämpningar inom teknik, teknik och upphandling.
 • Geopolitisk ontologi , en ontologi som beskriver geopolitisk information skapad av Food and Agriculture Organization (FAO). Den geopolitiska ontologin innehåller namn på flera språk (engelska, franska, spanska, arabiska, kinesiska, ryska och italienska); kartlägger standardkodningssystem (UN, ISO, FAOSTAT, AGROVOC, etc.); tillhandahåller relationer mellan territorier (landgränser, gruppmedlemskap, etc.); och spårar historiska förändringar. Dessutom tillhandahåller FAO webbtjänster av geopolitisk ontologi och en modultillverkare för att ladda ner moduler för den geopolitiska ontologin till olika format (RDF, XML och EXCEL). Se mer information på FAO Country Profiles .
 • GAO (General Automotive Ontology) - en ontologi för bilindustrin som inkluderar "bil" -tillägg
 • GOLD, General Ontology for Linguistic Description
 • GUM (Generalized Upper Model), en språkligt motiverad ontologi för medling mellan klienters system och naturligt språkteknologi
 • IDEAS Group , en formell ontologi för företagsarkitektur som utvecklas av australiensiska, kanadensiska, brittiska och amerikanska försvarsdepartement.
 • Linkbase, en formell representation av den biomedicinska domänen, grundad på Basic Formal Ontology.
 • LPL, Landmark Pattern Language
 • NCBO Bioportal, biologisk och biomedicinsk ontologi och tillhörande verktyg för att söka, bläddra och visualisera
 • NIFSTD Ontologies from the Neuroscience Information Framework : en moduluppsättning av ontologier för neurovetenskapens domän.
 • OBO-Edit, en ontologiläsare för de flesta öppna biologiska och biomedicinska ontologierna
 • OBO Foundry , en serie interoperabla referensontologier inom biologi och biomedicin
 • OMNIBUS Ontology, en ontologi för lärande, instruktion och instruktionsdesign
 • Ontologi för biomedicinska undersökningar , en öppen åtkomst, integrerad ontologi av biologiska och kliniska undersökningar
 • ONSTR, Ontology for Newborn Screening Follow-up and Translational Research, Newborn Screening Follow-up Data Integration Collaborative, Emory University, Atlanta.
 • Växtontologi för växtstrukturer och tillväxt/utvecklingsstadier, etc.
 • POPE, Purdue Ontology for Pharmaceutical Engineering
 • PRO, Protein Ontology of the Protein Information Resource, Georgetown University
 • ProbOnto , kunskapsbas och ontologi för sannolikhetsfördelningar .
 • Program abstraktion taxonomi
 • Proteinontologi för proteomik
 • RXNO Ontologi , för namnreaktioner inom kemi
 • SCDO, Sickle Cell Disease Ontology, underlättar datadelning och samarbeten inom SDC -gemenskapen, bland andra applikationer (se listan på SCDO: s webbplats ).
 • Sekvensontologi , för att representera genomiska funktionstyper som finns på biologiska sekvenser
 • SNOMED CT (Systematiserad medicinsk nomenklatur - kliniska termer)
 • Föreslagen övre sammanslagna ontologi , en formell övre ontologi
 • Systembiologi Ontologi (SBO), för beräkningsmodeller i biologi
 • SÖT, Semantisk webb för jord- och miljöterminologi
 • ThoughtTreasure ontologi
 • TIME-ITEM , ämnen för indexering av medicinsk utbildning
 • Uberon , som representerar djurens anatomiska strukturer
 • UMBEL , en lätt referensstruktur med 20 000 ämnesbegreppsklasser och deras relationer härledda från OpenCyc
 • WordNet , ett lexiskt referenssystem
 • YAMATO, ännu en mer avancerad ontologi på högsta nivå

W3C Linking Open Data community -projektet koordinerar försök att konvergera olika ontologier till världsomfattande semantisk webb .

Bibliotek

Utvecklingen av ontologier har lett till uppkomsten av tjänster som tillhandahåller listor eller kataloger över ontologier som kallas ontologibibliotek.

Följande är bibliotek med mänskligt utvalda ontologier.

 • COLORE är ett öppet förråd av första ordnings ontologier i Common Logic med formella länkar mellan ontologier i förvaret.
 • DAML Ontology Library har ett arv av ontologier i DAML.
 • Ontology Design Patterns -portalen är ett wiki -arkiv med återanvändbara komponenter och metoder för ontologidesign, och har också en lista över exemplifierande ontologier .
 • Protégé Ontology Library innehåller en uppsättning OWL, rambaserade och andra formatontologier.
 • SchemaWeb är en katalog med RDF -schemat som uttrycks i RDFS, OWL och DAML+OIL.

Följande är både kataloger och sökmotorer.

 • OBO Foundry är en serie interoperabla referensontologier inom biologi och biomedicin.
 • Bioportal (ontologilager för NCBO)
 • OntoSelect Ontology Library erbjuder liknande tjänster för RDF/S-, DAML- och OWL -ontologier.
 • Ontaria är en "sökbar och sökbar katalog med semantiska webbdata" med fokus på RDF -ordförråd med OWL -ontologier. (OBS Projekt "i vänteläge" sedan 2004).
 • Swoogle är en katalog och sökmotor för alla RDF -resurser som finns på webben, inklusive ontologier.
 • Öppna initiativet för Ontology Repository
 • ROMULUS är ett grundläggande ontologilager som syftar till att förbättra semantisk interoperabilitet. För närvarande finns det tre grundläggande ontologier i förvaret: DOLCE , BFO och GFO .

Exempel på applikationer

I allmänhet kan ontologier användas med fördel på flera områden.

 • Företagsapplikationer. Ett mer konkret exempel är SAPPHIRE (hälsovård) eller situationsmedvetenhet och beredskap för folkhälsa Förekomsten och resonerande motorer som är en semantik baserad hälsoinformationssystem som kan spåra och utvärdera situationer och händelser som kan påverka folkhälsan .
 • Geografiska informationssystem sammanför data från olika källor och drar därför nytta av ontologiska metadata som hjälper till att koppla samman datans semantik.
 • Domänspecifika ontologier är oerhört viktiga inom biomedicinsk forskning, vilket kräver namngiven entitetsdisambiguering av olika biomedicinska termer och förkortningar som har samma karaktärssträng men representerar olika biomedicinska begrepp. Till exempel kan CSF representera kolonistimulerande faktor eller cerebral spinalvätska, som båda representeras av samma term, CSF, i biomedicinsk litteratur. Det är därför ett stort antal offentliga ontologier är relaterade till biovetenskaperna. Livsvetenskapliga datavetenskapliga verktyg som misslyckas med att implementera dessa typer av biomedicinska ontologier kommer inte att kunna exakt bestämma orsakssamband mellan begrepp.

Se även

Relaterade filosofiska begrepp

Referenser

Vidare läsning