Resumo: As necessidades informativas dos sistemas
de informação, e mais concretamente, os sistemas de informação
de empresa do setor de telecomunicações podem ser satisfeitas
por meio do uso de ontologias. São as ferramentas da Web Semântica
que resolvem os problemas dos acessos da informação, facilitando
o intercâmbio dos dados, assim mesmo melhoram a recuperação
respeito a questões de relevância.
Palavras-chave:
Ontologia; Sistemas de informação;
Metodologia de construção; Intercâmbio de dados; Reutilização
do conhecimento; Web semântica.
Abstract: The informative necessities of the Information
Systems, and more concretely, the enterprise information systems can be
satisfied by means of the use of the ontology. They are the tools of the
Semantic Web that solve the problems of information overabundance, facilitating
the data interchange, as well as improving the relevance in the recovery
of the information.
Keywords: Ontology; Information system; Construction
methodology; Data interchange; Knowledge Reusing; Semantic Web.
1. Introdução
O ritmo vertiginoso imposto pela Sociedade da Informação
provoca e pretende conhecer o controle de toda informação
disponível, ao qual resulta "impossível" pelo seu elevado
volume e pela falta de técnicas ao selecionar dados relevantes.
De forma que cada vez resulta maior o avanço tecnológico
e o volume informativo.
Para controlar estas disparidades surgem melhores representações da informação com o intuito de poder habilitar aplicações mais avançadas (Lacy, 2005). Entretanto nas empresas este processo ainda é muito escassa, devido a cultura informativa e os métodos de gestão que são geridos, principalmente com relação ao seu custo final. Não há uma conscientização plena sobre gestão da documentação e sua contribuição em valor adicionado à empresa. A gestão do conhecimento "vem" para suprir esta necessidade, entretanto se torna vital para a manutenção de estruturas levianas e pouco ágeis, mas pouco coopera para o êxito dos sistemas de informação nas empresas.
É evidente que para poder gerir a informação, é necessário um bom sistema de gestão documentário (Bustelo Ruesta, 2000). Em geral, as empresas que possuem sistemas de informação planificados (centros de documentação, arquivos, bibliotecas, etc.) são as de grande porte, em muitas ocasiões, multinacionais que adotaram e implantaram correntes já contrastadas em outros países como Estados Unidos, Canadá ou Inglaterra (entre outros), e que necessariamente, num momento de sua história tiveram que se propor um serviço pelo qual canalize a informação e ao mesmo tempo as torne de fácil acesso, satisfazendo assim as necessidades encontradas.
Neste artigo temos uma proposta transparente sobre criar uma ontologia
ao serviço de gestão do conhecimento em um sistema de informação
para empresas do setor das telecomunicações. Propusemos abordar
desde a ótica principal da Ciência da Informação
e do profissional como gestor do conhecimento, mas apoiamos a idéia
principal no uso de outras disciplinas como a Ciência da Computação,
a Filosofia e a Lingüística. O emprego lógico deste
trabalho foi utilizar Ontology Web Language OWL com a idéia de criar
uma ontologia como resposta à necessidade de gerir, na forma de
reaproveitar e trocar o conhecimento em benefício das empresas no
setor estudado.
2. Sistemas de informação empresarial
Desde princípios dos anos 1990, a área de Biblioteconomia
e Documentação - bem como a Ciência da Computação
entre outras - sofreram uma revolução importante tanto conceitualmente
como em suas competências técnicas. A mudança foi provocada
pela chegada da Sociedade da Informação e conseqüentemente,
a Sociedade do Conhecimento, que implicitamente se alçam sobre uma
revolução tecnológica que é causa e conseqüência
da proliferação da informação. Esta revolução
está concedendo ao conceito de Ciência da Informação,
embora caiba uma maior interdisciplinariedade como a que existia há
dez anos atrás.
A comunidade de pesquisadores e de quem aplicam seus resultados vai a notório aumento, o que está produzindo um salto quantitativo e qualitativo importante tanto nas investigações como nas ferramentas disponíveis. Num princípio, as tarefas de transmitir o conhecimento ficavam restringidas a área de Knowledge Acquisition Community, mas atualmente tem-se tratado na função de modelar o conhecimento (Staab & Studer, 2004). A mera transmissão do conhecimento já não é suficiente já que é muito maior o volume informativo a assimilar. São necessários novos métodos para sua gestão e controle, que não fiquem limitados unicamente às experiências em computação. Há uma ampla comunidade interdisciplinar que se está focando os estudos das ontologias e seus âmbitos de aplicação no comércio eletrônico, na gestão documentária e na recuperação de informação (Gómez-Pérez, 2004).
Estamos assistindo a transição da Web tradicional para a Web Semântica, onde as ontologias contribuem soluções a alguns dos problemas causados pelo volume elevado e desordenado de informação, já que são capazes de interagir com o usuário respondendo a suas perguntas, ao mesmo tempo em que podem processar os documentos de forma inteligente, e são capazes de representar o conhecimento abarcando um conteúdo informativo muito grande.
Num Sistema de Informação empresarial uma ontologia gerirá o conhecimento da companhia por um lado, e por outro lado, poderá trocar informação com outros sistemas de informação, recuperar e reutilizar conhecimento de um domínio, melhorando sua visualização com raciocínios semânticos, e controlará de forma mais efetiva a grande quantidade de informação mediante linguagens e estruturas de conhecimento controladas.
Os sistemas de informação são aqueles sistemas nos que deixando o fator tecnológico a um lado, a matéria prima, o produto transportado e armazenado, é a informação em si mesma (García Gutiérrez, 1998). Entretanto, pode ser também aquele departamento encarregado em prover de informação e fazer que esta seja utilizável (Moreiro González, 2005), e também pode ser o centro de documentação especializado em explorar o conhecimento contido em documentos, com o fim de pô-lo ao alcance dos usuários (Codina, 2001).
Estamos de acordo com os autores em que um Sistema de Informação é aquela estrutura integral encarregada de prover informação aos usuários, explorando o máximo conteúdo dos documentos, com o fim de extrair o conhecimento e transportá-lo a outras estruturas. Um Sistema de Informação pode ser a estrutura de uma Biblioteca ou um Centro de Documentação, ou uma plataforma a partir da qual se distribua informação, e que sua estrutura global representa todos estes exemplos.
Nas multinacionais que têm que gerir um grande volume de informação, encontramos uma diferença mais clara entre uma biblioteca, arquivo, centro de documentação, etc. ainda que a gestão dos mesmos seja sob uma mesma direção. Entretanto, nas pequenas e médias empresas não existe uma delimitação nem terminológica conceitual com respeito à denominação de seus arquivos, bibliotecas ou centros de documentação.
Para que o emprego da Informação resulte efetivo à
hora de solucionar um problema e adotar uma posição adequada,
só é possível se foi executado previamente um processo
de análise da informação, no qual se tenha adicionado
um conjunto de valores pertinentes a partir do trabalho intenso que realizam
especialistas treinados no uso das técnicas e destrezas de informação.
Este conjunto de tarefas que os profissionais da informação
realizam para pôr à disposição de seus usuários
ou comunidade a informação é o que denominamos como
Serviço do Sistema de Informação.
2.1. Necessidades de informação das Empresas: fluxos
internos e conhecimento do entorno
A informação é um recurso que requer uma administração
adequada, deve ser explorado para aumentar os benefícios, manter
a competitividade no mercado, ter maiores possibilidades de fazer efetivo
um negócio, descobrir nichos de mercado, e estar preparado frente
às novidades dos competidores. Há uma necessidade de sensibilizar
a empresa em todos seus níveis no aproveitamento da informação
com os recursos que hoje temos como o meio para assegurar-se em certa forma
uma posição estratégica, bem como de constituir-se
numa fonte de geração de vantagens competitivas numa economia
globalizada e mutante (Palop & Vicente, 1999).
Ao mesmo tempo em que esta informação do exterior é absolutamente necessária, igualmente importante são os fluxos internos de informação e a gestão de toda aquela documentação gerada da atividade diária da empresa. São duas as necessidades que sobre os fluxos informativos todo Sistema de Informação bem estruturado tem que canalizar. No entanto, ao longo deste apartado não trataremos as tarefas específicas de vigilância tecnológica e sim nos centraremos mais no fluxo interno da informação ainda que sua origem seja externa.
O fluxo de informação interdepartamental que, finalmente, é canalizado para o Sistema de Informação, resulta fundamental para o correto funcionamento de todas aquelas engrenagens que conformam a estrutura empresarial. Um departamento de recursos humanos não poderá viver isolado do departamento de consultoria ou dos comerciais. Sua fonte de informação, bem como o destino da mesma, é externa a eles. São estruturas que necessariamente devem colaborar em harmonia, entre as que a cultura via "e-mail" para o intercâmbio já é amplamente estendida, bem por comodidade ou por constância dos movimentos que se sucedem; ou outros tipos de software de workflow para definir graficamente processos, comunicar a trabalhadores, documentos, etc. Estes documentos, para a correta gestão dos mesmos e a reutilização do conhecimento gerado num momento dado, com motivo de um projeto, um estudo ou uma análise, etc., devem canalizar-se para o Sistema de Informação.
Consideramos à entidade empresa como uma macro-estrutura, que
a sua vez está formada por um entrelaçado de estruturas médias,
e estas a sua vez por micro-estrutura, onde as estruturas médias
são as unidades departamentais, e as micro-estruturas unidades menores
ou inclusive os próprios indivíduos que dedicam seu labor
profissional a tarefas concretas de acordo com a política do departamento,
e, portanto, da empresa. Estas companhias, ao igual que qualquer organismo
ou instituição, requerem de uns fluxos de informação
que satisfaçam a estas estruturas departamentais.
Figura 1: Fluxo estrutural das Instituições
(Fonte: Os autores)
As empresas estão formadas por unidades, mais ou menos pequenas,
que conformam o entrelaçado total do organismo. Estas estruturas
ou departamentos, cada um com suas características podem encontrar-se
entre as linhas de produção ou negócio, ou bem como
suporte à estrutura global. Entre estas estruturas, e como parte
dos recursos tanto de suporte como de produção, situamos
aos Sistemas de Informação. Esta dupla concepção
do sistema apresenta estes fundamentos:
· É parte de uma corrente produtiva. No momento em que esta informação pode ser potencialmente empregada em forma de conhecimento para sair ao mercado ou enfrentar novas situações, faz parte da corrente produtiva. Para obter esta informação tiveram-se previamente buscas, seleções, aquisições, recapitulações e preparações para ser concebida como um todo. O resultado é um novo documento que passou por um processo de seleção, extração de conteúdos, resumos ou outro tipo de alterações para satisfazer uma necessidade sob os critérios e destrezas do profissional da informação.
As micro-estruturas precisam de um fluxo de informação
ao igual que de um suporte, são necessidades informativas que cobrirá
o Sistema de Informação independentemente da proveniência
da mesma. Mas não todo o fluxo informativo passa diretamente de
um departamento ou micro-estruturas ao sistema de informação
e vice-versa como já avançam anteriormente. Dependendo do
departamento, estabelecem-se uns fluxos de informação entre
eles. Estes fluxos se canalizam para o Sistema de Informação,
com o objetivo de armazenar, custodiar, classificar e ordenar toda a documentação.
Os critérios pelos quais estes documentos serão classificados
e ordenados estará em estrita consonância com as necessidades
departamentais, tendo posteriormente a importância à demanda
informativa ou com sua antecipação. Além de estabelecer
os fluxos informativos, é obrigado o cumprimento a integridade para
garantir a confidenciabilidade da informação, dos ativos,
ou de possíveis clientes. A informação deve ser protegida
contra perda de disponibilidade, uso indevido ou revelação
imprópria.
Podemos concluir que o serviço de um Sistema de Informação
empresarial tem que satisfazer as necessidades das seguintes formas:
· A nível vertical. A participação do Sistema
de Informação dentro da corrente de produção,
um recurso que deve ser explorado estrategicamente. Seus resultados satisfazem
demandas provenientes de níveis de gerenciais e da direção,
já que estes demandam informação sobre o meio, competidores,
e informação que o profissional da informação
deve procurar, selecionar, adquirir, ajustar segundo critérios próprios
e pô-la a disposição de quem se o solicite.
Os objetivos da gestão do conhecimento numa organização ou companhia são promocionar o crescimento do conhecimento, a comunicação do conhecimento e a preservação do conhecimento na organização (Bustelo Ruesta, 2000).
As ontologias são aplicações que vão permitir cumprir com o objetivo que nos propusemos que é criar uma ferramenta para gerar o conhecimento de um Sistema de Informação de empresa no setor de telecomunicações. Pretende-se que o acesso à informação seja mais ágil e pertinente pelo enfoque semântico da aplicação, compartilhar a informação (já não só a nível interno, senão adotando e incorporando informação externa a nossa aplicação), aproveitar o conhecimento já existente e conservar a memória da companhia independentemente dos profissionais que trabalhem nela.
A aplicação da informática em todos os níveis das organizações compreende um fenômeno que tem seus envolvimentos na gestão documentária: a proliferação de bases de dados sobre diferentes aspectos, que em alguns casos estão substituindo aos documentos como suporte de informação valiosa para a organização. Esta tendência, agudiza-se ainda mais num meio e-business no que as relações com os clientes se realizam através de Internet (Bustelo Ruesta, 2000).
Uma das aplicações das ontologias mais comuns que se está
efetivando é no campo do comércio eletrônico, onde
o usuário pode perguntar por produtos, modelos, preços contra
a ontologia. Os exemplos reais mais significativos de uma ontologia aplicada
no comércio eletrônico e que tem haver com nossa área
e correlatas na questão de compra de venda de produtos é
o caso da livraria virtual Amazon e Ebay. A ferramenta que gere as perguntas
que faz o usuário sobre os produtos de interesse é uma ontologia.
3. Ontologia para um sistema de informação
A necessidade de capturar o domínio e de dispor de fontes de
conhecimento com termos bem definidos levou muitos pesquisadores a desenvolver
métodos para suportar ontologias. As principais vias nas que se
pesquisou são três:
· Desenvolvimento de ferramentas para suportar o processo de construção (engenharia) de ontologias;
· Desenvolvimento e posta em marcha de mecanismos de inferência para grandes ontologias.
Dentro de um processo no quais ferramentas como as taxonomias se evolucionaram para formas mais complexas como os tesauros, e estes agora têm a necessidade de evoluir para sistemas mais complexos como as ontologias, capazes de responder a perguntas abarcando uma quantidade superior de informação e com um ônus semântico mais relevante. De maneira que as ontologias permitem a inter-atuação entre o ser humano e a máquina; pois à proposta de perguntar a máquina tratará de responder contra uma ontologia.
As ontologias são instrumentos que na Sociedade do Conhecimento
aplicam os tecnólogos, arquitetos da informação e
profissionais da informação como solução à
sobre-abundancia de informação, para a organização
e gestão do conhecimento em qualquer Sistema de Informação.
O desenvolvimento de uma ontologia com linguagem OWL numa empresa do setor
das telecomunicações permitirá possuir o domínio
conceitual no que se emoldura sua documentação, solucionará
problemas que apresentam os gestores de bases de dados tradicionais, permitirá
a interoperabilidade da informação, bem como processar o
conteúdo dos documentos e responder a perguntas mediante deduções
lógicas.
3.1. Evolução das taxonomias - tesauros - ontologias
Para tratar de compreender a realidade na que vive, o ser humano tem
a qualidade e necessidade de ordenar e classificar quanto lhe rodeia, para
o que criou ao longo da história métodos e metodologias de
classificação.
O termo taxonomia foi empregado por primeira vez pelo biólogo suíço Augustin Pyrame de Candolle a começos do século XIX, ainda que foi o médico sueco Carolus Linnaeus o expoente mais relevante não só da taxonomia senão da biologia sistemática em general. Linneo desenvolveu uma nomenclatura binominal para identificar de maneira unívoca às espécies, solvendo assim os problemas de comunicação produzidos pela variedade de nomes locais. Ao mesmo tempo, Linneo propôs um esquema hierárquico de classificação, onde as espécies muito afins se agrupavam num mesmo gênero, os gêneros em famílias, e assim sucessivamente em ordens, classes, fios e espécies, proporcionando uma imagem estruturada (como a árvore de Porfírio e a metafísica clássica) da relação entre espécies [1].
Mas o que sentou as bases da taxonomia foi Durán de Gros, estabelecendo
nela:
· Ordem de composição, onde só se admitem objetos concretos para formar os táxons, mediante uma relação do todo à parte e da parte ao todo;
· Ordem de genealogia, onde se considera a arvore hierárquica da estrutura;
· Ordem de evolução, onde se considera os táxons segundo sua origem.
De todas as definições que existente do conceito taxonomia,
devemos atender à proposta por autor J. Sowa, quem diz que o conceito
vem do grego táxis-disposição e nomia-lei. Literalmente
uma taxonomia poderia ser uma disposição de termos (táxons)
baseada em qualquer tipo de lei ou princípio.
O princípio mais comum é o de generalização, em cujo caso a taxonomia teria uma geração hierárquica, com freqüência telefonema de submissão hierárquica. As taxonomias são empregadas para armazenar a informação em níveis apropriados de generalidade e fazê-la disponível automaticamente para conceitos mais específicos através de mecanismos de herança. Muitos conceitos gerais tendem a subsumir conceitos mais específicos e, estes a sua vez, herdam a informação de seus subsumidores. Nos sistemas nos que os conceitos estão formalmente estruturados, a subsunção dos conceitos pode ser inferida em muitas ocasiões das estruturas dos conceitos. Esta classificação para assimilar uma nova descrição numa taxonomia de conceitos existentes permitiu "linkar" diretamente a seus mais específicos subsumidores e os conceitos mais gerais que voltam a quem são subsumidos (Sowa, 1991). Nas redes semânticas tradicionais, as taxonomias conceituais estão compostas por relações de subsunção afirmadas (Sowa, 1991).
Com a chegada das tecnologias informáticas se produziu uma mudança de mentalidade, pois graças a elas se podem atingir níveis de abstrações maiores e o conhecimento pode ser organizado de forma mais flexível. A informação se fez informatizável e processável.
Com posterioridade às taxonomias começaram a empregar-se os tesauros, mas não foram uma solução definitiva já que a riqueza e capacidade de inovação constante das linguagens nos que se encontram expressados os documentos sobre os que trabalham, produz em ocasiões o silêncio ou o ruído, ou inclusive uma pertinência à hora da seleção de documentos (Moreiro González, 2004).
Segundo a Unesco, um tesauro é uma ferramenta de controle terminológico empregada para traduzir linguagens restringidas a linguagem natural empregado nos documentos e utilizado pelos indicadores e usuários. Trata-se de vocabulários controlados e dinâmicos de termos que guardam entre si relações semânticas e genéricas, e se aplicam a um campo específico do conhecimento.
Trata-se, pois, de uma lista associada de descritores formada com as possibilidades de representação dos conceitos mais gerais (macro-estruturais) num domínio concreto. Os universais que aparecem no texto encontram sua intenção nas macroestruturas, cuja conformação deve entender-se como uma abstração das propriedades genéricas. Antes de atingir-se a abstração se passou pelo processo de formação dos conceitos ou memória semântica, aos que outorgam sua forma lingüística as palavras que dão nome aos conceitos.
Estes instrumentos informativos de recuperação baseados em vocabulários controlados e nos que se definiram relações entre os termos devem ser submetidos a revisões para assegurar sua coerência ante a atualização do vocabulário e suas relações.
O uso dos tesauros na recuperação de informação é muito estendido, os padrões que o atestam são: ISO 2788:1986 e ISO 5964:1985 [2].
Os tesauros propõem dois inconvenientes ao estar suas estruturas
definidas para recuperações que contenham relações
estáticas, de maneira que se apresentam:
· A criação, manutenção e funcionamento, supõem um custo elevado, evitáveis só com a automatização ou semi automatização, ainda que existam muitas dificuldades para fazê-lo, devido à riqueza das estruturas semânticas dos textos (Moreiro González, 2004).
Este tipo de tesauro evoluiu para o tesauro conceitual que exigia amplamente a automatização de sua criação e gestão. Os tesauros conceituais são compilados de forma pós coordenada a partir da sub-linguagem de uma área específica do conhecimento, em cuja utilização prima a recuperação (Schmitz-Esser, 1991). Este tipo de tesauro permite diferenciar os termos de utilização real daqueles que não são usados; contribuem notas definitivas que aclarem as possíveis dúvidas de uso; glosam todas as palavras "não vazias" existentes nas bases de dados; raciocinam as equivalências existentes entre termos; contêm numerosas relações associativas entre descritores e não descritores; e consideram inclusive os termos coloquiais, também as variações e truncamentos dos termos reconhecidos (Moreiro González, 2004).
A denominação dos tesauros conceituais prove de sua fundamentação teórica arredor da noção de matéria, com o que Maniez propôs um modelo de tesauro de relações associativas, que uni termos e conceitos reais por sua similitude de sentido no contexto específico do usuário (Maniez, 1993).
Nesta linha, Dewèze propôs uma rede semântica conceitual onde os termos mais genéricos de uma faceta determinante encaminham para os mais específicos e vice-versa (navegação vertical), que a sua vez permite a transição de uma classe para outra e de um campo da ciência para outra mediante as relações associativas (navegação horizontal usando nodos polihierárquicos), e inclusive a navegação transversal da rede desde uma interseção de árvores (Dewèze, 1981).
Já que as possibilidades dos tesauros ante ou em grande volume informativo em ocasiões não satisfazem as necessidades dos usuários, começa-se a procurar outros esquemas de representação e recuperação da informação. Exemplos destes novos métodos são os mapas conceituais, topic maps, etc., mas faremos especial incidência as ontologias.
Como ao longo do texto iremos vendo que as ontologias são as ferramentas por excelência da Web Semântica. Surge como resposta à sobre-abundancia de informação, ao outorgar na representação e recuperação dos documentos o ônus semântico que possuem, aumentam a expressividade, pertinência e eficácia da representação, são ferramentas capazes de realizar inferências e de possibilitar a interatuação entre o ser humano e a máquina mediante o processamento automático dos documentos.
Ao igual que ocorre na construção de tesauros, para desenvolver
as ontologias, os diversos âmbitos de especialização
têm que definir os conceitos de sua área. As taxonomias e
os tesauros podem atuar como núcleo sobre o qual se construirá
a ontologia, em conseqüência disporemos de um vocabulário
controlado com relações típicas das taxonomias e tesauros,
às que se as adicionará outro tipo de propriedades, relações
e inferências.
3.2. É o fim dos tesauros ou simplesmente uma evolução?
Habitualmente se escuta em alguns meios que os tesauros chegaram a
seu fim, e que estes serão substituídos por outro tipo de
ferramentas como as ontologias. No entanto, não cremos que se trate
de uma evolução a algo mais complicado do que deixa completamente
obsoleto o anterior, de fato, uma das metodologias para a construção
de uma ontologia é partindo da construção de um tesauro
(Fischer, 2004).
As necessidades mudam à medida que a informação aumenta e esta tem de ser gerida, a recuperação de informação cada vez é menos precisa devido a este grande volume informativo e à carência de semântica por parte dos motores de busca. Os antigos métodos de indexação não são suficientemente potentes para fazer com a mesma precisão as buscas que anteriormente realizavam. Mas é óbvio, que cada centro, biblioteca, arquivo ou sistema de informação tem suas necessidades. Os processos de gestão documentária não serão os mesmos numa multinacional, que numa grande empresa ou que nas pequenas e médias empresas, o que também não quer dizer que uma pequena empresa não precise de um bom sistema de gestão documentário.
Bem como as taxonomias fazem parte formal na Ciência da Informação, também os tesauros fazem, e pouco a pouco, segundo as necessidades informativas as ontologias vão se impondo, as quais em alguns âmbitos já são o instrumento com o que se organiza e gere o conhecimento. A parte da conceitualização das ontologias, isto é, o vocabulário de termos controlados é equivalente ao que já conhecemos como tesauro (Moreiro González, 2004). Os tesauros com suas relações de hierarquia, equivalência e associação, podem fazer de núcleo sobre o que se construa a ontologia.
As ontologias são a evolução lógica que
se deu desde as taxonomias e seu passo aos tesauros. Trata-se de aplicações
ou ferramentas com um alto caráter utilitário, reutilizável
(no sentido da reutilização do conhecimento), e os três
servem como métodos de classificação do conhecimento,
ainda que estas últimas, têm um potencial muito maior do que
o da classificação, sendo seu principal objetivo o intercâmbio
do conhecimento e sua representação.
3.3. Definição e marco conceitual do termo "Ontologia"
O termo ontologia foi e está sendo empregado em muitas áreas
do conhecimento: em Filosofia e mais concretamente em Metafísica,
também na Engenharia de Informática no campo da Inteligência
Artificial, bem como na Ciência da Informação por gestores
do conhecimento e profissionais da informação (Staab &
Studer, 2004).
A característica comum do emprego do conceito em todas estas áreas de conhecimento é que o termo ontologia faz referência aos conceitos de um domínio e as relações que se estabelecem entre eles. Dependendo da área no que se estejam empregando as ontologias, surgirão características próprias a cada uma delas.
A seguir exporemos algumas das definições mais relevantes
para cada área do conhecimento onde às que afeta o uso deste
termo, para chegar finalmente ao objetivo que nos ocupa, define a ontologia
como a ferramenta adequada para a gestão do conhecimento em sistemas
integrais de informação para empresas do setor de telecomunicações.
3.3.1. Conceito filosófico
A ontologia, enquanto ciência do ente ("ontos": o que é)
começou sendo abarcada pela metafísica (parte da filosofia
que versa sobre o ser). Segundo o Dicionário da Real Academia Espanhola,
ontologia é a parte da metafísica que trata do ser em geral
e de suas propriedades transcendentais.
Os filósofos antigos já realizavam estudos sobre a problemática ontológico-epistemológica da filosofia grega como Platón e Aristóteles, Santo Tomás de Aquino, Scoto ou Campanella durante o Renascimento, e continuando com Descartes, Kant, Hegel, Leibniz, Spinoza, até chegar a nossos contemporâneos Russell ou Heidegger.
Segundo a Enciclopédia da Cultura Espanhola, o termino ontologia foi cunhado por Johannes Clauberg, que em 1.647 latinizou o vocábulo grego [3].
Voltando à filosofia grega aristotélica, as maneiras do ser se correspondem com as dez categorias ou formas de unir um predicado com um sujeito [4], como (a) a substância ou essência; (b) a quantidade; (c) a qualidade; (d) a relação; (e) o lugar; (f) o tempo; (g) a situação; (h) a posse; (i) a ação; (j) e a paixão.
Estas deduções são realizadas com o método do conhecimento, isto é, são as relações entre um sujeito e seu predicado com independência da experiência. O marco empírico será a principal diferença do termo ontologia na área da Filosofia-metafísica, e a Ciência da Informação ou Engenharia Informática.
Posteriormente Leibniz as reduziu estas relações a cinco categorias (Moreiro González, Morato, Sanchez & Rodrígues Barquím, 2005), como (a) a substância; (b) a quantidade; (c) a qualidade; (d) a relação; e (e) a ação ou paixão.
Enquanto Kant as limitou a quatro (Moreiro González, Morato, Sanchez & Rodrígues Barquím, 2005), como (a) a quantidade; (b) a qualidade; (c) a relação; e (d) a modalidade.
Ramón Llull (lógica nova) propôs as dez regras gerais,
onde estão implícitas a qualquer fato comunicativo (Decâmetro
hermenêutico). Nelas estão as razões de associar termos
como estratégia empregada também para relacionar os descritores
nos tesauros (Moreiro González, Morato, Sanchez & Rodrígues
Barquím, 2005):
Segundo Roberto Poli [5] também da
mão da filosofia -investigador de ontologias e de análise
cognitiva- diz que uma ontologia não é um catálogo
de palavras, nem uma taxonomia, nem uma terminologia, nem uma lista de
objetos. É um marco geral, uma estrutura onde um catálogo,
uma taxonomia, pode mostrar uma organização coerente. Fala
de cinco níveis ontológicos (mundo físico "inanimado",
físico "animado", psicológico, social e de idéias),
como (a) o mundo físico inanimado; (b) o mundo físico animado;
(c) o mundo psicológico; (d) o mundo social; e (e) o mundo de idéias.
Para nós, os sistemas de representação do conhecimento
como os tesauros ou as ontologias têm implícitos em sua construção
as relações mencionadas anteriormente por Aristóteles,
Leibniz, Kant ou Ramón Llul. Para outorgar a estes sistemas da semântica
que carecem, pretende-se tratar a informação desde estas
categorias, estabelecendo as propriedades e realizando as inferências
nas classes que respondem a questões de quantidade, qualidade, relação,
posse, etc.
3.3.2. Conceito informático
Foi partir dos anos 1980 quando começou a empregar-se o termo
Ontologia na área da Engenharia Informática, e mais concretamente,
na Inteligência Artificial.
Uma ontologia consiste num conjunto de axiomas, relações de subsunção entre classes e propriedades. Os axiomas fazem possíveis as afirmações e as subsunções fazem possíveis que se estabeleçam as equivalências e as classes (Staab & Studer, 2004).
OWL é a linguagem pelo qual se padroniza e se fazem viáveis as ontologias.
Lenat e Guha (1990) utilizam as ontologias para capturar conhecimento humano retirado do sentido comum. A maior parte do trabalho na área da representação do conhecimento, concerniu às tecnicidades que relacionam os predicados com outros formalismos, e com esquemas para o raciocínio. Sempre teve uma aversão a direcionar os problemas do conhecimento com o conteúdo. Os pesquisadores na área da Inteligência Artificial, consideraram soluções que funcionem para casos determinados, mas há questões bem mais profundas por solucionar, como as categorias ontológicas para representar o universo, como relacioná-las, que são as coisas mais importantes para os humanos sobre os objetos sólidos.
As ontologias têm uma função similar aos esquemas das bases de dados, provêem de semântica processável pelas máquinas, das fontes de informação ao longo das coleções de termos e suas relações (Lacy, 2005). Estamos de acordo com esta definição, e como profissionais da informação, somos responsáveis em certa medida de fazer que esta informação contida nos documentos, seja processável pelos agentes inteligentes.
Da Universidade de Stanford, através de Thomas R. Gruber do departamento Knowledge Systems Laboratory, prove talvéz a definição que mais se ajusta à realidade que queremos expressar. O autor, já em 1993, fazia referência a permitir ou habilitar um sistema que possibilite utilizar o conhecimento reutilizável das bibliotecas e outros serviços para ser invocados na rede mediante o esforço do desenvolvimento das ontologias.
De maneira que podemos considerar uma ontologia como a especificação
explícita de uma conceitualização. Para os sistemas
de Inteligência Artificial, o que existe se pode representar; e quando
um domínio do conhecimento é representado, este é
chamado universo do discurso. Gruber nesta definição, ainda
que do mundo da engenharia informática, é o que mais se acerca
ao conceito que temos em mente. Para nós, uma ontologia será
a ferramenta que nos permitirá representar as classes, as relações
entre as mesmas, as propriedades ou funções, as inferências,
etc. Trata-se de fazer que a informação contida nos documentos
seja processada automaticamente pelos agentes inteligentes mediante o emprego
de teorias lógicas.
Uma ontologia para compartilhar dados bibliográficos pode ter a mesma finalidade que um OPAC de uma biblioteca, ou a finalidade das referências bibliográficas que encontramos ao final de um livro, já que a intenção é a de compartilhar e transmitir com outros leitores ou usuários o conhecimento, além de reconhecer a autoria. A diferença, é que a ontologia melhorará substancialmente esta representação, se poderá compartilhar de forma singela eletronicamente facilitando as transações de dados entre bases de dados bibliográficas uniformizando a informação, etc. Como toda ontologia descreve uma conceitualização e suas relações, a visão do mundo desde uma perspectiva particular, nesta ontologia o mundo incluiu a informação. A bibliografia está feita de referências a qual "contém", a informação necessária para identificar e recuperar uma publicação; uma referência contém dados sobre publicações, as referências não são as publicações por si mesmas; os documentos são coisas criadas por autores que podem ler, ver, escutar; os livros e os jornais são documentos; os documentos são criados por autores, que são pessoas ou agentes; os documentos são publicados por editoriais e as datas de publicação, são pontos no tempo; os autores e as editoriais têm nomes, que são seqüências de caracteres (Gruber, 1993).
Entendemos que uma ontologia é uma especificação formalmente descrita de um domínio de interesse, uma coleção de termos que são legíveis (processáveis) pelas máquinas entre os que estão expressas as relações entre os mesmos. Um domínio pode ser modelado em classes, conceitos, entre os quais vão especificar os diferentes tipos de relações. Isto compõe uma ontologia, a qual descreve o domínio (modelo mental) da realidade que queríamos representar.
Nesta área, os cientistas fazem referência ao termo nas
descrições formais de domínios existentes. Desenvolvimento
de ontologias para a busca e reutilização do conhecimento,
aqui é onde os profissionais da informação têm
de tomar parte conjuntamente.
3.3.3. Conceito na Ciência da Informação
Para Javier García Marcos, o termo está composto por
"onto" + "logos" e é a descrição sistemática
das entidades e suas modalidades, e das regras que permitem descrever um
domínio específico de acordo com as entidades e processos
que permitem descrever "todas" as coisas e processos (Curras, 2005).
Gilchrist e Mahon (2004) dizem que as ontologias surgiram da adaptação do trabalho dos filósofos, por gente ocupada em tarefas de inteligência artificial. Desenvolveram-se por um aumento de documentos internos e externos, a grande capacidade de informação disponível e o baixo custo dos dispositivos eletrônicos.
Segundo García Jiménez (2002), se trata de construções que estruturam conteúdos explícitos e que são capazes de codificar as regras implícitas de uma parte da realidade, ainda que trabalhem com declarações explícitas independentes do fim do domínio da aplicação. Estes modos formalizados de representação do conhecimento estão destinados à recuperação; e cada termo e cada relação se definem formalmente. O que marca sua diferença com os atuais tesauros é a presença de uma maior variedade de relações entre conceitos, procedentes além do modelo conceitual existente no domínio formalizado. Sua função mais importante é a de armazenar conhecimento de forma que possa ser utilizado por sistemas automáticos capazes de realizar deduções a partir da variedade de relações entre conceitos.
As ontologias são instrumentos claramente conectados com os agentes experientes em seu objetivo de filtrar informação e que podem derivar em tesauros. As ontologias são reutilizáveis e têm a possibilidade de trabalho em sistemas heterogêneos ao descrever formalmente objetos no mundo, suas propriedades e as relações entre estes objetos forma um alto nível de especificação e flexibilidade.
Para as definições de um vocabulário de representação coincidem com os tesauros e com as classificações em sua capacidade de representar o conteúdo de um documento através da abstração e das relações entre conceitos. Para construí-la se pode ir a vários métodos: a investigação das propriedades de conceitos ou de suas relações, o uso de esquemas de conceitos semânticos ao objeto de agrupar entidades e relações, e o trabalho com estruturas conceituais assimiláveis às redes hierárquicas de trabalho.
Podem ser não lingüísticas (para a criação de agentes inteligentes) e lingüísticas, caso no qual estão vinculadas a aspectos gramáticos, semânticos e sintáticos. O objetivo último é o de melhorar a representação da informação e os sistemas de recuperação de informação.
De entre todas as definições, queremos destacar a de Moreiro González (2004), já que reúne as características do que entendemos por ontologia. As ontologias são partes da metafísica que trata o ser, da existência. Esta concepção se translada ao campo da Inteligência Artificial, desde a perspectiva que todo o que existe pode representar-se. O conhecimento ao ser informação da informação ou informação rica em conceitos, é possível sua representação. Um conjunto de conhecimento representado formalmente se fundamenta na conceitualização dos objetos e entidades que existem nas diferentes áreas de interesse e das relações que existem entre eles. As ontologias se aplicam às categorizações dos elementos, são especificações explícitas de conceitualizações que incluem vocabulários de termos e que contêm ou estabelecem suas propriedades e relações entre eles.
Quando mencionamos ou escutamos a palavra ontologia, pensamos no conceito
filosófico, e quando não é assim, costuma-se associar
com a informática. As taxonomias foram patrimônio tanto de
documentalistas ou profissionais da informação como de informáticos.
Com os tesauros ocorreu o mesmo, ainda que pareça que estes tiveram
maior desenvolvimento e implementação da mão dos profissionais
da informação que no campo da informática (apesar
da interdisciplinaridade implícita deste tipo de ferramentas). A
palavra ontologia assusta, considera-se como algo estranho, com um grau
de abstração muito grande, quase tão grande como para
não ser entendido pelos documentalistas, e como se fosse patrimônio
dos informáticos. Mas consideramos que não se trata de algo
próprio de uma ciência ou outra, ambas ciências têm
de cooperar e contribuir seus conhecimentos sem dar-se as costas como ocorreu
em algumas ocasiões. Certamente para poder entender, desenhar ou
desenvolver uma ontologia é necessário um alto grau de abstração,
mas alcançável por profissionais de nossa área.
3.4. Características das ontologias.
· Propriedades ou slots: atributo ou qualidade de alguém ou algo (Real Academia Espanhola). É o pilar ontológico mediante o qual o conceito representado por uma classe, tem suas propriedades, atributos, valores, etc. Em termos informáticos, é uma associação binária que relata um objeto (instância) a um valor. Em termos informáticos, são similares aos métodos na Programação Orientada a Objetos que provêem valores de class objects ou campos de uma tabela de um RDBMS (Lacy, 2005). O valor pode ser desde uma data, medida, nome, preço e etc. Seguindo com nossa ontologia, propriedades de nossas classes poderia ser "cliente", "data", "modelo", "preço", etc. Uma propriedade de um projeto pode ser que este tem "2 clientes", que implica uns "custos" e "benefícios";
· Instâncias: Trata-se da representação real das classes no domínio, isto é, o indivíduo, objeto ou "coisa" em si. São as representações tanto físicas como virtuais dos objetos, mais concretamente, trata-se das instâncias de uma classe. É muito fácil confundir uma instância com uma classe, já que uma instância pode ser ambas terminologias (isto supomos que em relação com o domínio ou o conjunto global que estamos representando). Seguindo com nosso exemplo ontológico, uma instância pode ser um modelo determinado de um telefone móvel, por exemplo, "motorola 320".
3.4.2. Tipos de relações semânticas.
As relações entre as propriedades, classes e instâncias,
é o mais importante numa ontologia.
Figura 2: Relações entre classes, propriedades e instâncias
As relações semânticas entre as classes, propriedades
e instâncias podem ser de:
(2) Antonímia: Como seu nome indica, é o contrário ao que descrevemos no apartado de sinonímia. Com freqüência quando estamos classificando, procurando, recuperando informação num domínio, queremos perguntar pelo contrário ao resultado ou conceito do que dispomos. Este tipo de relação vai ajudar-nos também na construção e entendimento de muito dos conceitos de nossa ontologia, porque vai determinar casos nos que não se pode estabelecer uma relação, uma instância pode servir para muitas classes, mas para muitas outras não. Ao igual que no caso da sinonímia, as relações de antonímia se poderá estabelecer entre duas classes, duas propriedades, ou duas instâncias.
(3) Hiponímia: É o tipo de relação pela
qual indicaremos se o termo é específico de outro ou hierárquico.
É aqui onde também encontramos uma relação
muito forte com os tesauros. É a evolução lógica
dos tesauros, e a partir destes podemos construir uma ferramenta ou aplicação
mais complexa, com um maior ônus semântica, capaz de manejar
ou de dar significado mais preciso diante de volumes maiores de informação.
A herança, técnicas de subsunção, de generalização
ou especificação.
(a) Meronimia: A relação de menorimia é aquela
pelas quais umas classes, propriedades, ou instâncias, fazem parte
de outras. Isto é, se pensássemos em comida, a salada cessar
seria um hipônimo de salada, mas a sua vez, os ingredientes (meronimia)
são as cebolas, o pão torrado, o frango, a alface. A relação
entre cada ingrediente e o que conformam (a salada cessar) é uma
relação de holonimia. Desde a salada aos seus ingredientes;
(b) Holonimia: É a relação inversa, a que é
estável desde os ingredientes ao que compõem diferente da
meronimia que na verdade é uma ação transitiva (Lacy,
2005).
· Ontologias de domínio: que modelam o conteúdo das fontes de informação;
· Ontologias de empresa: que modelam o contexto de uma organização, processo de trabalho, etc.
Seguindo esta classificação em três tipos de
ontologias, consideramos que um bom sistema de informação
empresarial deve estudar a possibilidade de construir estas três
tipologias, já que, necessariamente estarão inter-relacionadas.
Gruber (1993) expõe alguns critérios necessários
para o desenho de uma ontologia determinando cinco pontos fundamentais:
2. Coerência: faz referência às conexões, relações que se estabeleçam entre os conceitos representados nas ontologias, a lógica, conseqüência e consistência dos axiomas. Se uma sentença que pode ser inferida de um axioma contradiz uma definição ou exemplo dado informalmente, a ontologia é incoerente.
3. Extensível: a ontologia deve ser desenhada para poder antecipar-se aos usos do vocabulário que se empregará ou compartilhará. Deve oferecer uma gama conceitual para as possíveis questões que possam derivar-se num futuro. Ademais, estas definições devem servir para um futuro independentemente do contexto, e se adicionam novas definições deveriam permanecer sem revisar as anteriores.
4. Tendência de codificação mínima: a conceitualização se realiza ao nível de conhecimento (knowledge level) sem depender de um nível exato de codificação concreta. Isto é, a linguagem que se utilize para a codificação da conceitualização é independente, é uma eleição que pode ir em função das necessidades da ontologia, da eleição do desenhista, etc.
5. Compromisso mínimo ontológico: ainda que possa resultar-nos contraditório, uma ontologia deve evitar fazer muitas afirmações sobre o mundo que estamos modelando, já que, no futuro, esta deverá permitir aos autores que desejem empregá-la ou modificá-la realizar as instâncias e especializá-la na área conceitual que desejem.
A ontologia que pretendemos mostrar respeita estes cinco critérios
básicos. Com respeito à clareza pode servir em qualquer sistema
de informação empresarial do setor das telecomunicações,
já que não determinamos nenhuma empresa em concreto. É
uma ontologia que poderia aplicar-se a qualquer empresa deste setor. Pretendemos
no máximo que seja o mais coerente e consistente possível
evitando as contradições nas inferências e nos axiomas.
Este é um dos aspectos que há que cuidar especialmente em
fases de construção mais avançadas, já que
podem dar-se inferências como que contradigam algum axioma. Deve
antecipar-se aos usos, é por isso pelo que se prevêem situações
ou possíveis respostas à que deverá submeter.
Um dos pontos básicos na construção das ontologias
é contar com a colaboração de experientes na matéria
(neste caso, engenheiros em telecomunicações) que possam
relatar os problemas com os que topam freqüentemente (Gómez
Pérez, 2004). Isto posicionará ao sistema de informação
em situação vantajosa no caso que se dêem ditos problemas.
Um exemplo onde se reflete este critério é nas perguntas
que o ser humano lança contra a ontologia. Os conceitos que se representarão
na ontologia neste caso foram eleitos segundo critérios dos autores,
mas seria vital para elaborar uma ferramenta completa contar com estudos
de usuários e das necessidades da empresa em concreto, isto é,
o estudo de caso real. Finalmente, com respeito ao compromisso mínimo
ontológico, caberia reafirmar o que num princípio comentávamos
sobre a clareza. Devemos propor-nos a possibilidade de que esta ontologia
possa ser reutilizada em parte ou em sua totalidade por outra entidade
ou pessoa, com o que terá que ser coerente com os axiomas que se
realizem permitindo a modificação.
4.1. Definição do domínio, do objetivo e dos
usuários.
As ontologias ficam restringidas a um domínio concreto. Nossa
investigação pretende criar uma ontologia para o domínio
das Telecomunicações num Sistema de Informação
de Empresa Privada. Ao igual que o domínio fica restringido, também
os usuários ficam. Este primeiro desenho ontológico pretende-se
que seja empregado pelo profissional da informação que tenha
que responder às necessidades informativas de seus usuários.
A definição das necessidades dos usuários será o requisito prévio para a construção da ontologia (Lacy, 2005). Se conseguirmos capturar todas as necessidades do meio de uma empresa do setor das telecomunicações, estaremos dando um passo na construção do domínio que desejamos. Isto nos proporcionará a guia para o desenho de nossa ontologia, a possibilidade de reutilizar conhecimento existente (tesauros, taxonomias, inclusive outras ontologias existentes) e os casos de uso.
O objetivo de nosso modelo é criar exemplos ontológicos que satisfaçam as necessidades informativas da empresa, utilizando características de ontologias informativas, ontologias de domínio, e ontologias de empresa.
Criamos um pequeno exemplo de ontologias informativas, já que,
estamos descrevendo tipos de fontes de informação, tipologia
e propriedades mediante aos slots. Como podemos observar a estrutura corresponde-se
com a parte das classes que tratam a Documentação [6].
A estrutura está formada por:
Como exemplo de ontologia de domínio sobre o conteúdo
de fontes de informação, representado com a modelação
de uma pequena parte do Tesauro de Redes de Computadores (Martínez
Méndez & García Gómez, 2003) - "Arquitetura e
desenho de Redes" - e um fragmento da classificação de produtos
genéricos do United Nations Standard Products and Services Code
- UNSPSC (Telecomunicações e radiodifusão de tecnologia
de comunicação), utilizamos os tipos de ontologia anteriores,
modelando o possível contexto de uma organização,
seguindo a representação de uma estrutura departamental [7],
através dos projetos que numa empresa se podem levar a cabo.
Parte do Tesauro de Redes de Computadores retirado da fonte primária
no processo e que pode ser utilizado em um projeto real de ontologia para
o setor em questão:
O exemplo inicial da arquitetura de rede local pode ser visto como
uma classe dentro do fragmento 2, 3 e 4.
Em relação ao código de classificação
dos produtos no setor de telecomunicações e radiodifusão
(UNSPSC) retiramos uma parte da taxonomia da família 43000000 para
melhor ser visualizada sua usabilidade:
Este modelo estrutural do UNSPSC é uma classificação
internacional com o objetivo de outorgar padrões que facilitem a
comunicação entre distribuidores, clientes e fabricantes
e para melhor visualização estruturarmos uma hierarquia dentro
da ontologia proposta.
A pretensão objetiva de construir está ontologia que está configuração possa ser capaz de interagir com o usuário respondendo a perguntas. Segundo Sure, Angele y Staab (2003), para definir as características para uma ontologia, são importantes as CQ, Competency Questions, já que cada CQ define uma pergunta que a ontologia deveria ser capaz de responder e definir características explícitas para nossa ontologia. O lógico é que estas CQ estejam retiradas de entrevistas com especialistas sobre o tema e que possam ajudar a estruturar o domínio do conhecimento. Pode ser de grande ajuda à hora de fazer um desenho inicial de nossa ontologia. Mas temos de basear-nos em que cada classificação de cada CQ, contém informação valoráveis sobre o domínio da ontologia, que retiramos conceitos relevantes e de grande relacionamento.
Diante da pergunta "Que projeto tem gerado mais de 60.000€ de ingressos?" a ontologia responde de acordo a: A definição de "Ingressos" como uma propriedade que se corresponde com classes e instâncias (Fragmento 1). A propriedade se corresponde com a subclasse "Consultoria" e esta a sua vez com a classe "Projetos". Em respeito às instâncias, se correspondem com a propriedade pelo que se explicitam os ingressos gerados pelos projetos reais que se tem levado a cabo na empresa (Fragmento 2, 3 y 4). A ferramenta seleciona aqueles projetos cuja propriedade ingressos é superior a 60.000€ e os extrai como respostas à pergunta. Em seguida iremos visualizar a disposição dos códigos dentro da ontologia.
Fragmento 1:
Fragmento 2:
Fragmento 3:
Fragmento 4:
Uma vez que está feita a descrição semi-formal
da ontologia, o seguinte passo é a formalização de
fazê-la compreensível e processável pela máquina.
A reutilização do conhecimento neste ponto é vital. Como vimos indicando, reutilizaremos o conhecimento representado em taxonomias ou tesauros, e integrá-los semanticamente num modelo de inferência.
Segundo pesquisadores do National Cancer Institute - NCI (Fischer, 2005), um dos passos mais importantes para transformar o tesauro numa ontologia é representar conceitos e suas conexões de uma forma processável pelas máquinas. Na ontologia que estamos propondo todos os conceitos se lhe dá um descritor formal e as relações entre eles são formalizadas na base da linguagem da ontologia.
Nós representamos os conceitos através das classes e suas relações mediante as propriedades ou slots (e suas heranças) e inferências.
A parte da ontologia correspondente a domínio informativo (documentação)
e de empresa (Projetos), realizaram-se de acordo à experiência
e conhecimento dos autores adquirido e desenvolvido na empresa privada.
4.2. Metodologia para a avaliação de nossa aplicação
Para avaliar nossa aplicação, estimamos necessário
fazê-lo atendendo a duas questões:
- Avaliação da ontologia: consistência [8],
precisão conceitual de acordo com o domínio, concisão.
- Avaliação da satisfação dos usuários:
satisfação da comunidade à que a ontologia responde,
independentemente de que o uso seja direto - emprego da ontologia por uma
ampla comunidade de usuários - ou indireto através do serviço
de sistema de informação empresarial.
4.2.1. Avaliação da ontologia
Ao igual que com outras aplicações ou projetos que se
leva a cabo, a ontologia deve ser avaliada. Esta deve passar por uma avaliação
de seus conteúdos, sobretudo se pode ser reutilizada ou empregada
em outro contexto.
Uma ontologia bem avaliada, não garante a ausência de problemas, mas fará seu uso mais seguro (Gómez-Pérez, 2004). Segundo os autores, os primeiros trabalhos em avaliação de conteúdos começaram em 1994, incrementando-se a partir de 2001 à medida que aumentava o interesse pela engenharia de ontologias. A avaliação de uma ontologia supõe emitir um juízo do conteúdo da ontologia em relação às necessidades, e as CQ [9] ao longo das diferentes fases de construção e manutenção da ferramenta. Os aspectos nos que teria que prestar especial interesse, são as definições e os axiomas, definições importadas (se as tivesse) e definições inferidas a partir de outras.
Outro dos aspectos avaliadores se refere à verificação, isto é, a construção correta da ontologia e a aplicação real.
O principal lucro na avaliação viria dado pela validação da ontologia, o que supõe que o modelo do mundo real, que conhecemos e que existe, está representado corretamente com o mundo modelado formalmente (Gómez-Pérez, 2004).
Entre as experiências na avaliação de ontologias,
destacamos a metodologia OntoClean, baseada em noções
de filosofia. Faz uma limpeza nas taxonomias e se aplicou para limpar o
upper
level de WordNet. De acordo a esta metodologia, há 4 noções
ontológicas fundamentais: rigidez, identidade, unidade e dependência
(Sure, Angele e Staab, 2005).
4.2.2. Avaliação da satisfação do serviço
prestado pelo sistema de informação
Propomos o método relatado por Saracevic e Kantor (1997a e 1997b),
que trata de um método para avaliar e calcular o valor da informação,
que nós transladamos ao nosso sistema de informação
empresarial, e mais concretamente a ontologia. Segundo Saracevic e Kantor
há três níveis aos que se atende para executar avaliações
de serviços de um sistema de informação. Transladando-o
a nossa estrutura empresarial, o serviço de um sistema de informação
para que possa oferecer as companhias melhor confiabilidade deve atender
a três níveis básicos:
· Nível Institucional/Organizativo: se corresponde com o valor que estimam os organismos ou instituições que a sustentam. Neste caso, vemos um claro paralelismo com as unidades departamentais ou a Estrutura que suporta a empresa. Ao mesmo tempo tem de responder aquelas pessoas que, sem ter um peso totalmente decisório no funcionamento da empresa, são responsáveis do departamento ou responsáveis de que uma certa atividade da empresa saia a frente;
· Nível Individual: valor estimado por todos os usuários
reais e os usuários em potencial, onde se incluem análises
críticas de incidentes, esquetes e intercessões de usuários
em exemplos de uso. Corresponder-se-ia com a microestrutura da empresa,
isto é, o capital humano da empresa, os trabalhadores que diariamente
precisam do serviço de sistema de informação, solicitando-a
informação ou entregando a que se deriva da gestão
diária da empresa. Os usuários mais freqüentes ou potenciais,
desde o ponto de vista da informação como suporte da empresa.
· A informação numa empresa cumpre uma função muito importante já que dela se derivarão muitas decisões que, necessariamente, impliquem grandes movimentos econômicos para o sucesso ou o fracasso. Não faz muitos anos as empresas dispunham-se de algum tipo de sistema de informação que, pelo geral, dava suporte de forma horizontal. Isto é, não se incluía este serviço como um recurso mais no sistema de produção das empresas. Isto mudou com o avanço da Sociedade da Informação, pois agora possuir informação e gerar conhecimento é a chave para situar-se estrategicamente frente aos competidores. As necessidades informativas são tanto internas (fluxos de informação entre a estrutura empresarial e os níveis hierárquicos) como externas (necessidade de obter informação sobre o mercado e competidores);
· Submeter a avaliação o serviço do sistema de informação e à própria informação ou conhecimento, a partir das ontologias ou em outro tipo de ativos, contribui à obtenção da qualidade total no âmbito empresarial já que melhora o funcionamento nos diferentes níveis e hierarquias;
· De todas as linguagens documentárias, modelos de metainformação e ferramentas disponíveis, até o momento atual, a linguagem OWL é o mais adequado para a construção de ontologias;
· O aproveitamento do conhecimento existente para a elaboração da ontologia facilita sua construção, é necessário pôr especial atendimento nas inferências, axiomas ou definições reutilizados já que pode afetar à consistência da ontologia;
· O papel das ontologias como as especificações por excelência da Web Semântica e seu emprego para a gestão do conhecimento vai aumentando. Prova disso é a proliferação de publicações e investigações que atualmente se estão dando;
· O emprego das ontologias é multidisciplinar. Há uma tendência convergente desde diferentes disciplinas por encontrar métodos e instrumentos que permitam a recuperação e organização dos conteúdos;
· O desenho da ontologia realizado melhorará a visualização e a recuperação da informação que contém frente a outros métodos para a representação da informação ou frente às tradicionais bases de dados.
Notas
[1] WIKIPEDIA. La Enciclopedia Libre. Disponível em :
http://es.wikipedia.org/wiki/Taxonom%C3%ADa
[Ultima consulta 20/09/2005]
[2] Internacional Organization for Standarization, ISO 2788:1986. Guidelines
for the estrablishment and development of monolingual thesauri. Genebra:
ISO, 1986. International Organization for Standarization, ISO 5964:1985.
Guidelines
for the establishment and development of monolingual thesauri. Genebra:
ISO, 1985.
[3] Enciclopedia de la Cultura Española. Editora Nacional,
Madrid, 1967, tomo 4, páginas 580-581
Disponível em: http://www.filosofia.org/enc/ece/e40580.htm
[Ultima consulta 20/09/2005]
[4] CIBERNOUS. Filosofía em Rede: http://www.cibernous.com/glosario/alaz/metafisica.html
[5] Roberto Poli é professor assistente na Universidade de Trento
(Italia). É graduado em Sociología e Doutor em Filosofia
pela Universidade de Utrecht (Holanda) em 2001. Atualmente é pesquisador
em um centro dedicado ao estudo das ontologias e de análise cognitivo.
http://www.mitteleuropafoundation.it/Poli.html
[6] Baseado na experiência dos autores na empresa privada.
[7] A estrutura empresarial que temos representado podemos encontrar
em uma típica tipologia de empresas. Neste caso, nos temos baseado
na própria experiência.
[8] Ausência de conclusões contraditórias.
[9] Para poder avaliar a ferramenta, um dos principais aspectos a analisar
são as perguntas programadas, para o que o engenheiro deveria construir
interativamente e salvar as instâncias e axiomas em módulos.
As vezes, o conjunto de axiomas, classes e definições de
inferências, estão em relação complexa com axiomas
que freqüentemente interatuam com outros axiomas quando são
processados.
Referências bibliográficas
BUSTELO RUESTA, Carlota (2000). Gestión Documental en las Empresas: Una aproximación práctica. Jornadas Españolas de Documentación (Fesabid 2000). Bilbao, n. 7. Disponible en: http://www.inforarea.es/Documentos/fesabid.pdf [Última consulta el 20/09/2005]
CODINA, Lluis (2001). Las Propiedades de la Información Digital. El Profesional de la Información. v. 10, n.12, pp. 18-25.
CURRAS, Emilia (2005): Ontologías, taxonomías y tesauros. Manual de construcción y uso. Gijón: Trea.
DEWÈZE, A (1981). Réseaux sémantiques: essai de modelisation. Aplication à l´indexation et à la recherche documentaire [tesis doctoral], Lyon : Université Claude Bernard.
FISCHER, Dietrich. H. (2004). Converting a Thesaurus to OWL: Notes on the Paper « The National Cancer Institute´s Thesaurus and Ontology». Fraunhofer Institute Integrated Publication and Information Systems, Germany. Disponível em http://www.ipsi.fraunhofer.de/orion/pubFulltexts/NCIReview18Feb04.pdf [Última consulta 25/09/2005]
GARCÍA GUTIÉRREZ, Antonio (1998). Elementos de lingüística en sistemas de información y documentación. Revista Latina de Comunicación Social. La Laguna (Tenerife), n. 7. Disponível em: http://www.ull.es/publicaciones/latina/a/66ant.htm [Última consulta 20/09/2005]
GARCÍA JIMÉNEZ, Antonio (2002). Organización y gestión del conocimiento en la comunicación. Madrid: Trea.
GRUBER, Thomas R. (1993). Toward Principles for the Desing of Ontologies Used for Knowledge Sharing. International Journal Human-Computer Studies, n. 43. p. 907-928. Substantial revision of paper presented at the International Workshop on Formal Ontology, Padova, Italy.
GILCHRIST, Alan, e Barry MAHON (2004). Information architecture. Designing information environments for purpose. Facet Publishing in association with TFPL Ltd, London.
GÓMEZ PÉREZ, et al., (2004) apud. ABECKER, A., A. BERNARDI, K. HINKELMANN, O. HÜHN, e M. SINTEK. Toward a Technology for Oranizational Memories. IEEE Intelligent Systems v. 13, n. 3, pp. 40-48.
LACY, Lee W. (2005). OWL: Representing Information Using the Web Ontology Language, Canadá: Trafford.
LENAT, Douglas B., Ramanathan. V. GUHA (1990). Building Large Knowledge-Based Systems. Addison-Wesley: Reading, MA.
MANIEZ, Jacques (1993). Los lenguajes documentales y de clasificación, Madrid: Fundación Germán Sánchez Ruipérez, pp. 213-215.
MARTÍNEZ MÉNDEZ, Francisco Javier, e Juan Carlos GARCÍA GÓMEZ (2003). Tesauro de redes de ordenadores de la Universidad de Murcia. Grupo de Tecnologías de la Información. Disponível em: http://www.um.es/%7Egtiweb/fjmm/tesauro/ [Última consulta 5/09/2005]
MOREIRO GONZÁLEZ, José Antonio (2005). Conceptos introductorias al estudio de la información documental, Bahía: Editora da Universidade Federal da Bahía EDUFBA / Fondo Editorial de la Pontificia Universidad Católica del Perú, pp. 61-128.
MOREIRO GONZÁLEZ, José Antonio (2004). El contenido de los documentos textuales: su análisis y representación mediante el lenguaje natural, Gijón: TREA, pp. 151-193.
MOREIRO GONZÁLEZ, José Antonio, Jorge MORATO, Sonia SÁNCHEZ, e Beatriz Ainhize RODRÍGUEZ BARQUÍN, (2005). Categorización de los conceptos en el análisis de contenido: de la Retórica a los Topic Maps. Revista Investigaciones Bibliotecológicas, CUIB-UNAM, México. (Em imprensa).
PALOP, Fernando, e José M. VICENTE (1999). Vigilancia tecnológica e inteligencia competitiva. Su potencial para la empresa española. Serie estudios Cotec, n. 15.
SARACEVIC, Tefko, e Paul B. KANTOR (1997a). Studying the Value of Library and Information Services. Part I. Establishing a Theoretical Framework. Journal Of The American Society For Information Science, v. 48, n. 6, pp. 527–542.
SARACEVIC, Tefko, e Paul B. KANTOR (1997b). Studying the Value of Library and Information Services. Part II. Views of information professionals. Journal Of The American Society For Information Science, v. 48, n. 6, pp.543–563.
SCHMITZ-ESSER, W. (1991). New Approaches in Thesaurus Application. International Classification, v. 18, n. 3, pp.143-147.
STAAB, Steffen, e Rudi STUDER eds. (2004): Handbook on Ontologies. Berlin: Springer.
SOWA, John. F. (1991). Principles of Semantic Networks. Explorations in the Representation of Knowledge, California: Morgan Kaufman Publishers.
SURE, York, Jurger ANGELE, e Steffen STAAB (2003). OntoEdit: Multifaceted
inferencing for ontology engineering. Journal on Data Semantics,
LNCS 2800, pp. 128-152 Disponível em: http://www.aifb.uni-karlsruhe.de/~sst/Research/Publications/ontoedit-data-semantics.pdf
[Última consulta 20/09/2005]
Sobre os autores / About the Authors:
Beatriz Ainhize Rodríguez Barquín
beatriz.rodriguez@uc3m.es
Doutoranda em Documentaçao pela Universidad Carlos III de Madrid,
Avenida de las Ciudades, n. 1, apto. 603, 28903, Getafe - Madrid, Email:
José Antonio Moreiro González
jamore@bib.uc3m.es
Decano da Universidad Carlos III Madrid, Calle Madrid, 133, Despacho
17.2.53, 28903, Getafe - Madrid
Adilson Luiz Pinto
100059034@alumnos.uc3m.es
Doutorando em Documentação pela Universidad Carlos III
de Madrid, Calle Madrid, 133, Despacho 17.2.53, 28903, Getafe - Madrid