Resumo:
Mesmo com a evolução da área de recuperação de informação, os usuários
ainda se deparam com sistemas de busca que não fornecem características que
possibilitam que eles explorem as suas perguntas, entendam uma necessidade e
desenvolvam uma busca. Incerteza, ansiedade, dificuldade em traduzir as suas
dúvidas e sistemas pouco interativos, também são questões que afetam os
usuários enquanto exercem um comportamento de busca. Baseando-se nessas
questões propõe-se um framework chamado Hermeneus para recuperação e busca
de informação. Recorreu-se ao círculo hermenêutico para prover os princípios
do framework e a utilização de ontologia para implementar os conceitos
requeridos. O Hermeneus visa a atuar como um intermediário que auxilia os
usuários a mudarem de uma condição de necessidade por informação para uma
condição de solução. Ao utilizar o Hermeneus, os usuários podem desenvolver
as suas idéias enquanto navegam na informação recuperada e nos conceitos que
a representam. Hermeneus pretende ser a ponte entre as questões que o
usuário tem em mente e as respostas que são encontradas enquanto navega nos
conceitos da ontologia e nas instâncias desses conceitos em forma de vai e
vem.
Palavras-chave:
Recuperação e busca de informação, Ontologias, Círculo hermenêutico.
Abstract: Even with the advancement of information
retrieval research, extracting valuable information from information
retrieval systems is still very time consuming. Common problems affecting
users are uncertainty, deficient query definition, and poor systems
interactivity. Based on such questions, we propose a framework to
information seeking and retrieval called Hermeneus. We resorted to the
hermeneutic circle to provide the principles of such a framework. In our
implementation of the hermeneutic circle in an information retrieval system,
users develop their ideas while browsing the information and the concepts
that represent the information. We chose ontologies to implement the
hermeneutic circle. Hermeneus works as an intermediary that facilitates the
user to move from the initial state of information need to the goal state of
resolution. Our framework intends to be the bridge between the user’s
question and the answer to be found while she/he navigates in the ontology
concepts and the instances of these concepts in a back and forth way.
Keywords: Information seeking and retrieval, Ontologies, Hermeneutic
circle.
Introdução
A área de recuperação de informação (RI) tem progredido consideravelmente nos últimos anos (Witten, Moffat, 1999; Lin e Demner-Fushman, 2006). Entretanto, quando se busca informação utilizando sistemas de RI, os usuários ainda têm dificuldade, o que resulta na necessidade de despender tempo considerável na tentativa de localizar a informação requerida (Lai e Soh, 2004; Allan, Carterette, 2005).
Alguns dos problemas comuns relacionados a essa dificuldade se referem à composição inadequada de consultas, à grande quantidade de informação resultante a partir de uma busca e à falta de interatividade que sistemas de busca oferecem. Algumas pesquisas na área de comportamento humano mostram que os usuários quando estão procurando informação são preguiçosos para formular consultas, chegando a uma média de apenas 2,2 termos por consulta (Baeza-Yates e Ribeiro-Neto, 1999), além de raramente utilizar expressões booleanas (Spink, Wolfram, 2001). Além disso, a maioria dos usuários analisa apenas os primeiros resultados, i.e., os usuários têm baixa tolerância a investigar mais detalhadamente a lista de documentos recuperados.
A área de pesquisa de information seeking se preocupa em como obter informação, seja ela a partir de seres humanos ou de sistemas computacionais. De acordo com Marchionini (1989), um processo de information seeking “inclui reconhecer e interpretar a informação requerida, estabelecer uma estratégia de busca, conduzir uma busca, analisar e avaliar os resultados e, caso necessário, interagir através de todo o processo novamente”.
Dessa forma, para que sistemas de busca atendam aos requisitos definidos pela área de information seeking é necessário que tais sistemas sejam interativos de maneira a permitir buscas mais fáceis, rápidas e intuitivas (Järvelin e Ingwersen, 2004; Ingwersen e Järvelin, 2005b), mais fáceis porque os usuários querem obter resultados com o mínimo de esforço possível; alto desempenho porque em sua maioria os usuários são impacientes, principalmente na Internet (Huberman e Lukose, 1997); e intuitivos porque os usuários não querem despender muito tempo tentando aprender como executar tarefas mais complexas para obter melhores resultados (Hearst, Elliott, 2002).
Considerando-se as questões discutidas previamente, propõe-se um framework para recuperação e busca de informação. Decidiu-se chamar o framework de Hermeneus, que em grego significa “interpretar” ou “traduzir” (Kingsley, 1993), seguindo Kuhlthau (1991; 1993), que considera um sistema de busca como um intermediário que deve auxiliar o usuário na mudança de uma condição de incerteza para uma condição de solução.
Recorreu-se à filosofia, especificamente ao círculo hermenêutico, no intuito de construir um framework que esteja mais aproximado ao modo como os seres humanos compreendem. O círculo hermenêutico é o círculo de interpretação que se estabelece entre aquele que interpreta e a realidade a ser interpretada , os seres humanos entendem um todo a partir de preconcepções sobre o significado das partes e suas inter-relações (Gadamer, 1989; Heidegger e Stambaugh, 1996). Um processo de busca, que não pode ser caracterizado como estático e sim dinâmico, está diretamente relacionado à compreensão de um problema – a cada interação com um sistema de busca o usuário acessa novas informações que afetam o entendimento de suas necessidades e conseqüentemente sobre o que deseja buscar.
Para viabilizar a implementação das características definidas no framework utilizou-se ontologia. De acordo com Guarino (1998), ontologia se refere a um “artefato da engenharia constituído por um vocabulário específico responsável por representar uma certa realidade, adicionando-se um conjunto explícito de premissas relacionadas ao significado das palavras que compõem esse vocabulário”. Como um artefato da engenharia, ontologias podem ser usadas para validar componentes de sistemas de informação (Fonseca, 2007). Hermeneus, seguindo algumas das idéias propostas por Guarino (1998), utiliza uma ontologia como guia para a construção de um sistema de busca interativo.
A seguir, descreve-se o círculo hermenêutico e no seguimento apresenta-se o framework Hermeneus, descreve-se o protótipo e discute-se o framework proposto explicitando o contexto do círculo hermenêutico e o uso de ontologia. Conclusões e sugestões de trabalhos futuros são descritos abaixo.
Círculo Hermenêutico
A idéia do círculo hermenêutico, apresentado na Figura 1, é uma metáfora que descreve o círculo analítico que sugere que os seres humanos entendem um todo a partir de pré-concepções sobre o significado das partes e suas inter-relações (Gadamer, 1989; Heidegger e Stambaugh, (1996). As pré-concepções de cada pessoa influenciam seu processo de entendimento e interpretação. Para facilitar o entendimento do que significa o círculo hermenêutico, Gadamer (1989) usa o exemplo de tradução do significado de uma simples frase, como, por exemplo, “eles estão jogando futebol”. Para entender o significado das partes individuais da sentença (i.e., se futebol usa uma bola redonda ou em formato oval ou se não usa bola alguma) precisa-se entender o significado da sentença como um todo.
O processo de interpretação muda de um entendimento precursor das partes para um todo e do entendimento global do todo contextualizado que afeta o entendimento de cada parte, i.e., o significado de cada palavra. Além disso, a frase como um todo é, também, parte de um contexto maior. Se o contexto deixa claro que ninguém gosta de esportes, a frase é utilizada apenas de forma metafórica e, dessa forma, há uma nova interpretação sobre os conceitos que compõem a frase (e.g., o conceito “jogar” não necessariamente significa movimentos físicos desenvolvidos em um campo de grama). Gadamer (1989) descreve que essa mudança na compreensão do todo para a parte e de volta para o todo é constante e pode ser representada como um círculo concêntrico.
Figura 1 - Círculo hermenêutico
O processo de entendimento, segundo Heidegger (1982), está envolto em um diálogo contínuo de vai e vem entre as dimensões de análises e sínteses que visam compreender o todo e as dimensões que visam compreender as partes. Não se pode evitar o fato de que uma pessoa sempre trás concepções em um processo de entendimento tanto sobre o todo quanto sobre as partes. Entretanto, uma pessoa precisa refletir sobre suas pré-suposições enquanto analisa um objeto de investigação. O processo de entender algo novo “é uma dialética contínua que muda de direção constantemente entre o mais local dos detalhes locais e a mais global da estrutura global de modo a induzir que ambos sejam entendidos simultaneamente” (Geertz, 1979) citado em (Bernstein, 1983).
Heidegger (1982) afirma que “cada interpretação que contribui para algum entendimento precisa obrigatoriamente já ter sido entendida sobre o que é para ser interpretado”. Heidegger entende que essa proposição pode ser vista como um círculo vicioso. “Mas se a interpretação tem que operar dentro do que é entendido, como isso pode produzir resultados científicos sem entrar em um círculo, especialmente quando o entendimento pressuposto ainda opera em um conhecimento comum do ser humano e do mundo?” Heidegger e Stambaugh, 1996).
Contudo, Heidegger (1982) nega essa visão de círculo vicioso veementemente. Heidegger e Stambaugh (1996) citam que “a realização das condições fundamentais da possível interpretação não está na interpretação incorreta a priori das condições essenciais do que deve ser feito”. Além disso, o círculo do entendimento não é um círculo onde qualquer tipo de conhecimento opera, mas sim a expressão do nosso conhecimento mais fundamental e intuitivo. Dessa forma, de acordo com Heidegger (1982), “o que é decisivo não é sair do círculo, mas entrar nele da forma correta”.
Um dos fundamentos do trabalho de Gadamer em hermenêutica é a conexão entre a teoria e a prática (Winograd e Flores, 1987). O entendimento hermenêutico não é privado, não é uma atividade sem propósito. Para Gadamer, interpretação, entendimento e aplicação estão ligados como uma unidade. Eles não são eventos independentes no tempo, mas acontecem simultaneamente, com um influenciando e até mesmo possibilitando o outro. Gadamer (1989) afirma que “interpretação não é um fato ocasional suplementado pelo entendimento; na verdade, entendimento é sempre interpretação e, portanto, interpretação é uma forma explícita de entendimento”. A tarefa do interpretador é adaptar o texto à situação concreta na qual o texto realmente se expressa. Entendimento é um processo dinâmico, e o significado está sempre sendo criado e recriado.
Na próxima seção, apresenta-se o framework proposto contextualizando a visão filosófica em uma visão computacional. O principal elemento nessa tradução do círculo hermenêutico para uma interface de busca é a ontologia. No Hermeneus, a ontologia corresponde aos pré-conceitos e tem o papel de suportar o processo de information seeking.
O Framework Hermeneus
A área de information seeking deixa claro que os usuários devem interagir e intervir ativamente sobre os documentos recuperados, sobre as representações desses documentos e sobre os seus relacionamentos (Belkin, 1993). Hermeneus utiliza uma ontologia de domínio para construção de componentes interativos e mecanismos de recuperação da informação com vistas a disponibilizar um ambiente que atua como um intermediário no processo de busca. A seguir, descreve-se mais detalhadamente a sua arquitetura e, na seqüência, a metáfora do círculo hermenêutico.
Arquitetura do Hermeneus
O framework é composto por quatro módulos, indexação, recuperação, inferência e apresentação, sendo o último composto de três componentes interativos: navegador de ontologia, instâncias recuperadas e informação adicional. Uma ontologia e sua base de conhecimento, formada de instâncias da ontologia, são usadas para gerar os módulos e os componentes do Hermeneus. Cada módulo e componente da arquitetura são descritos em mais detalhes na seqüência.
Módulo de indexação
O módulo de indexação utiliza a ontologia e sua base de conhecimento para construir índices semânticos automaticamente. Esse módulo acessa a ontologia para identificar os conceitos por ela definidos e as relações entre os conceitos. Em seguida esse módulo lê as instâncias da ontologia para criar índices semânticos.
A estrutura do índice semântico está baseada no índice invertido tradicional que, segundo Baeza-Yates e Ribeiro-Neto (1999), é a estrutura mais comum para indexar informação com vistas a obtenção de um melhor desempenho durante uma busca. O índice semântico adiciona uma dimensão a mais no índice invertido tradicional que identifica a contextualização de um termo em um documento. A Figura 2 apresenta um exemplo da estrutura do índice semântico – o termo “Driven” está associado à classe “Paper”. Com o índice semântico, consultas semânticas podem ser mais facilmente respondidas (e.g., buscar documentos com o termo “Jaguar” contextualizado como “automóvel”).
Figura 2 - Índice invertido com informação semântica
O Hermeneus cria um índice semântico para cada conceito definido na ontologia – cada índice armazena as instâncias sobre um conceito e as instâncias de conceitos diretamente relacionados. Essa característica permite que os usuários consigam visualizar a informação recuperada em diferentes perspectivas (e.g., visualizar o resultado não somente agrupado pelas instituições e seus pesquisadores, mas também pelos pesquisadores e suas respectivas instituições).
Módulo de recuperação
O módulo de recuperação é responsável por recuperar as instâncias da ontologia, que estão armazenadas nos índices semânticos, em resposta a uma consulta, e por ordenar as instâncias recuperadas. Utiliza-se, na ordenação, a medida de similaridade coordinate matching (Witten, Moffat, 1999). Basicamente, essa medida considera a quantidade de termos de uma consulta que aparecem em um documento, no Hermeneus esse número representa o total de termos da consulta que estão armazenados em uma instância. Como esse módulo também interpreta consultas semânticas, restringe-se as instâncias recuperadas a apenas aquelas que respondam exatamente ao conteúdo descrito pela consulta semântica – uma consulta semântica compreende a descrição de um conceito seguido pelos respectivos termos (e.g., autor:Pacheco). Essa característica permite que não seja necessária nenhuma alteração na medida de similaridade, pois as instâncias que serão ordenadas são aquelas que atendem a uma consulta simples e/ou semântica.
Módulo de apresentação
O módulo de apresentação disponibiliza componentes interativos que se utilizam da ontologia. O módulo é composto de três componentes:- Navegador da ontologia. Apresenta a ontologia graficamente que permite aos usuários interagir com o conhecimento do domínio. Os usuários visualizam os conceitos definidos na ontologia e podem utilizá-los na composição de consultas. O componente possibilita, também, a visualização da informação recuperada em diferentes perspectivas (i.e., funcionalidade responsável por agrupar instâncias a partir de um conceito central).
- Instâncias recuperadas. Apresenta as instâncias recuperadas que são disponibilizadas para permitir que o seu conteúdo possa ser utilizado para refinamento de buscas ou composição de novas consultas. Esse procedimento facilita a utilização do conteúdo recuperado de maneira mais dinâmica e evita que os usuários tenham que formular novas consultas manualmente ao se depararem com conteúdo relacionado à sua necessidade.
- Informação adicional. Apresenta informação que não está explicitamente definida na ontologia e na base de conhecimento. Para cada instância recuperada novas informações podem ser extraídas. Assim como o componente de instâncias recuperadas, esse componente permite que as informações adicionais possam ser utilizadas dinamicamente em um processo de refinamento de buscas e composição de consultas. Cabe ressaltar que esse componente está diretamente vinculado ao módulo de inferência, descrito a seguir.Módulo de inferência
A extração de conhecimento adicional é possível porque a ontologia é descrita em uma linguagem formal que inclui axiomas para especificar relacionamentos entre conceitos (e.g., João é pai de Maria e irmão de José; pode ser inferido que José é tio de Maria e que Maria é sobrinha de José) (Decker, Erdmann, 1999). Com base nessa característica, o Hermeneus possibilita a utilização de técnicas de inferência para extração de informação adicional.
De acordo com Golbreich (2004) e Hyvönen (2005), regras são úteis para representar a parte dedutiva do conhecimento. Hermeneus aceita dois tipos de regras aplicadas à ontologia e às instâncias. As regras de nível da ontologia são aplicadas diretamente sobre a estrutura da ontologia. Essa característica permite a criação de novos relacionamentos entre conceitos e a especificação de novas restrições. Por exemplo, em uma ontologia sobre família que descreve apenas relacionamentos diretos entre conceitos (e.g., pai, mãe, filho, etc.), regras de nível da ontologia podem definir relacionamentos indiretos (e.g., tio, primo, sobrinha, etc.).
As regras de nível da instância, também conhecidas como regras de nível da consulta (Golbreich, 2004), permitem a extração de informação adicional a partir das instâncias. As regras de nível da instância podem ser configuradas para utilizarem as regras de nível da ontologia. Por exemplo, ao se considerar a ontologia de família descrita anteriormente, é possível configurar regras de nível da instância para extrair relacionamentos indiretos de uma determinada pessoa (e.g., extrair os tios e primas de “Fabiano Beppler”).
Organização computacional da arquitetura
A estrutura dos módulos e componentes que compõem a arquitetura está descrita de modo geral na Figura 3. Os módulos de indexação (i.e., IndexModel), recuperação (i.e., RetrieveModel) e inferência (i.e., InferenceModel) estão explicitamente definidos por suas respectivas classes, enquanto o módulo de apresentação está representado pelos componentes interativos de navegação da ontologia (i.e., OntologyNavigator), instâncias recuperadas (i.e., RetrievedInstances) e informação adicional (i.e., AdditionalInformation). As classes Controller e ReadOntology auxiliam na organização e fluxo de comunicação da arquitetura. No lado esquerdo da Figura 3 encontra-se a ontologia, a base de conhecimento (i.e., KB) e os índices semânticos.
Figura 3 - Organização da arquitetura de módulos e componentes do framework Hermeneus
A linguagem de programação utilizada para implementação das classes IndexModel, RetrieveModel, ReadOntology e InferenceModel é o Java. Para manipulação da ontologia, base de conhecimento e regras de inferência a tecnologia utilizada foi o Jena (Mcbride, 2002; Carroll, Dickinson, 2004; Cardoso, 2007). Já os componentes visuais foram implementados com tecnologia que lhes permitisse serem utilizados a partir de navegadores Web – o OntologyNavigator foi implementado também em Java, especificamente com a tecnologia Applets, e os componentes RetrievedInstances e AdditionalInformation foram implementados em HTML e JavaScript. A classe Controller, implementada com a tecnologia Servlet, é responsável por interpretar as requisições dos componentes interativos e requisitar informações das classes responsáveis pela recuperação de instâncias (i.e., RetrieveModel), leitura da ontologia (i.e., ReadOntology) e inferência (i.e., InferenceModel).
A classe que representa o módulo de indexação (i.e., IndexModel) não está conectada as demais classes por ter um comportamento autônomo e não ser utilizada diretamente por requisições efetuadas pelos componentes interativos. A classe que faz a leitura da ontologia (i.e., ReadOntology) atende especificamente a requisição do componente de navegação de ontologia (i.e., OntologyNavigator), que necessita conhecer toda a estrutura da ontologia.
A metáfora do círculo hermenêutico aplicada ao processo de busca por informação
O atividade hermenêutica é o contexto no qual o usuário de um sistema de busca obtém novas idéias sobre a informação em que está navegando. Para ser efetivo, um sistema de busca precisa estruturar um contexto em que permita aos usuários engajarem na espontaneidade de uma atividade interpretativa. Hermeneus considera quatro componentes da hermenêutica e cada um dá suporte aos componentes descritos pelo framework, como pode ser visto na Tabela 1.
Tabela 1 - Componentes da hermenêutica relacionados com os componentes do framework
Primeiro, a pré-estrutura (Gadamer chama de pré-entendimento) que é a idéia inicial que o usuário possui sobre um assunto para iniciar a navegação sobre um conjunto de dados. No Hermeneus, essa pré-estrutura corresponde à ontologia computacional. Segundo, é o objeto, que representa “as coisas” (do inglês things), que corresponde ao mundo objetivo, aos fatos, aos dados acumulados. No framework, essas “coisas” são representadas pelas instâncias dos conceitos da ontologia. Finalmente, há a interatividade e a aplicação. A interatividade é representada pela interação do usuário com as instâncias e com a ontologia. Os usuários vêm e vão entre as instâncias e os conceitos sempre tendo em mente uma aplicação.
Por exemplo, um estudante que deseja fazer um pós-doutorado pode iniciar um processo de busca com um assunto em mente (e.g., Web semântica). Com o resultado de uma busca, o estudante se depara com um pesquisador (e.g., Tim Berners-Lee) que passa, então, a ser a sua questão. Dando prosseguimento à busca, o estudante encontra a instituição onde o pesquisador atua (e.g., M.I.T.). O foco muda novamente, e agora o interesse não é mais sobre o pesquisador, mas sobre o local onde ele trabalha. Nesse processo o estudante altera constantemente o seu interesse como se estivesse em um ciclo – dos conceitos (e.g., assunto, pesquisador e instituição) para as instâncias (e.g., Web semântica, Tim Berners-Lee e M.I.T.) e de volta para os conceitos. A Figura 4 apresenta essa exemplificação graficamente.
Figura 4 – Exemplificação da metáfora do círculo hermenêutico aplicado ao processo de busca
Entendimento e interpretação, conforme descreve Gadamer (1989), são aplicados a um texto e, aqui, aplicado a um assunto específico que é objetivo da questão inicial do usuário. A tarefa do interpretador é adaptar o texto à situação concreta na qual o texto realmente se expressa. O mesmo é válido aqui no entendimento de um assunto através do processo de vai e vem entre os conceitos e as instâncias. Hermeneus tem por objetivo oferecer ao usuário a mídia que permita esse tipo de entendimento, ou seja, o círculo hermenêutico é a metáfora da atividade do vai e vem entre as instâncias e os conceitos, que visa moldar as questões do usuário.
Descrição do protótipoPara validar o framework Hermeneus, foi construído um protótipo usando uma base com 622 citações de artigos do Journal of the American Society for Information Science and Technology (JASIST). Cada citação contém informação sobre um artigo (i.e., paper), incluindo título, autores, instituições, edição e local da publicação. A Figura 5 apresenta um exemplo de citação disponível no site do Journal of the American Society for Information Science and Technology - JASIST.
Figura 5 - Exemplo de citação do Journal of the American Society for Information Science and Technology - JASIST
Uma ontologia composta de cinco conceitos foi concebida: paper, author, institution, journal e keyword. Cada conceito é representado por uma classe e respectivas propriedades – as propriedades de cada conceito descrevem as suas características e atributos (e.g., o conceito autor é definido pela classe autor e pela propriedade nome) (Noy e Mcguinness, 2001). A Tabela 2 apresenta as classes da ontologia e suas respectivas propriedades e a Figura 6 mostra os conceitos da ontologia e as suas relações.
Concebeu-se essa ontologia apenas para o propósito de mostrar a viabilidade desta proposta. Qualquer discussão sobre a estrutura e definição da ontologia está além do escopo do trabalho. Entretanto, cabe ressaltar que a ontologia foi criada de acordo com princípios amplamente definidos pela literatura (López, Asunción, 1999; Mcguinness, 1999; Noy e Mcguinness, 2001; Sure e Studer, 2002; Corcho, Fernández-López, 2003; Pinto e Martins 2004)
Tabela 2 - Estrutura da ontologia e Figura 6 - Ontologia: classes e suas relações
As propriedades das classes paper, author, institution e journal foram preenchidas com informações diretamente disponíveis nas citações dos artigos. A propriedade da classe keyword foi preenchida com informação extraída dos campos title e abstract por meio da técnica de extração de informação chamada Named Entity Recognition (NER) (Mikheev, Moens, 1999). Definiu-se como linguagem para representar a ontologia a Web Ontology Language (OWL) (Mcguinness e Harmelen, 2004; Cardoso, 2007) .
Configurou-se, no protótipo, especificamente no módulo de inferência, apenas uma regra de nível da ontologia que é responsável por criar um novo relacionamento entre os conceitos author e keyword – dessa forma, pode-se facilmente recuperar as palavras-chave (i.e., keyword) de um autor específico. A Figura 7, na parte superior, mostra um exemplo de regra de nível da ontologia, descrita em Jena Rule Language (Mcbride, 2002; Carroll, Dickinson, 2004), que cria uma nova relação entre dois conceitos (i.e., author e keyword), e uma regra de nível da instância, descrita em SPARQL (Prud'hommeaux e Seaborne, 2007), que extrai informações de instâncias utilizando a nova relação criada pela regra de nível da ontologia (i.e., as keywords de um author específico).
Figura 7 - Exemplo de regra de nível da ontologia (parte superior) e da instância
A interface do protótipo contém quatro seções, como mostra a Figura 8:(1) campo texto para composição de consultas;
(2) componente de navegação da ontologia;
(3) componente de instâncias recuperadas; e
(4) componente de informação adicional.
Figura 8 - Tela do protótipo que apresenta os resultados de uma busca
Os usuários, ao interagirem com a ontologia, podem definir um conceito central, que indica o tipo de informação a ser recuperada. Quando, por exemplo, um usuário seleciona o conceito author como conceito central, as instâncias sobre autores e seus respectivos papers e instituições (i.e., institution) são apresentadas. Essas instâncias são mostradas devido à estrutura da ontologia que indica uma relação direta, conforme mostra a Figura 6, entre os conceitos author, paper e institution. Portanto, o conceito central indica o tipo principal de instância a ser recuperada. Entretanto, as instâncias referentes aos conceitos diretamente relacionados ao conceito central são também apresentadas.
Quando um usuário clica em um conceito da ontologia a palavra que representa o conceito é automaticamente inserida no campo texto seguida do símbolo de dois pontos (e.g., ao se clicar no conceito author a palavra “author:” é inserida no campo texto) , isso facilita a composição de consultas semânticas. É possível combinar consultas simples e semânticas ao mesmo tempo para efetuar uma única busca. Em uma consulta simples, onde há termos não contextualizados, todas as instâncias do conceito central que contêm os termos pertencentes à consulta são recuperadas independentemente do contexto em que são utilizadas (e.g., buscar por “inteligência artificial” recupera todas as instâncias que possuem os dois termos em qualquer conceito).
Já em uma consulta semântica, somente as instâncias do conceito central que possuem os termos definidos de acordo com a contextualização descrita na consulta são recuperadas (e.g., a consulta semântica “author: Fonseca” recupera apenas as instâncias que contêm o termo “Fonseca” vinculado ao conceito author). É importante ressaltar que a busca é aplicada sobre todo o conjunto de instâncias armazenadas nos índices semânticos – o índice semântico usado na busca é aquele vinculado ao conceito central.
Apresenta-se, na Figura 8, o resultado de uma busca cuja consulta é “ontology author: Fonseca” em que duas instâncias de paper são recuperadas. A consulta contém termos simples (i.e., ontology) e semânticos (i.e., author: Fonseca). No componente de navegação da ontologia o conceito central é desenhado em um formato diferente (i.e., quadrado) e o conceito que está sendo usado na consulta (i.e., author) é pintado de amarelo.
Ao se clicar em uma instância recuperada, informação adicional sobre essa instância é apresentada na quarta seção. A informação adicional mostra que o autor “Frederico Fonseca” tem como principais palavras-chave (i.e., keywords) “ontologies”, “information science” e “engineering”; verifica-se, também, que esse autor coopera com “Gilberto Câmara” e “James E. Martin”. Além disso, também são apresentadas as informações sobre a instituição do autor (i.e., “Pennsylvania State University”) que possui 18 papers publicados por 36 autores e que possui como principais palavras-chave (i.e., keywords): “web search”, “web search engine”, “information retrieval” e “ontologies”.
Os usuários podem interagir com todo o conteúdo recuperado, disponível no componente de instâncias recuperadas e com as informações adicionais, disponível no componente de informação adicional . Na lista das instâncias recuperadas, quando um usuário seleciona uma propriedade de uma instância uma nova busca é executada considerando o conteúdo clicado – é o tipo de interação chamada de refinamento.
No componente de informação adicional essa funcionalidade pode funcionar de maneira diferente, porque é possível definir comportamentos específicos para cada informação extraída. Por exemplo, no protótipo, ao se clicar no número que representa a quantidade de papers (i.e., dezoito) disponível no componente de informação adicional e, nesse caso, diretamente relacionado ao paper de “Frederico Fonseca”, é possível visualizar os dezoito papers no componente de instâncias recuperadas, publicados por autores diretamente vinculados à instituição “Pennsylvania State University” (i.e., a instituição que o autor “Frederico Fonseca” está vinculado).
Discussão
Hermeneus como tradutor da informação requerida pelos usuários
Hermeneus, entre suas principais características, visa auxiliar os usuários a entenderem e desenvolverem as informações por eles requeridas. Mesmo parecendo estranho, os usuários, muitas vezes, não sabem o que estão buscando, o que a literatura trata como falta de conhecimento. Essa falta de conhecimento induz a utilização de intermediários, tais como um sistema de busca, para suprir uma necessidade por informação.
Entretanto, os usuários precisam desenvolver primeiramente as suas próprias questões de modo a entender o que desejam buscar. Nesse processo, o estado cognitivo dos usuários pode conter dúvidas, problemas na interpretação e, de acordo com Ingwersen e Järvelin (2005b), alcançar uma condição de incerteza. Tanto o processo de entender a falta de conhecimento quanto à busca por informação são tarefas cognitivas diretamente relacionadas uma com a outra durante o ciclo de aquisição de informação. Vakkari (2003) cita que “é evidente que o conhecimento anterior é alterado quando um indivíduo adquire nova informação”. Isso enfatiza o fato de que um sistema de busca deve permitir que o usuário interaja com ferramentas que possam afetar a sua condição de incerteza de modo a estimular uma transformação no seu estado de conhecimento (Marchionini, 1989; Kuhlthau, 1993; Hert, 1997; Ingwersen e Järvelin, 2005a).
Formular consultas por meio de termos é a forma mais comum de expressar uma necessidade em um sistema de busca. No entanto, formular consultas precisas não é uma tarefa simples, o que influencia diretamente os resultados de uma busca (Chen, Shankaranarayanan, 1998). Hermeneus auxilia nessa questão ao permitir que os usuários possam formular consultas semânticas. Ao interagir com a ontologia, os usuários podem identificar conceitos e usá-los para compor consultas semânticas. O trabalho apresentado por Tang (2007) deixa claro a importância da visualização da ontologia como auxílio para composição de consultas, principalmente quando os usuários não sabem ao certo o que desejam ou têm pouca familiaridade com um determinado tópico.
No protótipo, os usuários podem interagir com a ontologia através de cliques de mouse; quando os usuários clicam sobre um conceito, o nome do conceito é adicionado à consulta agindo como um assistente de composição de consultas. Por exemplo, uma busca pelos termos “data modeling” combinada com um clique sobre o conceito author, adiciona a descrição do conceito à consulta juntamente com o símbolo de dois pontos (i.e., “data modeling author:”), dessa forma, pode-se inserir termos especificamente relacionados ao conceito author sem necessitar digitar a descrição do conceito (e.g., “data modeling author: Fonseca”).
Ao desenvolver a presente solução, seguiu-se o princípio que através da interação com a ontologia os usuários adquirem percepções sobre as suas necessidades e conseguem se expressar por meio de consultas mais úteis e, portanto, obter resultados mais precisos. Além disso, os usuários podem formular consultas menos ambíguas uma vez que podem expressar explicitamente o contexto para cada termo da consulta (García e Sicilia, 2003; Hyvönen, Mäkelä, 2005).
Conforme descrito por Kuhlthau (1991) e Hert (1997), o estado de conhecimento do usuário é dinâmico em vez de estático, sendo alterado à medida que procede em um processo de busca. No Hermeneus, como as instâncias da ontologia são apresentadas em um ambiente contextualizado (i.e., cada conteúdo possui um link semântico), os usuários podem aprimorar as suas consultas adicionando automaticamente conteúdo semântico de instâncias relevantes (e.g., ao se buscar pelo termo “semantic”, no protótipo, pode-se visualizar e interagir com as instâncias do conceito keyword: latent semantic indexing, semantic web, semantic search, etc.).
Com esse tipo de interação exploratória, os usuários são protegidos de detalhes requeridos pela formulação de consultas semânticas além de construir expressões de busca mais úteis (Capra Iii e Pérez-Quiñones, 2005). Por exemplo, ao buscar por “web” recupera-se 169 instâncias de paper; mas, ao clicar em “semantic web”, apresentado em uma das instâncias recuperadas (i.e., a consulta agora contém o termo “web” e o conteúdo semântico “keyword: semantic web”), retorna apenas 11 instâncias. Com esse tipo de interatividade os usuários podem facilmente experimentar dinamicamente o conteúdo recuperado para formular novas consultas como parte do processo de entendimento de suas necessidades.
A ontologia pode também ser usada para definir quais tipos de instâncias recuperadas devem ser apresentadas por meio da seleção de um conceito central. Essa funcionalidade permite a visualização de diferentes perspectivas das instâncias recuperadas a partir de uma mesma consulta. Ontologias podem ser usadas para produzir diferentes visões de conhecimento, particularmente para propósitos de exploração e navegação (Staab, Studer, 2001). Como um processo de busca é dinâmico e muda constantemente (Marchionini, 1989; Kuhlthau, 1993; Vakkari, 2003; Ingwersen e Järvelin, 2005a), visualizar informação recuperada em diferentes perspectivas pode auxiliar os usuários a terem novas percepções sobre suas necessidades.
No protótipo, por exemplo, ao se buscar por “information science” recupera-se 58 instâncias do conceito paper (i.e., que é o conceito central). Ao se alterar o conceito central para author visualiza-se 73 instâncias de autores. Essa funcionalidade está de acordo com Vakkari (2003), que cita que “modelagem e desenvolvimento de sistemas, como funcionalidades de interface que dão suporte a usuários em articular suas necessidades por usar termos de relevantes documentos agrupados de acordo com conceitos utilizados em suas consultas, podem aumentar o desempenho na recuperação”.
Utilização de ontologia como suporte ao desenvolvimento de sistemas de busca interativos
Um dos objetivos para criação do Hermeneus foi facilitar o desenvolvimento de um sistema de busca interativo baseado em ontologia e sua base de conhecimento. O engenheiro de conhecimento, ao utilizar o Hermeneus, pode desenvolver um sistema de busca com componentes interativos. Essa característica ajuda, por exemplo, a evitar problemas na comunicação entre atores (e.g., especialistas de domínio, designers, desenvolvedores, etc.) envolvidos no desenvolvimento de um sistema de busca. Hendry e Harper (1996) afirmam que uma arquitetura pode reduzir a distância cognitiva entre os conceitos em um problema de domínio e as abstrações necessárias em um programa de computador.
Hermeneus não depende de um modelo específico de recuperação da informação, principalmente pela falta de um modelo capaz de induzir à construção de um ambiente interativo.
O framework suporta a criação de componentes interativos que atuam como um intermediário no processo de busca. Por exemplo, Hermeneus cria um índice semântico para cada conceito da ontologia. Com esses índices, os usuários podem compor consultas semânticas e visualizar a informação recuperada em diferentes perspectivas. Essas características são possíveis devido à utilização de uma ontologia. De acordo com Vallet, (2005), o uso de ontologia supera as limitações de busca baseada em palavras-chave e proporciona buscas mais precisas.
Concebeu-se o Hermeneus para ser modular, flexível, configurável e extensível. Sua arquitetura compõe-se de quatro módulos e três componentes que facilitam sua adaptação à especificidades requeridas por certos domínios. Por exemplo, pode-se alterar a forma de visualização das instâncias recuperadas ajustando o componente de instâncias recuperadas (i.e., classe RetrievedInstances - Figura 3). Regras de nível da ontologia e instância podem ser configuradas no módulo de inferência (i.e., classe InferedModel - Figura 3). Além disso, como o Hermeneus é modular, novas características podem ser adicionadas à arquitetura facilmente. Por exemplo, a inserção de um novo algoritmo de ordenação requer alteração apenas no módulo de recuperação (i.e., RetrieveModel - Figura 3).
Extração de informação adicional
Durante o processo de busca por informação os usuários normalmente focam detalhes que podem ajudá-los a encontrar o que estão procurando. Em sistemas tradicionais de recuperação da informação os usuários recebem uma lista com apenas uma pequena parte do conteúdo de cada documento recuperado. No Hermeneus, o módulo de informação adicional disponibiliza informação que não está explicitamente definida nas instâncias. Informação adicional, segundo Golbreich (2004) e Murdock e Silva (2005), ajuda os usuários a terem um melhor entendimento sobre o domínio e permite que aprendam mais sobre as instância. Dessa forma, inferir nova informação para cada instância recuperada permite que os usuários possam capturar novas percepções sobre as suas necessidades.
Inferência, de acordo com Decker, (1999), é um processo lógico de derivação de novos dados a partir de uma coleção de dados. Usa-se essa técnica combinada com regras para extrair informação que está implícita. No protótipo, quando as instâncias recuperadas estão agrupadas pelo conceito paper (i.e., que é o conceito central) e o usuário seleciona uma instância específica, o componente de informação adicional apresenta informação inferida sobre os autores (i.e., author) e suas instituições (i.e., institution).
Nesse caso, conforme mostra a Tabela 3, é apresentada: a lista de palavras-chave (i.e., keyword) mais freqüentes, considerando todos os papers armazenados na base de conhecimento; as instituições nas quais os autores estão vinculados; os colaboradores dos autores; as palavras-chave mais freqüentes de cada instituição; e os papers que mencionam a instituição. O conteúdo no componente de informação adicional pode também ser usado de forma exploratória, i.e., os usuários podem interagir dinamicamente com a informação inferida de modo a refinar buscas ou formular consultas.
Tabela 3 - Exemplo de informação adicional
Interação gráfica com a ontologia
O objetivo de uma ferramenta gráfica é facilitar que seres humanos consigam adquirir percepções mais aguçadas sobre dados. Visualizar uma ontologia significa visualizar seus conceitos e suas relações (Spence, 2000). A vantagem em apresentar uma ontologia graficamente está na sua expressividade, pois conceitos e relações tornam-se de fácil identificação (Fluit, Sabou , 2002). No Hermeneus, a interface do componente de navegação de ontologia foi concebida de modo a estimular o usuário a explorar o conhecimento de um domínio. Além disso, a possibilidade de interação direta com os conceitos da ontologia, conforme descreve Tang (2007), estimula os usuários a articular diferentes aspectos de suas necessidades.
Ao utilizar o Hermeneus, pode-se visualmente identificar quais conceitos são usados em uma busca semântica. Por exemplo, ao buscar por “author: Pacheco”, o conceito author é pintado de amarelo (os demais conceitos possuem a cor cinza). Pode-se, também, visualizar os termos, relativos a uma busca semântica, vinculados aos respectivos conceitos. Considerando-se o exemplo anterior, ao se posicionar o mouse sobre o conceito author na ontologia, uma caixa de texto apresenta o conteúdo “Pacheco”. Esse tipo de característica gráfica ajuda os usuários a contextualizar as suas necessidades ao mesmo tempo em que seu entendimento sobre o problema ainda está sendo desenvolvido.
A ferramenta gráfica também habilita a utilização da ontologia para visualizar os resultados em diferentes perspectivas. Essa operação, é importante enfatizar, ocorre por meio de cliques de mouse sobre os conceitos da ontologia. O conceito central, que indica o tipo de informação a ser recuperada, é desenhado em formato diferente (i.e., quadrado) de modo a facilitar visualmente a identificação do tipo de informação apresentada.
Conclusões e trabalhos futuros
Descreve-se, neste trabalho, que questões relacionadas a incerteza e ansiedade são parte de um processo de busca. Se um usuário não sabe exatamente o que precisa, como um framework pode auxiliar em um processo de busca por informação? Recorreu-se à filosofia, especificamente ao círculo hermenêutico, visando buscar auxílio para definição desta proposta. No círculo hermenêutico os usuários desenvolvem as suas idéias enquanto navegam na informação e conceitos que representam a informação.
A solução que se apresenta aqui é um framework para recuperação e busca de informação. A definição do framework segue o conceito definido por Kuhlthau (1991; 1993), que afirma que um sistema de busca deve ser um intermediário entre a necessidade por informação e o acesso à solução para essa necessidade. Information seeking auxiliou a entender os requisitos para construção de um ambiente em que os usuários possam intervir e interagir mais ativamente.
Buscar informação é uma atividade exploratória onde os usuários aplicam conhecimento e intuição combinados com estratégias e ferramentas para encontrar a informação desejada (Capra Iii e Pérez-Quiñones, 2005). Hermeneus permite que os usuários entrem em uma seqüência de interações que os auxiliam a entender o que realmente precisam buscar.
Utiliza-se ontologia como tecnologia que pode fornecer suporte para criação de um ambiente de busca mais interativo. Além disso, a ontologia também pode ser usada no âmbito dos mecanismos requeridos por um sistema de busca (e.g., índice e recuperação). Ao utilizar o Hermeneus, os usuários podem navegar nos conceitos da ontologia e nas instâncias desses conceitos em forma de vai e vem. Interagindo dessa forma, pode-se mudar a visualização do resultado através dos conceitos da ontologia. Os usuários podem, também, interagir com as instâncias recuperadas para refinar as suas buscas e formular novas consultas. Além disso, possibilita-se a interação com informação adicional extraída a partir de cada instância recuperada.
Hermeneus foi definido considerando os requisitos descritos por Ingwersen e Järvelin (2005a) que afirmam que uma atividade de busca deve ser fácil, rápida e intuitiva. Em termos de facilidade, permiti-se que os usuários acessem o conhecimento de um domínio através da busca por termos e interação com uma ontologia. Dessa forma, um usuário pode compor consultas usando termos que estão de acordo com a sua condição inicial de conhecimento e ter novos insights quando navegam nos conceitos da ontologia. Em termos de velocidade, os usuários podem utilizar o conteúdo das instâncias recuperadas para refinar as suas buscas e acessar informação adicional para cada instância recuperada.
As vantagens de tais operações, principalmente com relação à utilização dinâmica do conteúdo recuperado, estão em acordo com Ingwersen e Järvelin (2005a) que citam que “relevância é um fenômeno cognitivo, situacional e dinâmico”. Finalmente, a proposta se propõe a conceber um ambiente intuitivo de modo a permitir que os usuários utilizem os conceitos da ontologia para composição de consultas simples e semânticas, utilizem o conteúdo de instâncias recuperadas para refinar buscas e utilizem a ontologia para visualizar o conteúdo recuperado em diferentes perspectivas. Essas funcionalidades, de acordo com Card, (1999) e Albertoni, (2005), facilitam a cognição dos usuários, o que, portanto, auxilia o alcance de uma condição de solução mais rapidamente.
Como trabalhos futuros, entende-se que mostrar os resultados recuperados graficamente pode enriquecer ainda mais a interatividade entre os usuários e o sistema de busca. Visualiza-se, também, a criação de um ambiente gráfico onde especialistas de um domínio possam formular regras sem precisar entender uma linguagem específica. Esse ambiente poderia ser usado pelos próprios usuários para configuração das suas regras.
Entende-se, também, que as ações tomadas pelos usuários podem ser armazenadas de modo a auxiliar outros usuários quando estes buscam assuntos similares. Nesse caso, o sistema poderia “entender” o comportamento de novos usuários e oferecer uma melhor assistência durante todo o processo de busca por meio de dicas sobre as suas buscas. Visualiza-se, ainda, a criação de um mecanismo que um usuário possa definir a sua ontologia e configurar o Hermeneus de acordo com a sua noção de realidade sobre um domínio.
Referências Bibliográficas
Albertoni, R., A. Bertoni, et al. Information Search: The Challenge of
Integrating Information Visualization and Semantic Web. Sixteenth Int.
Workshop on Database and Expert Systems Applications, p.529-533. 2005.
Allan, J., B. Carterette, et al. When will Information Retrieval be "Good
Enough?" Proceedings of the 28th annual ACM SIGIR, p.433-440. 2005.
Baeza-Yates, R. A. e B. A. Ribeiro-Neto. Modern Information Retrieval: ACM
Press, Addison-Wesley. 1999. 513 p.
Belkin, N. J. Interaction with Texts: Information Retrieval as
Information-Seeking Behavior. Information Retrieval '93: Von derModellierung
zu Anwendung, 1993. 55-66 p.
Bernstein, R. J. Beyond Objectivism and Relativism: Science, Hermeneutics,
and Praxis. Philadelphia, PA, USA: University of Pennsylvania Press. 1983
Capra Iii, R. G. e M. A. Pérez-Quiñones. Using Web Search Engines to Find
and Refind Information. IEEE Computer Society, v.38, n.10, p.36-42. 2005.
Card, S. K., J. D. Mackinlay, et al. Readings in Information Visualization:
Using Vision to Think: Morgan Kaufmann. 1999
Cardoso, J. The Semantic Web Vision: Where are We? IEEE Intelligent Systems,
v.22, n.5, p.84-88. 2007.
Carroll, J. J., I. Dickinson, et al. Jena: Implementing the Semantic Web
Recommendations. 13th Int. WWW Conference. New York: ACM Press, 2004. 74-83
p.
Chen, H., G. Shankaranarayanan, et al. A Machine Learning Approach to
Inductive Query by Examples: An Experiment Using Relevance Feedback, ID3,
Genetic Algorithms, and Simulated Annealing. Journal of the American Society
for Information Science, v.49, n.8, p.693-705. 1998.
Corcho, O., M. Fernández-López, et al. Methodologies, Tools and Languages
for Building Ontologies: Where is their Meeting Point? Data & Knowledge
Engineering, v.46, n.1, p.41-64. 2003.
Decker, S., M. Erdmann, et al. Ontobroker: Ontology Based Access to
Distributed and Semi-Structured Information. DS-8: Kluwer Academic
Publisher, 1999. 351-369 p.
Fluit, C., M. Sabou, et al. Ontology-Based Information Visualization. In:
(Ed.). Visualising the Semantic Web: Springer Verlag, 2002. Ontology-Based
Information Visualization
Fonseca, F. The Double Role of Ontologies in Information Science. Journal of
the American Society for Information Science and Technology, v.58, n.6,
p.786-793. 2007.
Gadamer, H.-G. Truth and Method (Original publication 1960, as Wahrheit und
Methode): Crossroad. 1989
García, E. e M.-Á. Sicilia. User Interface Tactics in Ontology-Based
Information Seeking. PsychNology Journal, v.1, n.3, p.242-255. 2003.
Geertz, C. From the Native’s Point of View: On the Nature of Anthropological
Understanding. In: P. Rabinow e W. M. Sullivan (Ed.). Interpretive Social
Science: A Reader. Berkeley: University of California Press, 1979. From the
Native’s Point of View: On the Nature of Anthropological Understanding,
p.225-241
Golbreich, C. Combining Rule and Ontology Reasoners for the Semantic Web.
RuleML. Hiroshima, Japan: Springer-Verlag, 2004. 155-169 p.
Guarino, N. Formal Ontology and Information Systems. Formal Ontology in
Information Systems, Netherlands: IOS Press, p.3-15. 1998.
Hearst, M., A. Elliott, et al. Finding the Flow in Web Site Search.
Communications of the ACM, The consumer side of search, v.45, n.9. 2002.
Heidegger, M. On the Way to Language. San Francisco: Harper
& Row. 1982. 200 p.
Heidegger, M. e J. Stambaugh. Being and Time: A Translation of Sein und Zeit.
Albany, NY: State University of New York Press. 1996. xix, 487 p. p. (SUNY
series in contemporary continental philosophy)
Hendry, D. G. e D. J. Harper. An Architecture for Implementing Extensible
Information-Seeking Environments. 19th ACM SIGIR. Switzerland: ACM Press,
1996. 94-100 p.
Hert, C. A. Understanding Information Retrieval Interactions: Theoretical
and Practical Implications. London, England: Ablex Publishing Corporation.
1997
Huberman, B. A. e R. M. Lukose. Social Dilemmas and Internet Congestion.
Science. American Association for the Advancement of Science, v.277, n.5325,
p.535-537. 1997.
Hyvönen, E., E. Mäkelä, et al. MuseumFinland: Finnish Museums on the
Semantic Web. Journal of Web Semantics, v.3, n.2, p.25. 2005.
Ingwersen, P. e K. Järvelin. The Sense of Information: Understanding the
Cognitive Conditional Information Concept in Relation to Information
Acquisition. Lecture Notes in Computer Science, Springer, v.3507, p.7-19.
2005a.
______. The Turn: Integration of Information Seeking and Retrieval in
Context. Netherlands: Springer. 2005b (The Information Retrieval Series)
Järvelin, K. e P. Ingwersen. Information Seeking Research Needs Extension
Towards Tasks and Technology. Information Research: An International
Electronic Journal, v.10, n.1. 2004.
Kingsley, P. Poimandres: The Etymology of the Name and the Origins of the
Hermetica. Journal of the Warburg and Courtauld Institutes, v.56, p.1-24.
1993.
Kuhlthau, C. C. Inside the Search Process: Information Seeking from the
User's Perspective. Journal of the American Society for Information Science,
v.42, n.5, p.361-371. 1991.
______. Seeking Meaning: A Process Approach to Library and Information
Services. USA: Ablex Publishing Corporation. 1993
Lai, J. e B. Soh. Similarity Score for Information Filtering Thresholds.
ISCIT 2004. IEEE International Symposium on Communications and Information
Technology, 2004. 216-221 p.
Lin, J. e D. Demner-Fushman. The Role of Knowledge in Conceptual Retrieval:
A Study in the Domain of Clinical Medicine. Proceedings of the 29th ACM
SIGIR, p.99-106. 2006.
López, M. F., G.-P. Asunción, et al. Building a Chemical Ontology Using
Methontology and the Ontology Design Environment. Intelligent Systems and
their Applications IEEE, v.14, n.1, p.37-46. 1999.
Marchionini, G. Information-Seeking Strategies of Novices Using a Full-Text
Electronic Encyclopedia. Journal of the American Society for Information
Science, v.40, n.1, p.54-66. 1989.
Mcbride, B. Jena: A Semantic Web Toolkit. Internet Computing, IEEE, v.6,
n.6, p.55-59. 2002.
Mcguinness, D. L. Ontology-Enhanced Search for Primary Care Medical
Literature. Int. Medical Informatics Association. Phoenix, Arizona, 1999. p.
Mcguinness, D. L. e F. V. Harmelen. OWL Web Ontology Language Overview. W3C
World Wide Web Consortium (http://www.w3.org/TR/owl-features/). 2004.
Mikheev, A., M. Moens, et al. Named Entity Recognition without Gazetteers.
9th Int. Conf. of the European Chapter of the Association for Computational
Linguistics, 1999. p.
Murdock, J. W., P. Pinheiro Da Silva, et al. Encoding Extraction as
Inferences. AAAI Spring Symposium on Metacognition on Computation: AAAI
Press, Stanford University, 2005. 92-97 p.
Noy, N. F. e D. L. Mcguinness. Ontology Development 101: A Guide to Creating
Your First Ontology. Knowledge Systems Laboratoty. 2001.
Pinto, H. S. e J. P. Martins. Ontologies: How Can They Be Built? Knowledge
and Information Systems, v.6, p.441-464. 2004.
Prud'hommeaux, E. e A. Seaborne. SPARQL Query Language for RDF. W3C - World
Wide Web Consortium (http://www.w3.org/TR/rdf-sparql-query/). 2007.
Spence, R. Information Visualization: Addison Wesley. 2000. 206 p.
Spink, A., D. Wolfram, et al. Searching the Web: The Public and their
Queries. Journal of the American Society for Information Science, v.53, n.2,
p.226-234. 2001.
Staab, S., R. Studer, et al. Knowledge Processes and Ontologies. Intelligent
Systems, IEEE, v.16, n.1, p.26-34. 2001.
Sure, Y. e R. Studer. On-To-Knowledge Methodology. Institute AIFB,
University of Karlsruhe. 2002. (EU-IST Project IST-1999-10132 - OTK/2002/D18/v1.0)
Tang, M.-C. Browsing and Searching in a Faceted Information Space: A
Naturalistic Study of PubMed Users' Interaction with a Display Tool. Journal
of the American Society for Information Science, v.58, n.13, p.1998-2006.
2007.
Vakkari, P. Task-Based Information Search. Annual Review of Information
Science and Technology, v.37, p.413-464. 2003.
Vallet, D., M. Fernández, et al. An Ontology-Based Information Retrieval
Model. In: (Ed.). The Semantic Web: Research and Applications: Springer,
2005. An Ontology-Based Information Retrieval Model, p.455-470. (Lecture
Notes in Computer Science)
Winograd, T. e F. Flores. Understanding Computers and Cognition: A New
Foundation for Design: Addison Wesley. 1987
Witten, I. H., A. Moffat, et al. Managing Gigabytes: Compressing and
Indexing Documents and Images. San Francisco, CA: Morgan Kaufmann. 1999.
Sobre os autores / About the Author:
Doutor em Engenharia e Gestão do Conhecimento pela UFSC/SC. Pesquisador do Instituto Stela.
Frederico Torres Fonseca
Ph.D. em Spatial Information Science and Engineering pela University of Maine/EUA.Associate Professor do College of Information Sciences and Technology da Penn State University.
Roberto Carlos dos Santos Pacheco
Doutor em Engenharia de Produção pela UFSC/SC. Pesquisador do Instituto Stela e professor dos cursos de Engenharia e Gestão do Conhecimento e Sistemas de Informação da UFSC/SC.