DataGramaZero - Revista de Ciência da Informação - v.3   n.1  fev/02                             ARTIGOS

 
Os Novos Paradigmas da Imagem em Movimento: Em Busca de Metalinguagens de Representação para Bases de Dados Virtuais Visando a Recuperação de Conteúdo Semântico
Indexation and Retrieval of Moving Images: new paradigms
por Antonio Claudio Brasil Gonçalves

Resumo: O presente artigo é o resumo atualizado do projeto de qualificação apresentado recentemente no curso de doutorado em Ciência da Informação do convênio CNPq/IBICT/UFRJ/ECO. O tema principal está relacionado aos estudos e pesquisas sendo desenvolvidos no campo da Indexação e Recuperação de Imagens em Movimento para Bases de Dados Virtuais. Este tema está relacionado a uma longa experiência profissional do autor com a produção de vídeos científicos e jornalísticos. O objetivo desses estudos visa a facilitar o acesso de material audiovisual que está cada vez mais sendo disponibilizado nas redes telemáticas como a World Wide Web.

Palavras-chave: Imagens em Movimento; Bases de Dados Virtuais; Indexação de Imagens em Movimento; Recuperação de Imagens em Movimento

Abstract: This paper presents a summary of a interdisciplinary doctoral project of research on the Indexation and Retrieval of Moving Images in Digital Databases that is being currently developed at the CNPq/IBICT/UFRJ/ECO program in Information Science. It is the result of a long professional and academic relationship between the author and a lifetime experience in the production of journalistic and scientific audiovisual  material. The main theme of this research relates to the necessity of studies  to enable a more efficient accesss to fast growing video archives that are being offered in the world wide web.

Keywords: Moving Images; Digital Databases; Indexation of Moving Images; Retrieval of Moving Images


Sintagmas Nominais: uma Nova Proposta para a Recuperação de Informação
Nominal Groups: a New Purpose to Information Retrieval
por Hélio Kuramoto

Resumo: O uso das palavras como meio de acesso à informação pelos sistemas automatizados de recuperação de informação tem sido a base da maioria dos modelos de recuperação de informação. Apesar de alguns deles terem alcançado relativo sucesso na melhoria da precisão de resultados de uma busca, a meta principal da recuperação de informação, que é a obtenção de todos os documentos pertinentes a uma consulta, não foi atingida. O presente artigo analisa essa questão, discutindo e mostrando a inadequação do uso das palavras nesses modelos, propondo  em seu lugar, um outro tipo de unidade de informação: os sintagmas nominais.

Palavras-chave: Indexação Automática; Sintagmas Nominais; Recuperação de Informação; Interface de Busca; Modelo Vetorial; Modelo Booleano, Análise de Referências

Abstract: The use of words as a means of accessing information has been the basis for most of information retrieval models implemented by many information retrieval automatic systems. Despite the success of some of these models in improving the accuracy in search results, the main goal of the information retrieval, which is to find all documents relevant to a user’s query, has not been satisfactorily achieved. This paper analyzes this question, discussing and demonstrating the inadequacy of using words in this models and propose in its place another type of information unit: the nominal groups.

Keywords: Automatic Indexing; Nominal Groups; Information Retrieval; Search Interface, Vector Model, Boolean Model, Link Analysis


A Ambigüidade na Recuperação da Informação
Ambiguity in information retrieval
por Marisa Bräscher

Resumo: Discutem-se questões relativas à extração de informações contidas em textos completos e posterior recuperação, por meio de métodos de tratamento automático da linguagem natural. Além da extração de palavras do texto, procura-se manter as relações de significado que estas palavras possuem no contexto do discurso em que ocorrem. Assim, defende-se o tratamento de determinados fenômenos lingüísticos que afetam a qualidade da recuperação, como o da ambigüidade. Como referencial teórico-metodológico para efetuar a análise e organização sintático-semântica de conteúdos, utilizam-se a Gramática de Valências de Borba e a teoria de Gráficos Conceituais de Sowa. Emprega-se um sistema de tratamento automático da linguagem natural – o Zstation – em um corpus constituído de documentos oficiais do Mercosul, para testes de desambiguação. Conclui-se que um sistema de recuperação da informação em linguagem natural pode solucionar determinados tipos de ambigüidades quando dispõe de informações relativas à valência sintático-semântica das unidades lexicais que compõem um enunciado. Os resultados obtidos demonstram ser possível introduzir procedimentos automáticos de solução de ambigüidades em sistemas de tratamento da linguagem natural.

Palavras-chave:  Recuperação da Informação; Tratamento Automático da Linguagem Natural; Ambigüidade; Valência Sintático-Semântica; Gráficos Conceituais

Abstract: TIssues relative to information extraction from complete texts and subsequent retrieval by means of automatic natural language treatment methods are discussed. Besides extracting words from the text, the relationship of significance that these words have in the context of the speech in which they occur is attempted to be preserved. An information retrieval system using natural language should be able to treat given linguistic phenomena that affect the quality of information, such as, for instance, the issues of ambiguity. The Valence Grammar and the Conceptual Graphics are used as theoretical and methodological. An automatic natural language treatment system – Zstation – is utilized, as well as a pool of official documents concerning the Mercosul, for the ambiguity solutions tests. The conclusion is reached that a natural language treatment system can solve certain types of ambiguities when information is available regarding the syntactic-semantic valence of the lexical units that compose an enunciation. The results obtained show that it is possible to introduce automatic procedures for solving ambiguities in a natural language treatment system.

Keywords: Information Retrieval; Document Analysis; Natural Language Processing; Ambiguity; Valence Grammar; Conceptual Graphs



 
Um Centro de Recursos para o Processamento Computacional do Português
A Resource Centre for the Computational Processing of the Portuguese Language
por Diana Santos

Resumo: Neste artigo apresento o Centro de recursos para o processamento computacional da língua portuguesa e o projecto Processamento computacional do português, mencionando as razões que levaram à sua criação e expondo os seus objectivos e actividade. Após explicar o que se entende por processamento computacional de uma língua e de que recursos se trata, apresento brevemente as três vertentes de trabalho já realizado ou em curso: a disseminação da área, a disponibilização de recursos e a avaliação.

Palavras-chave: Processamento de linguagem natural; Língua portuguesa; Recursos linguísticos; Serviços na rede; Avaliação; Corpora

Abstract: In this paper the newly created Resource Centre for the Computational Processing of the Portuguese Language and the Computational Processing of Portuguese project are introduced. It starts by motivating the creation of the center, and continues by explaining its goals and main activity. The natural language processing discipline (with an emphasis on applications) is then presented, with a description of what kind of resources it requires. The main bulk of the paper is devoted to an overview of the three different kinds of activity of the centre: dissemination, resource distribution, and evaluation.

Keywords: Natural language processing; Portuguese language; Linguistic resources; Services on the net; Evaluation; Corpora


A Imagem de Síntese como Novo Projeto Moral
The Image of Synthesis as a New Moral Project
por Marcelo Carlos Gantos

Resumo: Este artigo explora o advento do paradigma digital e suas  implicações  na formulação de um novo projeto moral no domínio cientifico. No ultimo decênio surgiram, no campo cultural, grandes transformações  resultantes da incorporação do fenômeno da imagem de síntese como ferramenta privilegiada na construção da discursividade contemporânea, principalmente, no universo das Ciências Humanas. Frente à imagem que funcionou como raiz da reprodutividade técnica ao longo do quase todo o século XX, impõe se nos  o desafio atual da informatização da palavra, da imagem e da ação comunicativa intertextual; voltando a se tornar crucial o problema dos valores. Isto nos conduz à questão  dos pontos de vista com os quais devemos controlar a produtividade e os riscos éticos resultantes das aplicações destas inovações. Nesse ponto, a revolução digital do final do século XX abre ilimitadas perspectivas mediante as inéditas possibilidades de seleção e reorganização (edição) da memória social e a História da humanidade, graças a uma mais potente síntese entre corpo e tecnologia, processo que vem modelando significativamente uma dimensão central da constituição política do presente.

Palavras-chave:  Imagem de síntese; Informatização da palavra; Projeto moral e informação

Abstract: This article explores the rise of the digital paradigm and its implications in the formulation of a new moral project in Science. In the last decade, great transformations appeared in Human Sciences as a result of the incorporation of the image synthesis phenomenon as a privileged construction tool in contemporary discourse. Because image has become the root of technical reproduction along the Twenty Century, the digitalisation of the word, image and the cross-textual communicative action became a crucial problem of values. This situation has led us to the question of how to control productivity and the resulting ethical risks arising from the application of technical innovations. At this point, the Digital Revolution of the Twenty Century, brought by a powerful synthesis between body and technology, opens limitless perspectives because of the new possibilities of selection and reorganization (through editing) of both Social Memory and Human History. Finally, we recognize that this process is modelling a central dimension of the present political constitution.

Keywords: Image of Synthesis; Word digitalization; Moral project and information