DataGramaZero - Revista de Ciência da Informação - v.7  n.4   ago/06                            ARTIGO 04

Una mirada en torno al desarrollo de la Recuperación de información [*]
Taking a look around the development of the Information Retrieval
por Franklin Marín Milanés e Alexeis Torres Velásquez






Resumen: Se realiza un esbozo del desarrollo de la Recuperación de Información como campo disciplinar, describiéndose dos de las posturas que han influenciado a este campo. Se presentan consideraciones sobre dos de los componentes que se deben tener en cuenta para una correcta recuperación de información y satisfacción de los usuarios: los lenguajes documentales y el profesional de la información. En el trabajo se ofrecen gráficos, conclusiones y referencias bibliográficas.
Palabras clave: Recuperación de información; Sistemas; Enfoque cognitivo; Lenguajes documentales; Profesional de la información.

Abstract: This is an overview of the development of de Information Retrieval as a disciplinary field, describing two of the outlooks which have made influence in this field. In this work, are presented considerations about two of the important components which are necessary to have a good information retrieval and users' satisfaction: the documentary language and the professional of the information. In the article graphics, conclusions and bibliography reference are presented.
Keywords: Information retrieval; Systems; Cognitive view-point; Documentary languages; Professional of the information.
 
 
 

El inicio del siglo XXI está definido por la creciente circulación de flujos de datos e información, lo que ha hecho que la sociedad en que vivimos se destaque por la inmensa cantidad de información que produce. Toda esta explosión informacional sobrepasa la capacidad de aprehensión normal de las personas. De ahí, que corresponde a las instituciones de información una correcta organización de la información, constituyendo esta uno de los pasos más importantes para efectivos procesos de búsqueda y recuperación de información (RI). Sin embargo, el término RI, aparece a mediados del siglo pasado y se puede considerar que es un término joven a pesar de sus cerca de 60 años.
 

Algunas precisiones necesarias

Un acercamiento histórico a los orígenes y desarrollo de la CI pudieran enmarcar a esta en dos etapas (Anexo 1). La primera denominada fundacional, que abarca el período desde la creación de este campo de conocimiento en 1962 hasta 197?  Y una etapa crítica que va desde 197? - 199? (Linares, 2004).

La etapa fundacional se identifica por el predominio del paradigma físico tanto en sus bases teóricas como prácticas, tratándose de desechar todo elemento subjetivo. El paradigma físico respondía al positivismo filosófico imperante en el ámbito científico de la época, el cual consideraba que "el conocimiento científico tiene una posición privilegiada, es universal y neutral y no está influenciado por los procesos sociales y cognoscitivos"[1]. Este paradigma se encontraba además estrechamente relacionado con la Teoría Matemática de la Comunicación de Shannon y con la Cibernética de Nobert Wiener.

Es a partir de los años '70 que se produce un giro en la construcción de conceptos y en el paradigma de la CI, comenzando la etapa crítica. Esta etapa va a desarrollarse bajo la influencia del  paradigma cognitivo y más recientemente por el paradigma social (Capurro, 2003).

En la etapa crítica la CI va a recibir la influencia de nuevas disciplinas, como la ciencia cognitiva, la lingüística, la psicología, etc. Esto provocó un cambio en la concepción que hasta el momento se tenía de sus objetos de estudio, Foskett aclara esta situación al plantear que la "disciplina surge de una fertilización cruzada de ideas que incluye el bello arte de la biblioteconomía, el nuevo arte de la computación, las artes de los nuevos medios de comunicación y aquellas ciencias como la psicología y lingüística, que, en sus formas modernas, tienen que ver directamente con todos los problemas de comunicación y la transferencia de conocimiento organizado"[2].

En esta etapa se trata de recuperar los elementos subjetivos de los usuarios para el diseño de sistemas de búsqueda y recuperación, esto en gran medida a partir de la influencia que tiene la Psicología con su "nueva perspectiva, el enfoque cognitivo, cuya idea del rescate del mundo interior del sujeto es de significativa importancia en el universo informacional" [3]. Es en esta etapa de la CI en la cual los problemas cognitivos juegan un rol determinante y marcan la pauta del posterior desarrollo de este campo y así lo resaltan investigadores como Saracevic, Hjørland, Belkin, Ellis, Ingwersen y otros.

A partir de este momento se aboga porque la disciplina debe "centrarse en el significado y en los entornos sociales de los usuarios y de los sistemas" [4].
 

La Recuperación de información en dos tiempos

La RI irrumpe en el escenario internacional en la década del ´50 del siglo XX, el término fue acuñado por Calvin Mooers. La RI desde sus inicios ha estado fuertemente ligada al desarrollo tecnológico, tanto en lo relacionado con las telecomunicaciones así como con la aparición de las primeras computadoras. La RI surge ante la incapacidad  de los medios existente hasta ese momento para hacerle frente a la explosión de información que se genera, una vez terminada la Segunda Guerra Mundial y comenzada la guerra fría (Saracevic, 1999).

La aparición de la CI como disciplina en 1962, al postular que se encargaría de todo lo relacionado con la información (su producción, almacenamiento, medios de transferencia, uso, etc.), incorpora a su campo a la Recuperación de Información, hasta ese momento concebida como una practica independiente.

El término RI es definido, en sus años fundacionales, como un espacio que "abarca los aspectos intelectuales de descripción de información y sus especificaciones para la búsqueda, además de cualquier sistema, técnica o instrumento que se utilice en la operación" [5]. A lo largo de su desarrollo el campo de la RI ha estado bajo la influencia de dos paradigmas o tendencias en sus prácticas, concepciones e investigaciones, los denominados:
 

* enfoque centrado en los sistemas
* enfoque centrado en los usuarios


Pese al cambio paradigmático que se produce con la aparición de los enfoques mencionados, se ha observado que, en el campo de la RI este proceso no siempre ha sido tajante, ya que en la actualidad aún persisten ambos paradigmas.
 

El enfoque centrado en los sistemas como expresión de la influencia del Paradigma físico.

Este enfoque, centrado en los sistemas, fue desarrollado por los padres fundadores del campo, Calvin Mooers, Mortimer Taube, James Perry, entre otros. La RI bajo la influencia de esta perspectiva que privilegia a los sistemas, "se concibe como una actividad estática [...], el usuario realiza un consulta y el sistema responde con un listado de documentos" [6]. De esta forma la RI se reduce a una actividad muy simple,  donde se obvian situaciones, como cuando la solicitud de información del usuario no se corresponde con el listado de documentos, en esos casos  se realiza un análisis hacia el interior del sistema. En este derrotero, ambas entidades, usuario y sistema, son vistas como unidades independientes. (Anexo 2)

Una de las experiencias ilustrativas de esta lectura, son las denominadas pruebas Cranfield, estas establecieron el principio de que los argumentos acerca  de la posibilidad de un sistema de recuperación alcanzara el éxito radicaba en que sus méritos tenían que ser empíricamente fundamentados, estableciendo de esta forma un enfoque experimental y empírico.  (Ellis, 1992).

Sin duda, se puede afirmar que las Purebas Cranfield fueron y aún son un modelo a seguir en el terreno de la RI, esta atracción de tales pruebas, parece descansar en que estas se proyectaban o diseñaban en "una situación similar a la de un laboratorio, libre de la contaminación de las variables operacionales,  el desempeño de los lenguajes de indización pudiera estudiarse de forma aislada."[7]

Es decir, estos test creaban una situación imaginaria o de laboratorio aislada de la realidad a la que se tenían que enfrentar los sistemas de recuperación, siendo esta una de las fallas que se le pudieran señalar a dicho enfoque. Se "tenía en mente un laboratorio donde se llevara a cabo una comprobación física o mecánica y no un laboratorio psicológico."[8]

En este enfoque su centro principal de atención es la construcción de sistemas, entendiendo por este a  "un conjunto de elementos que interactúan, [...] de sus interacciones surge un comportamiento como un todo. Por eso, es importante tener en cuenta que los sistemas presentan un cierto carácter de totalidad más o menos organizada" [9] y, en consecuencia, los sistemas que de forma particular trabajan con objetos informativos: bases de datos, documentos en diferentes soportes, datos, entre otras fuentes, es decir que trabajan con información, son denominados sistemas de información (SI); o lo que es igual, son "aquel conjunto de componentes interactuantes cuyo objetivo específico es transmitir información entre el generador y el receptor [...]. El sistema de información es un proceso" [10].

Necesariamente los SI tienen implícito un sistema de recuperación de información, estos últimos,  juegan un rol fundamental ya que en los mismos se desarrollan las técnicas de  planificación, construcción y gestión, uso y evaluación de los sistemas de descripción, catalogación, ordenación, clasificación, almacenamiento, comunicación y RI creada por el hombre. "De manera general los SRI conforman un sistema tridimensional, ya que se ocupan de los principios, métodos e instrumentos puestos en acción para la gestión del conocimiento humano desde una triple perspectiva: su representación, su organización y su comunicación" [11].

La principal analogía que realiza este enfoque es que los sistemas de recuperación de información deben ser vistos como un sistema físico, tanto en su naturaleza como en las diferentes técnicas o métodos que se utilicen para su estudio. (Ellis, 1992). Se "cconcebía los sistemas de recuperación de la información literalmente iguales a los sistemas físicos, donde  se consideraba apropiado  emplear  las pruebas física o mecánicas, pero  mejor que eso,  se consideraba legítimo suponer, y apropiado aplicar técnicas similares en su forma a las técnicas apropiadas para los sistemas físicos o mecánicos."[12]

En la actualidad el paradigma físico es el más establecido ya que ha logrado, desde sus concepciones,  resolver determinados problemas en la RI y además ha logrado llevar a la práctica y poner en marcha diversos sistemas. Sin embargo este punto de vista ha recibido disímiles críticas, las cuales principalmente recaen en el hecho de que este ignora el papel que desempeña el usuario. Algunas de las deficiencias que se le señalan al mismo son: la ausencia de técnicas de retroalimentación o la falta de estudio acerca del concepto de relevancia y de los aspectos cognitivos provenientes de los usuarios y lo que se puede considerar como un elemento fundamental, no se considera al usuario como parte del sistema (Saracevic, 1999).

Este modelo se mantuvo como dominante hasta el decenio de los ´70, a partir de esta fecha y reafirmándose en los ´80, "comienza a evolucionar una línea de razonamiento y de investigación diferente - una que se concentra en los extremos cognitivos, interactivos y contextuales de los procesos; enfoca a los usuarios, usos, contextos e integración con los sistemas" [13].

Sin embargo para sus seguidores este  punto de vista está lejos de desaparecer y plantean que el mismo aún tiene capacidad para plantear nuevos problemas de investigación a partir de sus concepciones. A pesar de esto es claro que este paradigma "no parece capaz de generar una estructura explicatoria poderosa que esté lo suficientemente cerca de las complejidades de la cognición."[14]
 

Un acercamiento necesario al prisma de lo cognitivo

El Enfoque Centrado en los usuarios no es resultado de un hecho al azar, sino que es producto de una revolución cognitiva que nace en la Psicología con su perspectiva de la Psicología Cognitiva y que se extiende a variadas disciplinas y campos de investigación.

La Psicología Cognitiva aparece como un intento de superación del modelo conductista y el enfoque fisicista de la ciencia, mostrando que la  conducta del individuo no está regulada directamente desde el exterior por el medio físico o social, sino, que los estímulos externos están mediatizados por la manera como el individuo organiza e interpreta los elementos de ese mundo externo.

El desarrollo de la Psicología Cognitiva constituye en verdad un redescubrimiento del factor social y humano, "modificándose el centro de interés que vuelve del estudio del comportamiento al estudio de la conciencia, del estudio de lo externo a las experiencias mentales; el hombre ya no es más, para esta concepción, una caja negra vacía que solo da respuestas, sino que aparece como un ser pensante, procesador de las informaciones que provienen del exterior" [15]. Este enfoque esta centrando en el por qué y en el cómo del comportamiento, a la vez que se intenta comprender la relación entre el exterior y el interior de los individuos.

La psicología cognitiva se ocupa entonces de los procesos a través de los cuales el individuo obtiene conocimiento del mundo y toma conciencia de su entorno. La demarcación del territorio académico de esta disciplina sufre una segmentación a su interior a la hora de realizar o concebirse en los planos teóricos y prácticos, observándose la existencia  de dos posturas. Una, denominada línea blanda la cual parte del supuesto de que el conocimiento humano es un proceso en constante construcción y una línea dura o versión fuerte inspirada en la "metáfora computacional" (Arbeláez, 2000)

La línea blanda centra su interés en el procesamiento de la información que realiza la mente humana y la relación de esta con el entorno social de los individuos, esta postura va a enfocarse en el procesamiento activo que el sujeto realiza de la información.

El segundo enfoque, línea dura o versión fuerte, defiende la analogía que el funcionamiento de la mente es igual al de un ordenador. Postulando que si la mente y el ordenador son sistemas que procesan la información de manera similar, se debe elaborar una teoría unificada de dicho procesamiento de la información, que abarque ambos sistemas. Por cuanto, si es más fácil estudiar los sistemas de inteligencia artificial que la mente humana, se debería explotar el estudio de los primeros para lograr conocer con mayor exactitud los segundos.
 

Un problema y dos miradas: La Ciencia cognitiva (CC) y el Cognitivismo

Si bien es cierto que el cognitivismo proviene de la psicología cognitiva en su versión fuerte, como una de las soluciones ante las inconsistencias dejadas por el conductismo, y la Ciencia Cognitiva es fruto de la confluencia  entre la psicología cognitiva, la inteligencia artificial (IA) y otras disciplinas. Ambos tienen como objetivo central el procesamiento de información y las formas más adecuadas en la obtención de conocimiento, así como la relación entre la mente humana y el ordenador. Es válido aclarar también, que los términos de CC y cognitivismo son usados de manera confusa por algunos autores, quienes tienden a llamar cognitivismo a la CC y viceversa, al igual que se le  iguala con el  enfoque  cognitivo. Esta confusión se debe a que ambos estudian similares procesos y objetos de estudio, además de tener en común algunos de sus padres fundadores.

El cognitivismo considera que operaciones simbólicas básicas como codificar, comparar, localizar, almacenar que pueden ser llevadas a cabo por ordenadores pueden dar cuenta de la inteligencia humana, por lo que lo importante es encontrar reglas comunes que ayuden a comprender como se producen estos procesos en los humanos (Arbeláez, 2000). A partir de la postura que el cognitivismo asume, este ha sido acusado de: dualista, mecanicista, metafórico, etc.

De manera general se puede decir que las investigaciones llevadas a cabo en la CC, tienen como objetivo la obtención de la inteligencia (conocimiento), definiendo los procesos de adquisición de conocimientos tanto naturales como artificiales y por el modo de constitución de esos conocimientos. Se encuentra por lo tanto en la intersección de varias disciplinas que se ocupan de estos procesos como son: Filosofía, Psicología Cognitiva, Lingüística, IA, Antropología y Neurociencia. Esta ciencia "tiene su énfasis en analizar todos los sistemas inteligentes, sean naturales o artificiales, sin asimilar la mente humana como un computador, sino que parte de la necesidad de encontrar un sistema formal de tipo computacional que pueda asemejarse lo mas posible a la manera que opera la mente humana" [16].

El concepto del procesamiento de información es para muchos uno de los temas centrales del cognitivismo y de la CC. La concepción del ser humano como procesador de información para el cognitivismo se basa en la aceptación de la analogía entre la mente humana y el funcionamiento de un ordenador ya que ambos procesan información (reciben, almacenan, localizan, etc.) y para este, si se logra entender como se procesa información en un ordenador se entendería como procesa información el cerebro humano. Por su parte la CC le otorga al procesamiento de información suma importancia, ya que para ella lo más importante es el conocimiento alcanzado mediante el ejercicio de las facultades mentales, lo que implica la existencia de un tipo de habilidad que solo puede ejecutarse con el procesamiento de información.
 

Socio - cognitivismo otra lectura de lo cognitivo.

El socio - cognitivismo (sc) surge como una variante del enfoque cognitivo ortodoxo y como una expresión de la denominada "línea blanda".  Este nuevo enfoque, además de tomar en cuenta el estudio interno del sujeto, se dedica también al estudio del contexto del individuo y las relaciones de este con su medio.

Este punto de vista lo que trata es de reorientar la unidad de estudio del nivel del individuo al nivel de las comunidades sociales o del conocimiento. "De este modo, el individuo como actor construye el conocimiento interno de los hechos, valores y procedimientos a través de la interacción progresiva entre su conocimiento interiorizado y su participación en el mundo exterior" [17].

Esta perspectiva de lo cognitivo entiende al conocimiento como resultado de un proceso de construcción o reconstrucción de la realidad, que tiene su origen en la interacción entre los individuos y el entorno (Hjørland, 1995).
Por tanto la idea central reside en que la elaboración del conocimiento constituye  una elaboración de modelos del mundo que rodea al individuo, a partir de la relación que mantiene este con el medio, lo cual a su vez es más que una simple descripción de la misma. Por último el enfoque (sc), "se construye sobre teorías de la cognición más socioculturales, pragmáticas y realistas. Representando una teoría alternativa a los fenómenos cognitivos" [18].
 

El enfoque centrado en los usuarios como expresión de la influencia del paradigma cognitivo.

Esta vertiente en las investigaciones en RI ha contado con diferentes vertientes o puntos de vistas. Por una parte se encuentra el punto de vista cognitivo más ortodoxo de los padres fundadores de esta vertiente, quienes se centraban únicamente en el sujeto (su mundo interior), y de otra parte, una mirada cognitiva desde una perspectiva más sociocultural (sin dejar de tener en cuenta el interior del sujeto,  incorporando las significantes socioculturales e históricas) (Anexo 3).

Este enfoque incluye al usuario como un elemento más del SRI y al incluir a este, incorpora  también al entorno del mismo. Los SRI, bajo este modelo, resultan efectivos y eficientes si previamente la información en ellos contenida ha sido organizada acorde a las exigencias y características de sus usuarios, a los que va dirigido el servicio. Esto se traduce en la selección de toda aquella información, que por determinadas características pueda resultar de importancia para la satisfacción de las demandas informativas de los usuarios. Bajo este postulado de tener a los usuarios del SRI como objetivo prioritario, se debe procesar y representar la información estudiando los procesos cognitivos de estos, lo cual humaniza al sistema de información, "...al mismo tiempo que condiciona el estudio de las distintas estructuras y procesos de la mente de los usuarios y su traducción a estructuras de contenidos informativos" [19].

A partir del estudio de los procesos cognitivos que se dan lugar en la mente de los usuarios, el sistema puede conocer la forma en que han ido conformando el esquema del mundo en que se desarrollan a partir de sus experiencias y necesidades, lo que consiste "en estructuras de conocimiento o estructuras cognitivas, que son determinadas  por el individuo y sus experiencias sociales / colectivas, su educación, etc." [20].

Este modelo, a diferencia del tradicional, "no se pone en marcha a partir del momento en que el usuario realiza una consulta al SRI, sino que comienza incluso antes de que se produzca la necesidad informativa del usuario. En este punto de vista se tiene en cuenta la extensa gama de factores implicados en el proceso de RI; especialmente aquellos aspectos que influyen en el estado cognitivo y contextual del individuo, por ejemplo, su estado anímico, sus creencias, los objetivos planteados, su grado de motivación o sus áreas de interés, entre otros" [21].

El paradigma cognitivo en la RI provoca que sean retomados conceptos tales como necesidad de información o el concepto propio de usuario, los cuales son examinados desde otras miradas. En el caso de las necesidades de información, para la determinación de las mismas, se utilizarán métodos interpretativos, subjetivos y de carácter flexible, con la utilización de estos métodos se obtendrán las realidades objetivas de los usuarios y por ende de sus necesidades (Hjørland, 2002). Por su parte el usuario es comprendido como un sujeto cognoscente, con una formación histórico - cultural con la cual interactúa y la cual percibe (Hjørland, 1995).

Según Watters y Shepherd (1994, p. 457) en Hjørland (1995): "Mediante un paradigma centrado en el usuario nos referimos al acceso a la información guiado no por la estructura de la base de datos en el sistema, sino, más bien, por los criterios de las bases de datos que se necesitan para satisfacer una necesidad de información  como se percibe por el usuario. De este modo, el usuario define de manera dinámica el tipo, la cantidad y la estructura de los datos requeridos para satisfacer una necesidad de información".

Bajo esta vertiente centrada en los usuarios, "el objetivo de la recuperación de información es suministrar información que pueda ser un suplemento para las condiciones mentales humanas conscientes o inconscientes en una situación dada" [22]. Desde este enfoque  se han desarrollado diversidad de sistemas, por ejemplo el modelo desarrollado por Peter Ingwersen, conocido como Recuperación de Información Interactiva (RII), y el Modelo Estratificado, elaborado por Tefko Saracevic.

En el modelo desarrollado por Ingwersen se integran varios de los elementos que tienen lugar en la RI, tanto los relacionados con los procesos cognitivos que influyen y tienen lugar en los usuarios, así como los elementos propios del sistema. Para Ingwersen "la tarea de recuperación de información consiste en armonizar las estructuras cognitivas de los autores, [...] los trabajadores de la información [mecanismo intermediario] y el usuario, con el fin de hacerle frente a la necesidad real de información" [23]. Es decir, los procesos cognitivos que se desarrollan tanto en los autores, trabajadores de la información y usuarios deben ser tenidos en cuenta y analizados para un mejor funcionamiento de los SRI. (Anexo 4)

El autor de este modelo propone lo que para él son cinco elementos fundamentales en la RI, estos son: el usuario,  la interfaz, el entorno, el propio sistema de recuperación y los documentos. Como se puede ver este modelo "no sólo tiene en cuenta al usuario, sino que de este incorpora su estado cognitivo, contextual y anímico, su necesidad informativa y el nivel de incertidumbre provocado por el ASK (estado anómalo del conocimiento), y además analiza como interactúa el sujeto con el  resto de los componentes del sistema para satisfacer esa necesidad de información" [24].

Saracevic, en su Modelo Estratificado, defiende la idea de que la RI bajo el prisma centrado en los usuarios, debe caracterizarse por observar a los SRI con los que interactúan los usuarios como sistemas de comunicación, el Modelo Estratificado es uno de los que más se acerca a esta concepción (Ver figura # 5 - Anexo 5) El autor de este modelo propone que la RI es un proceso más dentro de la interacción hombre - máquina. Prioriza la existencia del término interacción, para una mejor comprensión del vocablo:"una interacción es un diálogo con el fin de cambiar el estado de conocimiento de uno o más participantes" [25]. El modelo estratificado en todo momento tiene presente el proceso de interacción y expone que aquellos modelos que no lo hacen, continúan perteneciendo a la RI bajo una mirada centrada en los sistemas (Saracevic, 1998). Este modelo está muy relacionado con la lingüística y la comunicación. Los elementos principales de este son:
 

* El sistema: SRI, el equipo informático (el hardware y el software).
* La interfaz y el usuario: Estructuras cognitivas y aspectos contextuales inherentes al propio usuario y al entorno en que se mueve.


La interfaz es la que posibilita que la RI se lleve a cabo mediante un proceso de comunicación, siendo esta la intermediaria entre los dos extremos, propiciando la comunicación (escrita, visual, gestual y cognitiva) entre ambos (SRI y usuario). Es por ello que la interfaz se reviste de suma importancia, lo misma va a ser diseñada con el auxilio de la lingüística o más bien LD. Una de las funciones de los LD es la de crear representaciones de la información contenida en el SRI, de tal forma que el usuario sea capaz de acceder a esa información. Se puede decir que los LD juegan un papel de facilitadores en la comunicación efectiva entre los autores / indizadores y los intermediarios / usuarios (Jacob & Shaw, 1998).

De lo que se trata en estos puntos de vistas de la RI es que el sistema  se va a encontrar afectado por el medio ambiente que le rodea, entendiéndose por  medio ambiente todos aquellos aspectos, tanto materiales como sociales que afectan y a los usuarios como elemento de estos. De ahí la importancia de tenerlos en cuenta, (ambiente y usuarios) a la hora del diseño del mismo, ya que los usuarios logran recuperar información con el auxilio de los procesos mentales y la relación de estos con los contextos sociales y culturales.

El proceso de RI que desarrollan los usuarios es mucho más complejo de lo que se puede pensar, debido a lo subjetivo que se torna el mismo, sobre todo por la presencia de significantes culturales; estas hacen que cada usuario sea un caso específico y diferente del resto, incluso el mismo usuario al interactuar con el SRI en diferentes momentos puede presentar necesidades y motivaciones diferentes, ya que las estructuras de conocimiento de los mismo se encuentran en una constante transformación. (Faúndez, 2004).

A modo de comparación la RI centrada en el sistema es evaluada bajo expresiones cuantitativas, con la premisa de que un correcto procesamiento de la información basado en un correcto uso de los LD, es aquella que permite la entrega de un mayor número de documentos relevantes en el menor tiempo posible. Por su parte la RI centrada en los usuarios es evaluada bajo expresiones cualitativas, respondiendo de manera general al mayor acercamiento posible entre la cantidad de documentos relevantes respecto a la cantidad de documentos pertinentes, pertinencia que se traduce en un nuevo conocimiento, porque la información obtenida ha sido capaz de modificar el estado actual del conocimiento del usuario.

A la hora de evaluar los SRI dentro de la RI hay dos conceptos claves: relevancia y pertinencia. Saracevic plantea que el término relevancia en la RI debe ser comprendido como "el atributo o criterio que refleja la efectividad del intercambio de información entre las personas (i.e. usuarios) y de los sistemas de recuperación de información en los contactos comunicativos, basado en la valoración de las personas" [26]. Esta visión evidencia que el concepto de relevancia es en gran medida subjetivo a partir del criterio del usuario, ya que solo este puede juzgar el tipo de información que ha recuperado.

El término relevancia ha estado presente en las investigaciones de RI desde sus inicios, el mismo ha sido utilizado para la evaluación de los SRI. Bajo la premisa centrada en los sistemas, esta es medida a partir de que la cantidad de documentos solicitados por el usuario y la cantidad de documentos entregados por el sistema se equiparen, es decir, el término relevancia es tratado desde un punto de vista cuantitativo. En la perspectiva centrada en los usuarios, la relevancia, se mide desde una  óptica cualitativa. Aunque también se van a tener en cuenta los parámetros utilizados en el enfoque tradicional, en esta nueva mirada se va a priorizar si los documentos entregados a los usuarios son capaces de transformar las estructuras de conocimientos de los mismos para que se pueda crear un nuevo conocimiento. Esto es entendido para Saracevic como relevancia cognitiva, que "es la relación entre el estado del conocimiento y la necesidad cognitiva de información del usuario, y los textos recuperados, los ficheros de un sistema o los existentes. La correspondencia cognitiva, informatividad, novedad, calidad de la información, entre otros, son, los criterios por los cuales la relevancia cognitiva (pertinencia) es deducida" [27].

La pertinencia se encuentra implícita como una variante más de relevancia, hay que partir de que para que un documento sea pertinente en la RI, necesariamente tiene que haber sido en primer lugar relevante para que haya sido recuperado; lo que no obliga a que todo documento relevante sea pertinente, pues solo aquella información que sea capaz de modificar las estructuras de conocimiento del usuario puede ser considerada pertinente.
 

 Lenguajes documentales

En todo SRI, además de los usuarios y la información que por este circula, juegan un papel clave los LD a través de los cuales va a ser representada la información contenida en el sistema y el usuario accede a la información.

Los LD han estado ligados al propio desarrollo de las instituciones informativas, en la medida que el desarrollo de la propia humanidad ha ido alcanzando niveles mayores de complejidad, hay un mayor caudal de información especializada, y por tanto más complejas han sido las necesidades de información de los usuarios en el momento de la RI. Para que se desarrolle la RI en un SRI, se debe hacer uso de los LD, que son los encargados de construir las interfaces a las que hacen alusión tanto Ingwersen como Saracevic  en sus modelo de RI.

El lenguaje puede ser entendido como un: "sistema de señales de cualquier naturaleza física que cumple una función cognitiva y una función comunicativa en el proceso de la actividad humana [...] siendo la forma de existencia y de expresión del pensamiento" [28].

Por su parte, los LD, se pueden conciben como un "sistema de símbolos, destinados a expresar el contenido material de los documentos, que constituye una parte integrante independiente y una variable de un sistema de búsqueda informativa" [29]. Estos han ido evolucionando como consecuencia de la evolución del propio conocimiento humano y de los contextos y escenarios culturales en los que se ha desarrollado el conocimiento.
Los LD son los encargados de representar y hacer transparentes todas las tareas que se llevan a cabo con la información durante su ciclo de vida para que el usuario en el momento de su interacción con el SRI, lleve a cabo una RI efectiva y pueda satisfacer su necesidad de información (Anexo 6).

A partir de los LD lo que se crea es una metainformación, (información sobre información), o sea, la información que describe o explica otra información. Como se aprecia en la figura # 6 - Anexo 6. La información atraviesa por un ciclo de vida, al igual que un ser vivo, todas estas fases del ciclo de vida van a tener una determinada influencia en la nueva información que entra en el SRI. Lo que persigue es que la información procesada (documento) pueda ser recuperada eficientemente por el usuario, pero para ello esta debe ser representada (Anexo 7). En este proceso de representación, los LD son los encargados de traducir el contenido semántico de los documentos a un lenguaje artificial y especializado que brinde información sintética o analítica sobre el mismo (Vizcaya, 2003). En esta etapa de la CI,  los LD van a ser creados pensando en los usuarios, solo así se podrá lograr una representación de información acorde a las necesidades de los mismos.

La representación de la información desde  el punto de vista centrado en los usuarios aboga por alcanzar niveles superiores de expresión, en consonancia con su propia realidad,  que no es otra que la de representar un conocimiento transformado. Se trata no solo de responder la demanda del usuario con la entrega de la información solicitada, sino también la de brindarle al mismo una orientación adecuada en dependencia del contexto social y los antecedentes culturales en los que se ha desarrollado el usuario. Una mayor expresión de los LD le permitirá al usuario navegar con precisión dentro del ya súper complejo mundo de las interrelaciones entre los diferentes campo del saber. Las crecientes necesidades de información que presentan a diario los usuarios, solo podrán ser satisfechas en la medida que los SRI desarrollen leguajes, en los que se fundamente la representación de la información procesada, acorde no solo con la propia ciencia que se representa, sino que sobre todo tengan en cuenta las características cognitivas del universo de usuarios a los que va dirigido.

El papel que la información desempeña en la sociedad actual sobrepasa la simple necesidad de saberla seleccionar, procesar, almacenar, recuperar y diseminar como se ha venido haciendo bajo el enfoque centrado en los sistemas. La RI centrada en los usuarios aboga porque estas etapas del ciclo de vida de la información sean vistas desde una holística superior que permita, dado el caudal desmesurado de información existente, representar esa propia información de forma tal que no solo sirva para que el usuario la identifique rápidamente, sino para que también este sepa orientar su propio desconocimiento y se encamine por todo un sistema de inferencias. Si algo se debe tener presente bajo la visión de este paradigma es que "cada deseo de información debe representarse en una variedad de formas convenientemente relacionadas que puedan ser percibidas por un mecanismo intermediario y pueda aplicarse al espacio de información. Este requerimiento exige la navegación interactiva y / o la interrogación del sistema que está estructurado al conocimiento del usuario real, al menos, a los grupos potenciales de usuarios que pudieran investigar el sistema" [30].

La clave de la representación en esta etapa, es lograr extraer del documento con el auxilio de los LD, aquella información contenida en él que pueda ser de utilidad para los usuarios, pero no solo en el momento en que el usuario está interactuando con el sistema, sino realizar un representación de la información que sea capaz de representar las necesidades futuras de los usuarios y las posibles relaciones interdisciplinares (Jacob & Shaw, 1998).

Una de las tendencias en la elaboración de los LD en la actualidad, es la de lograr el mayor acercamiento posible entre los lenguajes artificiales y el lenguaje natural empleado por los usuarios. Esto se debe a que en ocasiones no existe una correspondencia entre los LD y el lenguaje natural, provocando que los usuarios no sean capaces de expresar en términos de un lenguaje artificial su necesidad de información. "Puesto que la equiparación está limitada a los términos del lenguaje natural seleccionados, no hay seguridad alguna de que los términos provenientes de textos potencialmente relevantes se equiparen a los términos usados por quien realiza la búsqueda, o de que la equiparación de los términos se refiera realmente al concepto pensado" [31].

Se ha de tener en cuenta que el lenguaje natural es el utilizado por los productores (autores) para dar a conocer los resultados de sus investigaciones,  y a su vez la información recuperada con niveles de pertinencia modifica el estado actual del conocimiento del usuario sobre la temática en cuestión. Esto nos obliga a retomar el concepto de conocimiento, ya que el lenguaje es la forma en que se expresa el pensamiento y en este último es donde se forman los conceptos que dan lugar posteriormente al conocimiento. De ahí que, a través del lenguaje se va desde el dato al conocimiento pasando por la información (Vizcaya, 2003). Es decir, los datos aislados (información potencial) que se encuentran en un SRI X, interactúan con el  usuario mediante los LD, lo que le posibilita acceder a la información y esta información logra transformar las estructuras de conocimiento del individuo a través del lenguaje natural, generando una nueva estructura del conocimiento. Esto perfila uno de los problemas de la RI que se materializa en la relación que se da entre: DATO - INFORMACIÓN - CONOCIMIENTO.

Esto hace mucho más evidente la relación que existe entre: INFORMACIÓN - CONOCIMIENTO / LENGUAJE - PENSAMIENTO. La profesora Dolores Vizcaya, nos ayuda a comprender esta relación cuando apunta: "...de la misma manera que el conocimiento se produce solo a través del pensamiento y se constata en la práctica como forma de completar una abstracción, la información se produce solo a través del lenguaje como manera de materializar algo que etimológicamente está implícito en el propio término información y que no es otra cosa que algo que da forma y que la adquiere a través del lenguaje" [32]
 

 El papel del profesional de la información (PI)

La RI centrada en los usuarios se nutre de un alto componente subjetivo, pues no solo se tienen presentes los matices subjetivos en el proceso de interacción usuario - SRI, sino también los elementos subjetivos presentes en los PI; estos son seres humanos, y por ende en su manera de procesar y representar la información también están implícitas sus maneras y concepciones de ver al mundo, su contexto social, sus experiencias...etc.

Si estudiar los elementos subjetivos de los usuarios significa una labor difícil, también lo es estudiar a este profesional, quien está condicionado por  ideologías que están presentes en sus labores y rutinas productivas.

La era de los grandes enciclopedistas ya no existe. En aquella época los campos de conocimientos no habían alcanzado el desarrollo y la diversidad actual, lo que le permitía a los informadores de entonces, un mayor dominio de los campos de saberes. En la actualidad hablar de especialización se torna imposible y por ello los actuales PI, tienen la ardua labor de manejar difíciles herramientas que les permitan  brindar servicios de información a la altura de las necesidades de sus usuarios.

Hablar del papel del PI dentro de los SRI, obliga a hablar de un profesional que debe fungir como: comunicador social,  sociólogo,  lingüista y en uno que otro momento como psicólogo, etc. Si bien este escenario multi o pluri disciplinar, hace que la profesión que desempeñan los PI sea un poco compleja, es a su vez, lo que la hace diferente a las demás y con un alto valor de creatividad.

Ser PI y funcionar como tal bajo un enfoque centrado en los usuarios, significa  poseer una capacidad de razonamiento que posibilite reducir las grandes complejidades presentes en el proceso de RI. "Sus armas metodológicas deben ser guiadas por la revisión crítica de los fenómenos bajo estudio,  [...] que le permitirán lograr diversas interconexiones entre los flujos de información en los que trabaje" [33].

En el paradigma cognitivo de la RI, no se trata solo de tener en cuenta los aspectos cognitivos de los usuarios, sino también de los autores de los documentos y de los profesionales de la información (indizadores, catalogadores, referencistas, etc.) (valores, cultura profesional, técnicas de redacción, personalidad, ideología, conciencia, etc.) (Anexo 8). Se tomarán en cuenta los procesadores, debido a que estos son los encargados de extraer de los documentos aquella información útil para los usuarios, y se puede afirmar que la "percepción del potencial de un documento depende del preconocimiento de la persona que determina la materia" [34].

En el proceso de representar la información, varios son los factores que van a influir para que el PI determine si una información es relevante o no y qué categoría se le debe asignar a la misma. Entre estos factores que influyen se pueden mencionar: su edad, formación ideológica, nivel profesional, medio social en el que se desenvuelve, conocimiento que tenga de los usuarios que visitan a la institución, etc. Es así como es el PI "quien identifica los términos que él o ella considera más indicativos del contenido conceptual del texto" [35].

El espectro de conocimiento del PI debe ser lo suficientemente amplio como para saber cuando extraer un posible término relevante de un documento, o para crear las relaciones necesarias entre diferentes campos. Además debe tener en cuenta que lo que resulta útil en un determinado contexto, no necesariamente es útil en otro. Esta tarea le será más fácil de llevar a cabo en la medida en que conozca mejor a su comunidad usuaria, (dígase sus intereses, técnicas para RI, inclinaciones, etc.), y al medio en que esta se desenvuelve. Es así como la representación de la información debe centrarse en los fundamentos sociales del conocimiento (Jacob & Shaw, 1998).

El PI debe ver lo que los demás no ven, al interactuar con el documento, este debe ser capaz de equiparar el conocimiento que tiene del autor con el conocimiento que tiene de los futuros usuarios de ese documento (Hjørland, 1992)
 

Conclusiones

La recuperación de información ha estado signada por dos posturas fundamentales: un enfoque centrado en los sistemas y un enfoque centrado en los usuarios. En el primero se prioriza la impecabilidad de los sistemas desde un punto de vista tecnológico, el ruido que se tiene en cuenta es aquel que puede tener lugar hacia el interior del sistema. El segundo (el enfoque centrado en los usuarios), incluye al usuario como un elemento más del sistema; se tienen en cuenta los elementos subjetivos provenientes, además de los usuarios, de los profesionales de la información y de los creadores de los documentos.

 Las principales diferencias entre la RI centrada en los sistemas y la RI centrada en los usuarios son:
 

* Los usuarios se conciben como un componente más del SRI, por lo que es necesario su estudio y el del entorno en el que se desenvuelven.

* El término relevancia como indicador para la evaluación de los SRI es vista desde una dimensión más cualitativa. Sólo aquellos documentos que modifiquen las estructuras de conocimiento de los usuarios pueden ser considerados realmente relevantes, esto es conocido como relevancia cognitiva.

* La representación de la información contenida en los SRI, que es llevada a cabo a través de los LD, tiende a acercarse más a las realidades concretas de los usuarios para lograr una mayor comunicación entre el SRI y los usuarios. En la construcción de los LD existe una tendencia a acercarse más al lenguaje natural para una mejor representación de la información contenida en los documentos y una mejor decodificación por parte de los usuarios.

* Al estudiar los aspectos cognitivos y socioculturales, no se restringe solo al estudio de estos aspectos en los usuarios, sino también se deben incluir a los PI y a los creadores de los documentos.



Anexo 1

Anexo 2


 

Anexo 3


 

Anexo 4


 

Anexo 5


 

Anexo 6


 
 

Anexo 7


 
 
 

Anexo 8


 




Notas e Referências Bibliográficas

[*] El artículo que se presenta a continuación forma  parte de los temas tratados en su tesis de pregrado, titulada El paradigma cognitivo en la Ciencia de la Información. Asimismo, fue publicado su artículo La información en la Ciencia de la Información; tras las huellas de un concepto, en la revista cubana ACIMED. Este artículo también fue una síntesis de lo plasmado en la mencionada tesis de pregrado.

[1] ØROM, Anders. "Information Science, Historical Changes and Social Aspects: A Nordic Outlook". Journal of Documentation. 2000, vol. 56, num. 1. p. 15.

[2] FOSKETT, D. J.  Ciência da informação como disciplina emergente; implicações educa-cionais.  Ciência da informação ou Informática?,  1980. p. 53-69. Citado por: RIBEIRO PINHEIRO, Lena Vania; MATHEUS LOUREIRO, José Mauro. Tratados y Límites de la Ciencia de la Información. Ciencia da Informação. Vol 24, (1), 1995, p.3.

[3] LINARES COLUMBIÉ, Radamés. "La Ciencia de la Información y sus matrices teóricas: Contribución a su historia". [Tesis de Doctorado]. Universidad de la Habana, Facultad de Comunicación. 2003. p.95.

[4] HJØRLAND, Birger. "Documents, Memory Institutions and Information Science". Journal of Documentation. 2000, vol. 56, num. 1, p. 30.

[5] SARACEVIC, Tefko. "Information Science". Journal of Documentation. 1999, vol. 50, num. 12, p. 1056.

[6] VARGAS - QUESADA, Benjamín; MOYA ANEGÓN, Félix de; OLVERA LOBO, María Dolores. "Enfoques en torno al modelo cognitivo para la recuperación de información: análisis crítico". Ciência da informação. 2002, vol.32, num.2, p.107.

[7] CLEVERDON, C.W. ...Factors determining the performance of indexing systems. volumen 1: Design. Cranfield: College of Aeronautics, 1966. EN: ELLIS, David. "The Physical and Cognitive Paradigms in Information Retrieval Research."Journal of Documentation. 1992, vol. 48, num. 1, s.p

[8] ELLIS, David. "The Physical and Cognitive Paradigms in Information Retrieval Research."Journal of Documentation. 1992, vol. 48, num. 1, s.p

[9] PONJÚAN DANTE, Gloria; et. al. Sistemas de información: Principios y aplicaciones. Ciudad de la Habana: Félix Varela, 2004. p.8.

[10] DÍAZ FERREIRA, Carlos Newton. Sistemas de Almacenamiento y Recuperación de Información (Tomo I). Ciudad de la Habana: Universidad de la Habana, Facultad de Artes y Letras, Departamento de Información Científico - Técnico y Bibliotecología, 1982. p.18.

[11] ESTEBAN NAVARRO, Miguel Ángel; GARCÍA MARCO, Francisco Javier. "Las primeras jornadas sobre la organización del conocimiento: Organización y Conocimiento e Información Científica". Scire. 1995, vol. 1, num. 1, p. 149. EN: VIZACAYA ALONSO, Dolores; et, al. Selección de lecturas Fundamentos de la Organización de la Información. Ciudad de la Habana: [s.e], 2002. p. 3.

[12] Op. Cit [11]

[13] Op. cit. [5], p. 1057.

[14] Op. cit [11]

[15] GUIJARRO, José Luis. "Giro copernicano en los estudios humanísticos". Pragmalingüística II [en línea]. 1994 [ref. 5 julio 2004], p. 217 - 265. Disponible en Internet: <http://www.infonegocio.com/joseluisguijarro/Giro%20copernicano.htm>

[16] ARBELÁEZ GÓMEZ, Martha Cecilia. La cognición: Perspectivas teóricas. Revista de Ciencias Humanas [en línea]. 2000, num. 22. [ref. 20 mayo 2004]. Disponible en Internet: <http://www.chumanas.utp.edu.co>

[17] JACOB, Elin K ; SHAW, Debora. "Sociocognitives Perspectives on Representation". Annual Review for Information Science and Technology. 1998, vol. 33. num. 41, p.140

[18] HJØRLAND, Birger. "Toward a New Horizon in Information Science: Domain Analysis". Journal of the American Society for Information Science. 1995, vol. 46, num. 6 p 412.

[19] IZQUIERDO ALONSO, Mónica. "Una aproximación interdisciplinaria al estudio de usuarios de información: bases conceptuales y metodológicas". Investigación Bibliotecológica. 1999, vol. 13, num.26, p. 17.

[20] INGWERSEN, Peter. Information Retrieval Interaction. London: Taylor Graham, 1992.  246 p. ISBN: 0-947568-54-9.

[21] Op. cit. [6], p. 108.

[22] Op. cit. [20].

[23] Ibídem.

[24] Op. cit. [6], p. 109.

[25] Op. cit. [6],  p.113.

[26] Op. cit. [5], p. 1060.

[27] Op. cit [5], p. 1061.

[28] ROSENTHAL, M; IUDIN Y P. Diccionario filosófico. Ciudad de la  Habana: Editora Política, 1981. p. 265.

[29] MELTON, J. A. A use for the techniques of structural linguistic in documentation research. Citado por: VIZCAYA ALONSO, Dolores. Información: procesamiento y contenido. Ciudad de la Habana: Editorial Félix Varela, 2003. p. 69.

[30] Op. cit [20].

[31] Op. cit. [17], p. 149.

[32] VIZCAYA ALONSO, Dolores. Lenguajes documentarios. Argentina, Rosario: Nuevo Paradigma, 1997. p.24.

[33] FAÚNDEZ, Ulises A. Análisis de información: características - metodologías - proyecciones. [en línea]. Chile [ref. de 3 de noviembre de 2004]. Disponible en Web: <http://www.faf.org/rp/world/chile/faundez.html>

[34] HJØRLAND, Birger. "The concept of subject in Information Science". Journal of Documentation. 1992, vol. 48, num. 2, p. 187.

[35] Op. cit [17], p. 154.
 


Sobre os autores / About the Authors:

Franklin Marín Milanés
marin@fcom.uh.cu
angel.silva@crew.cubana.avianet.cu

Licenciado en Bibliotecología y Ciencia de la Información de la Universidad de La Habana.
Actualmente, profesor de la carrera de Bibliotecología y Ciencia de la Información de la Facultad de Comunicación de la Universidad de La Habana;
cursa la Maestría en Ciencia de la Información impartida en la propia facultad.

Dirección postal de contacto:
Calle 198, No. 27317, e/ 277 y final, Panamérica, Municipio Boyeros, Ciudad de La Habana, Cuba. CP: 19220


Alexeis Torres Velásquez
Departamento de Gestión de la Calidad, Ministerio del Turismo, Cuba.