Resumen: Se realiza un esbozo del desarrollo de
la Recuperación de Información como campo disciplinar, describiéndose
dos de las posturas que han influenciado a este campo. Se presentan consideraciones
sobre dos de los componentes que se deben tener en cuenta para una correcta
recuperación de información y satisfacción de los
usuarios: los lenguajes documentales y el profesional de la información.
En el trabajo se ofrecen gráficos, conclusiones y referencias bibliográficas.
Palabras clave:
Recuperación de información;
Sistemas; Enfoque cognitivo; Lenguajes documentales; Profesional de la
información.
Abstract: This is an overview of the development
of de Information Retrieval as a disciplinary field, describing two of
the outlooks which have made influence in this field. In this work, are
presented considerations about two of the important components which are
necessary to have a good information retrieval and users' satisfaction:
the documentary language and the professional of the information. In the
article graphics, conclusions and bibliography reference are presented.
Keywords: Information retrieval; Systems; Cognitive
view-point; Documentary languages; Professional of the information.
El inicio del siglo XXI está definido por la creciente circulación
de flujos de datos e información, lo que ha hecho que la sociedad
en que vivimos se destaque por la inmensa cantidad de información
que produce. Toda esta explosión informacional sobrepasa la capacidad
de aprehensión normal de las personas. De ahí, que corresponde
a las instituciones de información una correcta organización
de la información, constituyendo esta uno de los pasos más
importantes para efectivos procesos de búsqueda y recuperación
de información (RI). Sin embargo, el término RI, aparece
a mediados del siglo pasado y se puede considerar que es un término
joven a pesar de sus cerca de 60 años.
Algunas precisiones necesarias
Un acercamiento histórico a los orígenes y desarrollo de la CI pudieran enmarcar a esta en dos etapas (Anexo 1). La primera denominada fundacional, que abarca el período desde la creación de este campo de conocimiento en 1962 hasta 197? Y una etapa crítica que va desde 197? - 199? (Linares, 2004).
La etapa fundacional se identifica por el predominio del paradigma físico tanto en sus bases teóricas como prácticas, tratándose de desechar todo elemento subjetivo. El paradigma físico respondía al positivismo filosófico imperante en el ámbito científico de la época, el cual consideraba que "el conocimiento científico tiene una posición privilegiada, es universal y neutral y no está influenciado por los procesos sociales y cognoscitivos"[1]. Este paradigma se encontraba además estrechamente relacionado con la Teoría Matemática de la Comunicación de Shannon y con la Cibernética de Nobert Wiener.
Es a partir de los años '70 que se produce un giro en la construcción de conceptos y en el paradigma de la CI, comenzando la etapa crítica. Esta etapa va a desarrollarse bajo la influencia del paradigma cognitivo y más recientemente por el paradigma social (Capurro, 2003).
En la etapa crítica la CI va a recibir la influencia de nuevas disciplinas, como la ciencia cognitiva, la lingüística, la psicología, etc. Esto provocó un cambio en la concepción que hasta el momento se tenía de sus objetos de estudio, Foskett aclara esta situación al plantear que la "disciplina surge de una fertilización cruzada de ideas que incluye el bello arte de la biblioteconomía, el nuevo arte de la computación, las artes de los nuevos medios de comunicación y aquellas ciencias como la psicología y lingüística, que, en sus formas modernas, tienen que ver directamente con todos los problemas de comunicación y la transferencia de conocimiento organizado"[2].
En esta etapa se trata de recuperar los elementos subjetivos de los usuarios para el diseño de sistemas de búsqueda y recuperación, esto en gran medida a partir de la influencia que tiene la Psicología con su "nueva perspectiva, el enfoque cognitivo, cuya idea del rescate del mundo interior del sujeto es de significativa importancia en el universo informacional" [3]. Es en esta etapa de la CI en la cual los problemas cognitivos juegan un rol determinante y marcan la pauta del posterior desarrollo de este campo y así lo resaltan investigadores como Saracevic, Hjørland, Belkin, Ellis, Ingwersen y otros.
A partir de este momento se aboga porque la disciplina debe "centrarse
en el significado y en los entornos sociales de los usuarios y de los sistemas"
[4].
La Recuperación de información en dos tiempos
La RI irrumpe en el escenario internacional en la década del ´50 del siglo XX, el término fue acuñado por Calvin Mooers. La RI desde sus inicios ha estado fuertemente ligada al desarrollo tecnológico, tanto en lo relacionado con las telecomunicaciones así como con la aparición de las primeras computadoras. La RI surge ante la incapacidad de los medios existente hasta ese momento para hacerle frente a la explosión de información que se genera, una vez terminada la Segunda Guerra Mundial y comenzada la guerra fría (Saracevic, 1999).
La aparición de la CI como disciplina en 1962, al postular que se encargaría de todo lo relacionado con la información (su producción, almacenamiento, medios de transferencia, uso, etc.), incorpora a su campo a la Recuperación de Información, hasta ese momento concebida como una practica independiente.
El término RI es definido, en sus años fundacionales,
como un espacio que "abarca los aspectos intelectuales de descripción
de información y sus especificaciones para la búsqueda, además
de cualquier sistema, técnica o instrumento que se utilice en la
operación" [5]. A lo largo de su desarrollo
el campo de la RI ha estado bajo la influencia de dos paradigmas o tendencias
en sus prácticas, concepciones e investigaciones, los denominados:
Pese al cambio paradigmático que se produce con la aparición
de los enfoques mencionados, se ha observado que, en el campo de la RI
este proceso no siempre ha sido tajante, ya que en la actualidad aún
persisten ambos paradigmas.
El enfoque centrado en los sistemas como expresión de la influencia del Paradigma físico.
Este enfoque, centrado en los sistemas, fue desarrollado por los padres fundadores del campo, Calvin Mooers, Mortimer Taube, James Perry, entre otros. La RI bajo la influencia de esta perspectiva que privilegia a los sistemas, "se concibe como una actividad estática [...], el usuario realiza un consulta y el sistema responde con un listado de documentos" [6]. De esta forma la RI se reduce a una actividad muy simple, donde se obvian situaciones, como cuando la solicitud de información del usuario no se corresponde con el listado de documentos, en esos casos se realiza un análisis hacia el interior del sistema. En este derrotero, ambas entidades, usuario y sistema, son vistas como unidades independientes. (Anexo 2)
Una de las experiencias ilustrativas de esta lectura, son las denominadas pruebas Cranfield, estas establecieron el principio de que los argumentos acerca de la posibilidad de un sistema de recuperación alcanzara el éxito radicaba en que sus méritos tenían que ser empíricamente fundamentados, estableciendo de esta forma un enfoque experimental y empírico. (Ellis, 1992).
Sin duda, se puede afirmar que las Purebas Cranfield fueron y aún son un modelo a seguir en el terreno de la RI, esta atracción de tales pruebas, parece descansar en que estas se proyectaban o diseñaban en "una situación similar a la de un laboratorio, libre de la contaminación de las variables operacionales, el desempeño de los lenguajes de indización pudiera estudiarse de forma aislada."[7]
Es decir, estos test creaban una situación imaginaria o de laboratorio aislada de la realidad a la que se tenían que enfrentar los sistemas de recuperación, siendo esta una de las fallas que se le pudieran señalar a dicho enfoque. Se "tenía en mente un laboratorio donde se llevara a cabo una comprobación física o mecánica y no un laboratorio psicológico."[8]
En este enfoque su centro principal de atención es la construcción de sistemas, entendiendo por este a "un conjunto de elementos que interactúan, [...] de sus interacciones surge un comportamiento como un todo. Por eso, es importante tener en cuenta que los sistemas presentan un cierto carácter de totalidad más o menos organizada" [9] y, en consecuencia, los sistemas que de forma particular trabajan con objetos informativos: bases de datos, documentos en diferentes soportes, datos, entre otras fuentes, es decir que trabajan con información, son denominados sistemas de información (SI); o lo que es igual, son "aquel conjunto de componentes interactuantes cuyo objetivo específico es transmitir información entre el generador y el receptor [...]. El sistema de información es un proceso" [10].
Necesariamente los SI tienen implícito un sistema de recuperación de información, estos últimos, juegan un rol fundamental ya que en los mismos se desarrollan las técnicas de planificación, construcción y gestión, uso y evaluación de los sistemas de descripción, catalogación, ordenación, clasificación, almacenamiento, comunicación y RI creada por el hombre. "De manera general los SRI conforman un sistema tridimensional, ya que se ocupan de los principios, métodos e instrumentos puestos en acción para la gestión del conocimiento humano desde una triple perspectiva: su representación, su organización y su comunicación" [11].
La principal analogía que realiza este enfoque es que los sistemas de recuperación de información deben ser vistos como un sistema físico, tanto en su naturaleza como en las diferentes técnicas o métodos que se utilicen para su estudio. (Ellis, 1992). Se "cconcebía los sistemas de recuperación de la información literalmente iguales a los sistemas físicos, donde se consideraba apropiado emplear las pruebas física o mecánicas, pero mejor que eso, se consideraba legítimo suponer, y apropiado aplicar técnicas similares en su forma a las técnicas apropiadas para los sistemas físicos o mecánicos."[12]
En la actualidad el paradigma físico es el más establecido ya que ha logrado, desde sus concepciones, resolver determinados problemas en la RI y además ha logrado llevar a la práctica y poner en marcha diversos sistemas. Sin embargo este punto de vista ha recibido disímiles críticas, las cuales principalmente recaen en el hecho de que este ignora el papel que desempeña el usuario. Algunas de las deficiencias que se le señalan al mismo son: la ausencia de técnicas de retroalimentación o la falta de estudio acerca del concepto de relevancia y de los aspectos cognitivos provenientes de los usuarios y lo que se puede considerar como un elemento fundamental, no se considera al usuario como parte del sistema (Saracevic, 1999).
Este modelo se mantuvo como dominante hasta el decenio de los ´70, a partir de esta fecha y reafirmándose en los ´80, "comienza a evolucionar una línea de razonamiento y de investigación diferente - una que se concentra en los extremos cognitivos, interactivos y contextuales de los procesos; enfoca a los usuarios, usos, contextos e integración con los sistemas" [13].
Sin embargo para sus seguidores este punto de vista está
lejos de desaparecer y plantean que el mismo aún tiene capacidad
para plantear nuevos problemas de investigación a partir de sus
concepciones. A pesar de esto es claro que este paradigma "no parece capaz
de generar una estructura explicatoria poderosa que esté lo suficientemente
cerca de las complejidades de la cognición."[14]
Un acercamiento necesario al prisma de lo cognitivo
El Enfoque Centrado en los usuarios no es resultado de un hecho al azar, sino que es producto de una revolución cognitiva que nace en la Psicología con su perspectiva de la Psicología Cognitiva y que se extiende a variadas disciplinas y campos de investigación.
La Psicología Cognitiva aparece como un intento de superación del modelo conductista y el enfoque fisicista de la ciencia, mostrando que la conducta del individuo no está regulada directamente desde el exterior por el medio físico o social, sino, que los estímulos externos están mediatizados por la manera como el individuo organiza e interpreta los elementos de ese mundo externo.
El desarrollo de la Psicología Cognitiva constituye en verdad un redescubrimiento del factor social y humano, "modificándose el centro de interés que vuelve del estudio del comportamiento al estudio de la conciencia, del estudio de lo externo a las experiencias mentales; el hombre ya no es más, para esta concepción, una caja negra vacía que solo da respuestas, sino que aparece como un ser pensante, procesador de las informaciones que provienen del exterior" [15]. Este enfoque esta centrando en el por qué y en el cómo del comportamiento, a la vez que se intenta comprender la relación entre el exterior y el interior de los individuos.
La psicología cognitiva se ocupa entonces de los procesos a través de los cuales el individuo obtiene conocimiento del mundo y toma conciencia de su entorno. La demarcación del territorio académico de esta disciplina sufre una segmentación a su interior a la hora de realizar o concebirse en los planos teóricos y prácticos, observándose la existencia de dos posturas. Una, denominada línea blanda la cual parte del supuesto de que el conocimiento humano es un proceso en constante construcción y una línea dura o versión fuerte inspirada en la "metáfora computacional" (Arbeláez, 2000)
La línea blanda centra su interés en el procesamiento de la información que realiza la mente humana y la relación de esta con el entorno social de los individuos, esta postura va a enfocarse en el procesamiento activo que el sujeto realiza de la información.
El segundo enfoque, línea dura o versión fuerte,
defiende la analogía que el funcionamiento de la mente es igual
al de un ordenador. Postulando que si la mente y el ordenador son sistemas
que procesan la información de manera similar, se debe elaborar
una teoría unificada de dicho procesamiento de la información,
que abarque ambos sistemas. Por cuanto, si es más fácil estudiar
los sistemas de inteligencia artificial que la mente humana, se debería
explotar el estudio de los primeros para lograr conocer con mayor exactitud
los segundos.
Un problema y dos miradas: La Ciencia cognitiva (CC) y el Cognitivismo
Si bien es cierto que el cognitivismo proviene de la psicología cognitiva en su versión fuerte, como una de las soluciones ante las inconsistencias dejadas por el conductismo, y la Ciencia Cognitiva es fruto de la confluencia entre la psicología cognitiva, la inteligencia artificial (IA) y otras disciplinas. Ambos tienen como objetivo central el procesamiento de información y las formas más adecuadas en la obtención de conocimiento, así como la relación entre la mente humana y el ordenador. Es válido aclarar también, que los términos de CC y cognitivismo son usados de manera confusa por algunos autores, quienes tienden a llamar cognitivismo a la CC y viceversa, al igual que se le iguala con el enfoque cognitivo. Esta confusión se debe a que ambos estudian similares procesos y objetos de estudio, además de tener en común algunos de sus padres fundadores.
El cognitivismo considera que operaciones simbólicas básicas como codificar, comparar, localizar, almacenar que pueden ser llevadas a cabo por ordenadores pueden dar cuenta de la inteligencia humana, por lo que lo importante es encontrar reglas comunes que ayuden a comprender como se producen estos procesos en los humanos (Arbeláez, 2000). A partir de la postura que el cognitivismo asume, este ha sido acusado de: dualista, mecanicista, metafórico, etc.
De manera general se puede decir que las investigaciones llevadas a cabo en la CC, tienen como objetivo la obtención de la inteligencia (conocimiento), definiendo los procesos de adquisición de conocimientos tanto naturales como artificiales y por el modo de constitución de esos conocimientos. Se encuentra por lo tanto en la intersección de varias disciplinas que se ocupan de estos procesos como son: Filosofía, Psicología Cognitiva, Lingüística, IA, Antropología y Neurociencia. Esta ciencia "tiene su énfasis en analizar todos los sistemas inteligentes, sean naturales o artificiales, sin asimilar la mente humana como un computador, sino que parte de la necesidad de encontrar un sistema formal de tipo computacional que pueda asemejarse lo mas posible a la manera que opera la mente humana" [16].
El concepto del procesamiento de información es para muchos uno
de los temas centrales del cognitivismo y de la CC. La concepción
del ser humano como procesador de información para el cognitivismo
se basa en la aceptación de la analogía entre la mente humana
y el funcionamiento de un ordenador ya que ambos procesan información
(reciben, almacenan, localizan, etc.) y para este, si se logra entender
como se procesa información en un ordenador se entendería
como procesa información el cerebro humano. Por su parte la CC le
otorga al procesamiento de información suma importancia, ya que
para ella lo más importante es el conocimiento alcanzado mediante
el ejercicio de las facultades mentales, lo que implica la existencia de
un tipo de habilidad que solo puede ejecutarse con el procesamiento de
información.
Socio - cognitivismo otra lectura de lo cognitivo.
El socio - cognitivismo (sc) surge como una variante del enfoque cognitivo ortodoxo y como una expresión de la denominada "línea blanda". Este nuevo enfoque, además de tomar en cuenta el estudio interno del sujeto, se dedica también al estudio del contexto del individuo y las relaciones de este con su medio.
Este punto de vista lo que trata es de reorientar la unidad de estudio del nivel del individuo al nivel de las comunidades sociales o del conocimiento. "De este modo, el individuo como actor construye el conocimiento interno de los hechos, valores y procedimientos a través de la interacción progresiva entre su conocimiento interiorizado y su participación en el mundo exterior" [17].
Esta perspectiva de lo cognitivo entiende al conocimiento como resultado
de un proceso de construcción o reconstrucción de la realidad,
que tiene su origen en la interacción entre los individuos y el
entorno (Hjørland, 1995).
Por tanto la idea central reside en que la elaboración del conocimiento
constituye una elaboración de modelos del mundo que rodea
al individuo, a partir de la relación que mantiene este con el medio,
lo cual a su vez es más que una simple descripción de la
misma. Por último el enfoque (sc), "se construye sobre teorías
de la cognición más socioculturales, pragmáticas y
realistas. Representando una teoría alternativa a los fenómenos
cognitivos" [18].
El enfoque centrado en los usuarios como expresión de la influencia del paradigma cognitivo.
Esta vertiente en las investigaciones en RI ha contado con diferentes vertientes o puntos de vistas. Por una parte se encuentra el punto de vista cognitivo más ortodoxo de los padres fundadores de esta vertiente, quienes se centraban únicamente en el sujeto (su mundo interior), y de otra parte, una mirada cognitiva desde una perspectiva más sociocultural (sin dejar de tener en cuenta el interior del sujeto, incorporando las significantes socioculturales e históricas) (Anexo 3).
Este enfoque incluye al usuario como un elemento más del SRI y al incluir a este, incorpora también al entorno del mismo. Los SRI, bajo este modelo, resultan efectivos y eficientes si previamente la información en ellos contenida ha sido organizada acorde a las exigencias y características de sus usuarios, a los que va dirigido el servicio. Esto se traduce en la selección de toda aquella información, que por determinadas características pueda resultar de importancia para la satisfacción de las demandas informativas de los usuarios. Bajo este postulado de tener a los usuarios del SRI como objetivo prioritario, se debe procesar y representar la información estudiando los procesos cognitivos de estos, lo cual humaniza al sistema de información, "...al mismo tiempo que condiciona el estudio de las distintas estructuras y procesos de la mente de los usuarios y su traducción a estructuras de contenidos informativos" [19].
A partir del estudio de los procesos cognitivos que se dan lugar en la mente de los usuarios, el sistema puede conocer la forma en que han ido conformando el esquema del mundo en que se desarrollan a partir de sus experiencias y necesidades, lo que consiste "en estructuras de conocimiento o estructuras cognitivas, que son determinadas por el individuo y sus experiencias sociales / colectivas, su educación, etc." [20].
Este modelo, a diferencia del tradicional, "no se pone en marcha a partir del momento en que el usuario realiza una consulta al SRI, sino que comienza incluso antes de que se produzca la necesidad informativa del usuario. En este punto de vista se tiene en cuenta la extensa gama de factores implicados en el proceso de RI; especialmente aquellos aspectos que influyen en el estado cognitivo y contextual del individuo, por ejemplo, su estado anímico, sus creencias, los objetivos planteados, su grado de motivación o sus áreas de interés, entre otros" [21].
El paradigma cognitivo en la RI provoca que sean retomados conceptos tales como necesidad de información o el concepto propio de usuario, los cuales son examinados desde otras miradas. En el caso de las necesidades de información, para la determinación de las mismas, se utilizarán métodos interpretativos, subjetivos y de carácter flexible, con la utilización de estos métodos se obtendrán las realidades objetivas de los usuarios y por ende de sus necesidades (Hjørland, 2002). Por su parte el usuario es comprendido como un sujeto cognoscente, con una formación histórico - cultural con la cual interactúa y la cual percibe (Hjørland, 1995).
Según Watters y Shepherd (1994, p. 457) en Hjørland (1995): "Mediante un paradigma centrado en el usuario nos referimos al acceso a la información guiado no por la estructura de la base de datos en el sistema, sino, más bien, por los criterios de las bases de datos que se necesitan para satisfacer una necesidad de información como se percibe por el usuario. De este modo, el usuario define de manera dinámica el tipo, la cantidad y la estructura de los datos requeridos para satisfacer una necesidad de información".
Bajo esta vertiente centrada en los usuarios, "el objetivo de la recuperación de información es suministrar información que pueda ser un suplemento para las condiciones mentales humanas conscientes o inconscientes en una situación dada" [22]. Desde este enfoque se han desarrollado diversidad de sistemas, por ejemplo el modelo desarrollado por Peter Ingwersen, conocido como Recuperación de Información Interactiva (RII), y el Modelo Estratificado, elaborado por Tefko Saracevic.
En el modelo desarrollado por Ingwersen se integran varios de los elementos que tienen lugar en la RI, tanto los relacionados con los procesos cognitivos que influyen y tienen lugar en los usuarios, así como los elementos propios del sistema. Para Ingwersen "la tarea de recuperación de información consiste en armonizar las estructuras cognitivas de los autores, [...] los trabajadores de la información [mecanismo intermediario] y el usuario, con el fin de hacerle frente a la necesidad real de información" [23]. Es decir, los procesos cognitivos que se desarrollan tanto en los autores, trabajadores de la información y usuarios deben ser tenidos en cuenta y analizados para un mejor funcionamiento de los SRI. (Anexo 4)
El autor de este modelo propone lo que para él son cinco elementos fundamentales en la RI, estos son: el usuario, la interfaz, el entorno, el propio sistema de recuperación y los documentos. Como se puede ver este modelo "no sólo tiene en cuenta al usuario, sino que de este incorpora su estado cognitivo, contextual y anímico, su necesidad informativa y el nivel de incertidumbre provocado por el ASK (estado anómalo del conocimiento), y además analiza como interactúa el sujeto con el resto de los componentes del sistema para satisfacer esa necesidad de información" [24].
Saracevic, en su Modelo Estratificado, defiende la idea de que la RI
bajo el prisma centrado en los usuarios, debe caracterizarse por observar
a los SRI con los que interactúan los usuarios como sistemas
de comunicación, el Modelo Estratificado es uno de los
que más se acerca a esta concepción (Ver figura # 5 - Anexo
5) El autor de este modelo propone que la RI es un proceso más
dentro de la interacción hombre - máquina. Prioriza la existencia
del término interacción, para una mejor comprensión
del vocablo:"una interacción es un diálogo con el fin de
cambiar el estado de conocimiento de uno o más participantes" [25].
El modelo estratificado en todo momento tiene presente el proceso de interacción
y expone que aquellos modelos que no lo hacen, continúan perteneciendo
a la RI bajo una mirada centrada en los sistemas (Saracevic, 1998). Este
modelo está muy relacionado con la lingüística y la
comunicación. Los elementos principales de este son:
La interfaz es la que posibilita que la RI se lleve a cabo
mediante un proceso de comunicación, siendo esta la intermediaria
entre los dos extremos, propiciando la comunicación (escrita, visual,
gestual y cognitiva) entre ambos (SRI y usuario). Es por ello que la
interfaz se reviste de suma importancia, lo misma va a ser diseñada
con el auxilio de la lingüística o más bien LD. Una
de las funciones de los LD es la de crear representaciones de la información
contenida en el SRI, de tal forma que el usuario sea capaz de acceder a
esa información. Se puede decir que los LD juegan un papel de facilitadores
en la comunicación efectiva entre los autores / indizadores y los
intermediarios / usuarios (Jacob & Shaw, 1998).
De lo que se trata en estos puntos de vistas de la RI es que el sistema se va a encontrar afectado por el medio ambiente que le rodea, entendiéndose por medio ambiente todos aquellos aspectos, tanto materiales como sociales que afectan y a los usuarios como elemento de estos. De ahí la importancia de tenerlos en cuenta, (ambiente y usuarios) a la hora del diseño del mismo, ya que los usuarios logran recuperar información con el auxilio de los procesos mentales y la relación de estos con los contextos sociales y culturales.
El proceso de RI que desarrollan los usuarios es mucho más complejo de lo que se puede pensar, debido a lo subjetivo que se torna el mismo, sobre todo por la presencia de significantes culturales; estas hacen que cada usuario sea un caso específico y diferente del resto, incluso el mismo usuario al interactuar con el SRI en diferentes momentos puede presentar necesidades y motivaciones diferentes, ya que las estructuras de conocimiento de los mismo se encuentran en una constante transformación. (Faúndez, 2004).
A modo de comparación la RI centrada en el sistema es evaluada bajo expresiones cuantitativas, con la premisa de que un correcto procesamiento de la información basado en un correcto uso de los LD, es aquella que permite la entrega de un mayor número de documentos relevantes en el menor tiempo posible. Por su parte la RI centrada en los usuarios es evaluada bajo expresiones cualitativas, respondiendo de manera general al mayor acercamiento posible entre la cantidad de documentos relevantes respecto a la cantidad de documentos pertinentes, pertinencia que se traduce en un nuevo conocimiento, porque la información obtenida ha sido capaz de modificar el estado actual del conocimiento del usuario.
A la hora de evaluar los SRI dentro de la RI hay dos conceptos claves: relevancia y pertinencia. Saracevic plantea que el término relevancia en la RI debe ser comprendido como "el atributo o criterio que refleja la efectividad del intercambio de información entre las personas (i.e. usuarios) y de los sistemas de recuperación de información en los contactos comunicativos, basado en la valoración de las personas" [26]. Esta visión evidencia que el concepto de relevancia es en gran medida subjetivo a partir del criterio del usuario, ya que solo este puede juzgar el tipo de información que ha recuperado.
El término relevancia ha estado presente en las investigaciones de RI desde sus inicios, el mismo ha sido utilizado para la evaluación de los SRI. Bajo la premisa centrada en los sistemas, esta es medida a partir de que la cantidad de documentos solicitados por el usuario y la cantidad de documentos entregados por el sistema se equiparen, es decir, el término relevancia es tratado desde un punto de vista cuantitativo. En la perspectiva centrada en los usuarios, la relevancia, se mide desde una óptica cualitativa. Aunque también se van a tener en cuenta los parámetros utilizados en el enfoque tradicional, en esta nueva mirada se va a priorizar si los documentos entregados a los usuarios son capaces de transformar las estructuras de conocimientos de los mismos para que se pueda crear un nuevo conocimiento. Esto es entendido para Saracevic como relevancia cognitiva, que "es la relación entre el estado del conocimiento y la necesidad cognitiva de información del usuario, y los textos recuperados, los ficheros de un sistema o los existentes. La correspondencia cognitiva, informatividad, novedad, calidad de la información, entre otros, son, los criterios por los cuales la relevancia cognitiva (pertinencia) es deducida" [27].
La pertinencia se encuentra implícita como una variante más
de relevancia, hay que partir de que para que un documento sea pertinente
en la RI, necesariamente tiene que haber sido en primer lugar relevante
para que haya sido recuperado; lo que no obliga a que todo documento relevante
sea pertinente, pues solo aquella información que sea capaz de modificar
las estructuras de conocimiento del usuario puede ser considerada pertinente.
Lenguajes documentales
En todo SRI, además de los usuarios y la información que por este circula, juegan un papel clave los LD a través de los cuales va a ser representada la información contenida en el sistema y el usuario accede a la información.
Los LD han estado ligados al propio desarrollo de las instituciones informativas, en la medida que el desarrollo de la propia humanidad ha ido alcanzando niveles mayores de complejidad, hay un mayor caudal de información especializada, y por tanto más complejas han sido las necesidades de información de los usuarios en el momento de la RI. Para que se desarrolle la RI en un SRI, se debe hacer uso de los LD, que son los encargados de construir las interfaces a las que hacen alusión tanto Ingwersen como Saracevic en sus modelo de RI.
El lenguaje puede ser entendido como un: "sistema de señales de cualquier naturaleza física que cumple una función cognitiva y una función comunicativa en el proceso de la actividad humana [...] siendo la forma de existencia y de expresión del pensamiento" [28].
Por su parte, los LD, se pueden conciben como un "sistema de símbolos,
destinados a expresar el contenido material de los documentos, que constituye
una parte integrante independiente y una variable de un sistema de búsqueda
informativa" [29]. Estos han ido evolucionando como
consecuencia de la evolución del propio conocimiento humano y de
los contextos y escenarios culturales en los que se ha desarrollado el
conocimiento.
Los LD son los encargados de representar y hacer transparentes todas
las tareas que se llevan a cabo con la información durante su ciclo
de vida para que el usuario en el momento de su interacción con
el SRI, lleve a cabo una RI efectiva y pueda satisfacer su necesidad de
información (Anexo 6).
A partir de los LD lo que se crea es una metainformación, (información sobre información), o sea, la información que describe o explica otra información. Como se aprecia en la figura # 6 - Anexo 6. La información atraviesa por un ciclo de vida, al igual que un ser vivo, todas estas fases del ciclo de vida van a tener una determinada influencia en la nueva información que entra en el SRI. Lo que persigue es que la información procesada (documento) pueda ser recuperada eficientemente por el usuario, pero para ello esta debe ser representada (Anexo 7). En este proceso de representación, los LD son los encargados de traducir el contenido semántico de los documentos a un lenguaje artificial y especializado que brinde información sintética o analítica sobre el mismo (Vizcaya, 2003). En esta etapa de la CI, los LD van a ser creados pensando en los usuarios, solo así se podrá lograr una representación de información acorde a las necesidades de los mismos.
La representación de la información desde el punto de vista centrado en los usuarios aboga por alcanzar niveles superiores de expresión, en consonancia con su propia realidad, que no es otra que la de representar un conocimiento transformado. Se trata no solo de responder la demanda del usuario con la entrega de la información solicitada, sino también la de brindarle al mismo una orientación adecuada en dependencia del contexto social y los antecedentes culturales en los que se ha desarrollado el usuario. Una mayor expresión de los LD le permitirá al usuario navegar con precisión dentro del ya súper complejo mundo de las interrelaciones entre los diferentes campo del saber. Las crecientes necesidades de información que presentan a diario los usuarios, solo podrán ser satisfechas en la medida que los SRI desarrollen leguajes, en los que se fundamente la representación de la información procesada, acorde no solo con la propia ciencia que se representa, sino que sobre todo tengan en cuenta las características cognitivas del universo de usuarios a los que va dirigido.
El papel que la información desempeña en la sociedad actual sobrepasa la simple necesidad de saberla seleccionar, procesar, almacenar, recuperar y diseminar como se ha venido haciendo bajo el enfoque centrado en los sistemas. La RI centrada en los usuarios aboga porque estas etapas del ciclo de vida de la información sean vistas desde una holística superior que permita, dado el caudal desmesurado de información existente, representar esa propia información de forma tal que no solo sirva para que el usuario la identifique rápidamente, sino para que también este sepa orientar su propio desconocimiento y se encamine por todo un sistema de inferencias. Si algo se debe tener presente bajo la visión de este paradigma es que "cada deseo de información debe representarse en una variedad de formas convenientemente relacionadas que puedan ser percibidas por un mecanismo intermediario y pueda aplicarse al espacio de información. Este requerimiento exige la navegación interactiva y / o la interrogación del sistema que está estructurado al conocimiento del usuario real, al menos, a los grupos potenciales de usuarios que pudieran investigar el sistema" [30].
La clave de la representación en esta etapa, es lograr extraer del documento con el auxilio de los LD, aquella información contenida en él que pueda ser de utilidad para los usuarios, pero no solo en el momento en que el usuario está interactuando con el sistema, sino realizar un representación de la información que sea capaz de representar las necesidades futuras de los usuarios y las posibles relaciones interdisciplinares (Jacob & Shaw, 1998).
Una de las tendencias en la elaboración de los LD en la actualidad, es la de lograr el mayor acercamiento posible entre los lenguajes artificiales y el lenguaje natural empleado por los usuarios. Esto se debe a que en ocasiones no existe una correspondencia entre los LD y el lenguaje natural, provocando que los usuarios no sean capaces de expresar en términos de un lenguaje artificial su necesidad de información. "Puesto que la equiparación está limitada a los términos del lenguaje natural seleccionados, no hay seguridad alguna de que los términos provenientes de textos potencialmente relevantes se equiparen a los términos usados por quien realiza la búsqueda, o de que la equiparación de los términos se refiera realmente al concepto pensado" [31].
Se ha de tener en cuenta que el lenguaje natural es el utilizado por los productores (autores) para dar a conocer los resultados de sus investigaciones, y a su vez la información recuperada con niveles de pertinencia modifica el estado actual del conocimiento del usuario sobre la temática en cuestión. Esto nos obliga a retomar el concepto de conocimiento, ya que el lenguaje es la forma en que se expresa el pensamiento y en este último es donde se forman los conceptos que dan lugar posteriormente al conocimiento. De ahí que, a través del lenguaje se va desde el dato al conocimiento pasando por la información (Vizcaya, 2003). Es decir, los datos aislados (información potencial) que se encuentran en un SRI X, interactúan con el usuario mediante los LD, lo que le posibilita acceder a la información y esta información logra transformar las estructuras de conocimiento del individuo a través del lenguaje natural, generando una nueva estructura del conocimiento. Esto perfila uno de los problemas de la RI que se materializa en la relación que se da entre: DATO - INFORMACIÓN - CONOCIMIENTO.
Esto hace mucho más evidente la relación que existe entre:
INFORMACIÓN - CONOCIMIENTO / LENGUAJE - PENSAMIENTO. La profesora
Dolores Vizcaya, nos ayuda a comprender esta relación cuando apunta:
"...de la misma manera que el conocimiento se produce solo a través
del pensamiento y se constata en la práctica como forma de completar
una abstracción, la información se produce solo a través
del
lenguaje como manera de materializar algo que etimológicamente está
implícito en el propio término información y que no
es otra cosa que algo que da forma y que la adquiere a través del
lenguaje" [32]
El papel del profesional de la información (PI)
La RI centrada en los usuarios se nutre de un alto componente subjetivo, pues no solo se tienen presentes los matices subjetivos en el proceso de interacción usuario - SRI, sino también los elementos subjetivos presentes en los PI; estos son seres humanos, y por ende en su manera de procesar y representar la información también están implícitas sus maneras y concepciones de ver al mundo, su contexto social, sus experiencias...etc.
Si estudiar los elementos subjetivos de los usuarios significa una labor difícil, también lo es estudiar a este profesional, quien está condicionado por ideologías que están presentes en sus labores y rutinas productivas.
La era de los grandes enciclopedistas ya no existe. En aquella época los campos de conocimientos no habían alcanzado el desarrollo y la diversidad actual, lo que le permitía a los informadores de entonces, un mayor dominio de los campos de saberes. En la actualidad hablar de especialización se torna imposible y por ello los actuales PI, tienen la ardua labor de manejar difíciles herramientas que les permitan brindar servicios de información a la altura de las necesidades de sus usuarios.
Hablar del papel del PI dentro de los SRI, obliga a hablar de un profesional que debe fungir como: comunicador social, sociólogo, lingüista y en uno que otro momento como psicólogo, etc. Si bien este escenario multi o pluri disciplinar, hace que la profesión que desempeñan los PI sea un poco compleja, es a su vez, lo que la hace diferente a las demás y con un alto valor de creatividad.
Ser PI y funcionar como tal bajo un enfoque centrado en los usuarios, significa poseer una capacidad de razonamiento que posibilite reducir las grandes complejidades presentes en el proceso de RI. "Sus armas metodológicas deben ser guiadas por la revisión crítica de los fenómenos bajo estudio, [...] que le permitirán lograr diversas interconexiones entre los flujos de información en los que trabaje" [33].
En el paradigma cognitivo de la RI, no se trata solo de tener en cuenta los aspectos cognitivos de los usuarios, sino también de los autores de los documentos y de los profesionales de la información (indizadores, catalogadores, referencistas, etc.) (valores, cultura profesional, técnicas de redacción, personalidad, ideología, conciencia, etc.) (Anexo 8). Se tomarán en cuenta los procesadores, debido a que estos son los encargados de extraer de los documentos aquella información útil para los usuarios, y se puede afirmar que la "percepción del potencial de un documento depende del preconocimiento de la persona que determina la materia" [34].
En el proceso de representar la información, varios son los factores que van a influir para que el PI determine si una información es relevante o no y qué categoría se le debe asignar a la misma. Entre estos factores que influyen se pueden mencionar: su edad, formación ideológica, nivel profesional, medio social en el que se desenvuelve, conocimiento que tenga de los usuarios que visitan a la institución, etc. Es así como es el PI "quien identifica los términos que él o ella considera más indicativos del contenido conceptual del texto" [35].
El espectro de conocimiento del PI debe ser lo suficientemente amplio como para saber cuando extraer un posible término relevante de un documento, o para crear las relaciones necesarias entre diferentes campos. Además debe tener en cuenta que lo que resulta útil en un determinado contexto, no necesariamente es útil en otro. Esta tarea le será más fácil de llevar a cabo en la medida en que conozca mejor a su comunidad usuaria, (dígase sus intereses, técnicas para RI, inclinaciones, etc.), y al medio en que esta se desenvuelve. Es así como la representación de la información debe centrarse en los fundamentos sociales del conocimiento (Jacob & Shaw, 1998).
El PI debe ver lo que los demás no ven, al interactuar
con el documento, este debe ser capaz de equiparar el conocimiento que
tiene del autor con el conocimiento que tiene de los futuros usuarios de
ese documento (Hjørland, 1992)
Conclusiones
La recuperación de información ha estado signada por dos posturas fundamentales: un enfoque centrado en los sistemas y un enfoque centrado en los usuarios. En el primero se prioriza la impecabilidad de los sistemas desde un punto de vista tecnológico, el ruido que se tiene en cuenta es aquel que puede tener lugar hacia el interior del sistema. El segundo (el enfoque centrado en los usuarios), incluye al usuario como un elemento más del sistema; se tienen en cuenta los elementos subjetivos provenientes, además de los usuarios, de los profesionales de la información y de los creadores de los documentos.
Las principales diferencias entre la RI centrada en los sistemas
y la RI centrada en los usuarios son:
* El término relevancia como indicador para la evaluación de los SRI es vista desde una dimensión más cualitativa. Sólo aquellos documentos que modifiquen las estructuras de conocimiento de los usuarios pueden ser considerados realmente relevantes, esto es conocido como relevancia cognitiva.
* La representación de la información contenida en los SRI, que es llevada a cabo a través de los LD, tiende a acercarse más a las realidades concretas de los usuarios para lograr una mayor comunicación entre el SRI y los usuarios. En la construcción de los LD existe una tendencia a acercarse más al lenguaje natural para una mejor representación de la información contenida en los documentos y una mejor decodificación por parte de los usuarios.
* Al estudiar los aspectos cognitivos y socioculturales, no se restringe solo al estudio de estos aspectos en los usuarios, sino también se deben incluir a los PI y a los creadores de los documentos.
[*] El artículo que se presenta a continuación forma
parte de los temas tratados en su tesis de pregrado, titulada El paradigma
cognitivo en la Ciencia de la Información. Asimismo, fue publicado
su artículo La información en la Ciencia de la Información;
tras las huellas de un concepto, en la revista cubana ACIMED. Este artículo
también fue una síntesis de lo plasmado en la mencionada
tesis de pregrado.
[1] ØROM, Anders. "Information Science, Historical Changes and
Social Aspects: A Nordic Outlook". Journal of Documentation. 2000, vol.
56, num. 1. p. 15.
[2] FOSKETT, D. J. Ciência da informação
como disciplina emergente; implicações educa-cionais.
Ciência da informação ou Informática?,
1980. p. 53-69. Citado por: RIBEIRO PINHEIRO, Lena Vania; MATHEUS LOUREIRO,
José Mauro. Tratados y Límites de la Ciencia de la Información.
Ciencia da Informação. Vol 24, (1), 1995, p.3.
[3] LINARES COLUMBIÉ, Radamés. "La Ciencia de la Información
y sus matrices teóricas: Contribución a su historia". [Tesis
de Doctorado]. Universidad de la Habana, Facultad de Comunicación.
2003. p.95.
[4] HJØRLAND, Birger. "Documents, Memory Institutions and Information
Science". Journal of Documentation. 2000, vol. 56, num. 1, p. 30.
[5] SARACEVIC, Tefko. "Information Science". Journal of Documentation.
1999, vol. 50, num. 12, p. 1056.
[6] VARGAS - QUESADA, Benjamín; MOYA ANEGÓN, Félix
de; OLVERA LOBO, María Dolores. "Enfoques en torno al modelo cognitivo
para la recuperación de información: análisis crítico".
Ciência da informação. 2002, vol.32, num.2, p.107.
[7] CLEVERDON, C.W. ...Factors determining the performance of indexing
systems. volumen 1: Design. Cranfield: College of Aeronautics, 1966. EN:
ELLIS, David. "The Physical and Cognitive Paradigms in Information Retrieval
Research."Journal of Documentation. 1992, vol. 48, num. 1, s.p
[8] ELLIS, David. "The Physical and Cognitive Paradigms in Information
Retrieval Research."Journal of Documentation. 1992, vol. 48, num. 1, s.p
[9] PONJÚAN DANTE, Gloria; et. al. Sistemas de información:
Principios y aplicaciones. Ciudad de la Habana: Félix Varela, 2004.
p.8.
[10] DÍAZ FERREIRA, Carlos Newton. Sistemas de Almacenamiento
y Recuperación de Información (Tomo I). Ciudad de la Habana:
Universidad de la Habana, Facultad de Artes y Letras, Departamento de Información
Científico - Técnico y Bibliotecología, 1982. p.18.
[11] ESTEBAN NAVARRO, Miguel Ángel; GARCÍA MARCO, Francisco
Javier. "Las primeras jornadas sobre la organización del conocimiento:
Organización y Conocimiento e Información Científica".
Scire. 1995, vol. 1, num. 1, p. 149. EN: VIZACAYA ALONSO, Dolores; et,
al. Selección de lecturas Fundamentos de la Organización
de la Información. Ciudad de la Habana: [s.e], 2002. p. 3.
[12] Op. Cit [11]
[13] Op. cit. [5], p. 1057.
[14] Op. cit [11]
[15] GUIJARRO, José Luis. "Giro copernicano en los estudios
humanísticos". Pragmalingüística II [en línea].
1994 [ref. 5 julio 2004], p. 217 - 265. Disponible en Internet: <http://www.infonegocio.com/joseluisguijarro/Giro%20copernicano.htm>
[16] ARBELÁEZ GÓMEZ, Martha Cecilia. La cognición:
Perspectivas teóricas. Revista de Ciencias Humanas [en línea].
2000, num. 22. [ref. 20 mayo 2004]. Disponible en Internet: <http://www.chumanas.utp.edu.co>
[17] JACOB, Elin K ; SHAW, Debora. "Sociocognitives Perspectives on
Representation". Annual Review for Information Science and Technology.
1998, vol. 33. num. 41, p.140
[18] HJØRLAND, Birger. "Toward a New Horizon in Information
Science: Domain Analysis". Journal of the American Society for Information
Science. 1995, vol. 46, num. 6 p 412.
[19] IZQUIERDO ALONSO, Mónica. "Una aproximación interdisciplinaria
al estudio de usuarios de información: bases conceptuales y metodológicas".
Investigación Bibliotecológica. 1999, vol. 13, num.26, p.
17.
[20] INGWERSEN, Peter. Information Retrieval Interaction. London: Taylor
Graham, 1992. 246 p. ISBN: 0-947568-54-9.
[21] Op. cit. [6], p. 108.
[22] Op. cit. [20].
[23] Ibídem.
[24] Op. cit. [6], p. 109.
[25] Op. cit. [6], p.113.
[26] Op. cit. [5], p. 1060.
[27] Op. cit [5], p. 1061.
[28] ROSENTHAL, M; IUDIN Y P. Diccionario filosófico. Ciudad
de la Habana: Editora Política, 1981. p. 265.
[29] MELTON, J. A. A use for the techniques of structural linguistic
in documentation research. Citado por: VIZCAYA ALONSO, Dolores. Información:
procesamiento y contenido. Ciudad de la Habana: Editorial Félix
Varela, 2003. p. 69.
[30] Op. cit [20].
[31] Op. cit. [17], p. 149.
[32] VIZCAYA ALONSO, Dolores. Lenguajes documentarios. Argentina, Rosario:
Nuevo Paradigma, 1997. p.24.
[33] FAÚNDEZ, Ulises A. Análisis de información:
características - metodologías - proyecciones. [en línea].
Chile [ref. de 3 de noviembre de 2004]. Disponible en Web: <http://www.faf.org/rp/world/chile/faundez.html>
[34] HJØRLAND, Birger. "The concept of subject in Information
Science". Journal of Documentation. 1992, vol. 48, num. 2, p. 187.
[35] Op. cit [17], p. 154.
Sobre os autores / About the Authors:
Franklin Marín Milanés
marin@fcom.uh.cu
angel.silva@crew.cubana.avianet.cu
Licenciado en Bibliotecología y Ciencia de la Información
de la Universidad de La Habana.
Actualmente, profesor de la carrera de Bibliotecología y Ciencia
de la Información de la Facultad de Comunicación de la Universidad
de La Habana;
cursa la Maestría en Ciencia de la Información impartida
en la propia facultad.
Dirección postal de contacto:
Calle 198, No. 27317, e/ 277 y final, Panamérica, Municipio
Boyeros, Ciudad de La Habana, Cuba. CP: 19220
Alexeis Torres Velásquez
Departamento de Gestión de la Calidad, Ministerio del Turismo,
Cuba.