Antes
de empezar |
|
SEMINARIO INTERNET E HISTORIA
|
2. Las guías generales de navegación
Ya sabemos manejar el
instrumento de navegación. Pero justo aquí empieza el problema. Porque los posibles
destinos de esta navegación son casi infinitos: un océano de más de 100 millones de
páginas en rápido crecimiento, en el que es imprescindible orientarse si se quiere
encontrar algo en concreto. Para afrontar esta situación se han desarrollado los
buscadores, de los que hay más de 2.000. Son una especie de faros existentes en la red
que ayudan al navegante. Los hay de varios tipos: índices temáticos, motores de
búsqueda y metabuscadores. Los primeros presentan las direcciones de las páginas web
clasificadas en categorías y subcategorías, a semejanza de lo que ocurre con los libros
de una biblioteca o los anunciantes de una guía de teléfonos. Los segundos incluyen en
su base de datos información de las páginas que encuentran en su rastreo indiscriminado
de la red y, mediante un motor de búsqueda, ofrecen al visitante las direcciones de
aquellas que responden a la palabra o palabras que se les pide. El primer sistema es más
útil en caso de una búsqueda sobre un tema amplio, aunque el número de páginas
incluido es menor que en el segundo, recomendable cuando se busca algo muy concreto o de
lo que ya se tienen algunos datos. Los metabuscadores buscan a la vez sobre un conjunto de
índices y motores, lo que aumenta la extensión del número de direcciones abarcado,
aunque a costa de no exprimir al máximo las posibilidades de cada uno de ellos. Interesan
como alternativa a los primeros y cuando se quiere disponer del mayor número de
documentos posible.
Vamos a examinar dos ejemplos
para cada tipo, uno general y otro del ámbito hispano. En cada caso analizaremos sus
características y su comportamiento a la hora de encontrar páginas sobre un determinado
tema. La referencia será, para los extranjeros (Yahoo!, AltaVista y MetaCrawler): Korean
War (Guerra de Corea), Bismarck, Carlismo; y para los españoles (BIWE, Trovator y
Metabusca): Carlismo, Durruti, Afrancesados. Los buscadores escogidos son algunos de los
más representativos de cada tipo. Pueden encontrarse más en cualquiera de las
direcciones que se indican en el apartado de bibliografía o en la puerta de entrada de
Netscape.
--1.
Temáticos:
Yahoo!. Es el más antiguo (1994) y emblemático buscador
de Internet. Mantiene la más extensa base de datos temáticos de la red, con centenares
de miles páginas repartidas en un árbol jerárquico con numerosas categorías y
subcategorías. Pero ni mucho menos está todo lo que hay en lnternet, ni lo que está ha
sido incluido tras evaluar su calidad, por lo que ésta es muy desigual. Otros dos
inconvenientes son su no preferente atención a los temas académicos y la indexación de
las páginas de acuerdo con su título y descriptores, que no siempre son un retrato fiel
y completo del contenido de la página.
Resultados de las búsquedas
realizadas: Yahoo! ofrece dos opciones de búsqueda: por palabras (web sites) y por temas.
El sistema de búsqueda por palabras admite búsquedas booleanas, frases entre comillas y
el uso de asterisco como comodín. Para Guerra de Corea, formulada como "korean
war", da 34 lugares (alguno de ellos duplicado) de desigual relevancia,
correspondientes en su mayoría a dos categorías: "Arts: Humanities: History: 20th
Century: 1950s: Korean War" y "Government: Military: Veterans: Korean War".
Conociendo que estos son los itinerarios más fructíferos podemos a continuación
realizar la exploración por temas. Esta es más prolija que la primera, pues requiere
varios pasos hasta llegar a la rama final: en la principal categoría estos pasos son
Arts, Humanities, History, 20th Century, 1950s y Korean War. Esta última página nos
ofrece 22 enlaces, brevemente comentados, con otras tantas páginas web sobre la guerra de
Corea, y el entronque con una categoría paralela (vetarans@; o sea Government: Military:
Veterans) que a su vez proporciona 7 nuevas direcciones, algunas de ellas ya incluidas
entre los 22 enlaces anteriores. La mayoría de las direcciones obtenidas por uno y otro
método son idénticas: solamente siete de las conseguidas a través de la búsqueda por
temas no aparecieron en la búsqueda por palabras, idéntico número que a la inversa.
Para Bismarck los resultados son los siguientes: por la palabra Bismarck aparecen 18
referencias, todas desechables (en su mayoría pertenecen a la localidad estadounidense
del mismo nombre, en el estado de Dakota); por temas el itinerario de búsqueda es más
prolijo (Arts: Humanities: History; desde aquí se subdivide en dos: Region: Countries:
Germany, que ofrece una lista de 52 lugares comentados, alguno de los cuales pudiera
contener información sobre el político alemán y su época, y 19th Century, sin interés
para el caso). En el tercer caso (Carlismo) la búsqueda por palabras (carlism*) ofrece
siete lugares comentados, de los que adjunta dirección, aunque el valor informativo de
las webs a las que remite es más bien escaso; por temas los resultados son peores:
cuando, desde Countries se llega a Spain, la relación comentada de 51 lugares no incluye,
a primera vista, nada especial sobre el carlismo. Pero también Yahoo! puede comportarse
como un motor de búsqueda y, mediante la opción web pages, situada en el encabezamiento
de los resultados de una búsqueda, efectuar una búsqueda por el contenido de la página,
mediante su propio motor. Esta opción da los siguientes resultados para cada uno de los
casos examinados: Guerra de Corea ("korean war") 16.585 páginas; Bismarck,
5.183 páginas; Carlismo (carlism*), 11 páginas. La relación carece de orden y de
posibilidades de selección ulterior. Otro servicio de que dispone Yahoo! es la búsqueda
de imágenes, aunque por el momento apenas está desarrollado y no contiene materiales de
historia.
BIWE. Abreviatura de Buscador en Internet de Webs en
Español. Distribuye su índice páginas en trece grandes categorías, que a su vez se
ramifican, y ofrece ayuda para las búsquedas. El principal inconveniente es el
insuficiente número de páginas indexadas, lo que se traduce en resultados de búsqueda
pobres.
Resultados de las búsquedas
realizadas: Ofrece también dos opciones de búsqueda (por palabras y por temas) e incluye
en los resultados el comentario de cada uno de los lugares encontrados, que pueden
agruparse o no por categorías, y el grado de concordancia de la página encontrada con el
criterio de búsqueda. Los resultados se pueden obtener ordenados por número de visitas,
alfabéticamente o por antigüedad de la página. La búsqueda por palabras permite el
empleo de comodines (asterisco, interrogante), frases (entrecomilladas) y vocablos
sueltos. Para Carlismo (formulado como carlis*), solamente una página, dedicada a un
partido político carlista actual. La misma búsqueda por temas ofrece resultados todavía
peores. Al término de los pasos del itinerario (Educación y enseñanza, Materias,
Humanidades) nos encontramos con 107 entradas bajo el subtema de humanidades; entre ellas
hay cosas de historia, pero nada de carlismo. Si desde Materias se escoge Ciencias
Sociales el resultado son 75 entradas, muy pocas de historia y ninguna sobre la cuestión
que nos interesa. La búsqueda del luchador anarquista Durruti tampoco da una cosecha
abundante: una única página, la oficial del Comité Nacional de la CNT. El último de
los tres términos examinados, Afrancesados, resulta desigual en resultados: por
afrancesa* no se encuentra nada mientras que por "Guerra de la Independencia"
aparecen dos lugares con información general sobre la guerra.
--2.
Motores:
AltaVista. Creado en 1995 por Digital, es uno
de los más antiguos y característicos buscadores, así como uno de los que posee mayor
número de páginas en la actualidad, lo que asegura abundantes resultados. Pero
abundancia no es sinónimo de precisión: pese a ordenar los resultados según su
concordancia con lo buscado y a disponer de instrumentos de refinamiento, que permiten
afinar la búsqueda, a veces se hace difícil llegar hasta las páginas que interesan a
través del bosque de direcciones. Otro inconveniente es la no fácil sintaxis de
búsqueda, que distingue entre sencilla y avanzada. Puntos favorables son, junto a la
amplitud de su base de datos, un servicio de traducción de páginas entre diversos
idiomas y el inglés (se señala la opción "translate" que aparece junto a la
página seleccionada; los resultados son poco satisfactorios) y un campo de búsqueda por
imágenes, que facilita el acceso al material gráfico de la red (seleccionando desde la
página inicial la opción AV Photo Finder).
Resultados de las búsquedas
realizadas: Se puede buscar por palabras o categorías. En ambos casos los lugares
encontrados se acompañan de un comentario descriptivo de su contenido y de sus
características. La primera modalidad admite truncamientos (asterisco), frases
(entrecomilladas), inclusión (+) y exclusión (-) de palabras y, en su forma avanzada,
búsquedas más complejas. La segunda incluye un árbol con trece categorías y diversas
ramificaciones. Para Guerra de Corea, la petición de búsqueda de este concepto
("korean war") proporciona nada menos que 26.139 páginas. Tras efectuar un
refinamiento de estos resultados, excluyendo todas las posibilidades menos una, siguen
quedando demasiadas: 14.836. El propio Altavista recomienda seguir la vía alternativa de
la búsqueda por categorías y ofrece Korean War (la última ramificación del árbol que,
desde la categoría Reference and education, conduce a Arts and humanities, History y Wars
and conflicts). El resultado son 6 lugares sobre la Guerra de Corea, con un breve
comentario de cada uno de ellos. En el caso de Bismarck, la petición bismarck + history
da, sorprendentemente, sólo 6 páginas, ninguna de ellas centrada en el tema. Sin
embargo, la búsqueda por bismarck ofrece la inabarcable cantidad de más de cien mil
páginas, muchas de ellas dedicadas a la ciudad estadounidense de este nombre. Para
conseguir unos resultados más precisos cambiamos los términos de la búsqueda:
bismarck+german* da 101 páginas; german*+history+nineteen* da 7 y ofrece una conexión
con el directorio Virtual Library, desde donde, a través de German History, se llega a
Nineteenth century, donde se halla un listado de 19 direcciones, no comentadas. El grado
de adecuación a la búsqueda es, en este último caso, mucho mayor que en los anteriores.
Si, desalentados por lo desigual de estos resultados, buscamos por categorías, el final
del largo camino (Reference and education, Arts and humanities, History, History by
region, Europe, 1789-present) es decepcionante: una relación de 39 páginas de historia
contemporánea de Europa, ninguna de ellas específica sobre Bismarck. Para Carlismo,
formulado como carlism*, hay 255 páginas, las primeras más relevantes que las últimas.
Las posibilidades de centrar el resultado mediante una búsqueda más afinada son poco
efectivas. La alternativa de búsqueda por categorías no resulta aquí viable, pues en la
relación de webs sobre historia contemporánea europea obtenida en el anterior ejemplo no
había nada sobre carlismo. En cada uno de los casos examinados las imágenes obtenidas
han sido: 147 para la Guerra de Corea ("korean war"), 147 para Bismarck y
ninguna para Carlismo (carlism*). La adecuación de las imágenes logradas al criterio de
búsqueda es bastante buena.
Trovator. Motor de búsqueda de páginas web
españolas e hispanoamericanas. Ofrece dos opciones de búsqueda: precisa, solamente entre
títulos y cabeceras, y normal, en toda la página. Permite refinar búsquedas (rebuscar).
Su principal inconveniente, aunque en menor medida que BIWE, es la pobreza de los
resultados obtenidos.
Resultados de las búsquedas
realizadas: Distingue acentos y permite la utilización de and, not, near, paréntesis y
asteriscos. En el caso de Carlismo (carlis*), Trovator porporciona 6 páginas comentadas.
Por Durruti el resultado son 4 páginas, poco relevantes. Para Afrancesados (afrancesa*)
hay solamente dos lugares, sin interés; si se amplia la búsqueda a "guerra de la
independencia" el resultado es más amplio, 43 lugares, pero en su mayoría no tratan
de la contienda española.
--3.
Metabuscadores:
MetaCrawler. Es el más antiguo y
representativo de los metabuscadores. Busca sobre las bases de datos de varias guías
generales de navegación (Altavista, Excite, Infoseek, LookSmart, Lycos, The Mining Co.,
Thunderstone, Yahoo! y WebCrawler) y ofrece los resultados organizados en un formato
uniforme, excluyendo las páginas duplicadas y clasificándolas según su relevancia,
aunque solamente incluye como máximo las 30 páginas más relevantes de cada buscador.
Utiliza una sintaxis de búsqueda sencilla, que admite palabras y frases pero no permite
el uso de comodines.
Resultados de las búsquedas
realizadas: Los resultados se ofrecen de manera casi inmediata. Aparecen comentados, con
indicación del buscador de procedencia, y ordenados de acuerdo con la relevancia otorgada
a cada página por el conjunto de buscadores, lo que le da una mayor fiabilidad. Incluyen
como opción la relación de documentos electrónicos existentes sobre el tema en la
Electronic Library, una biblioteca electrónica consultable mediante suscripción. Para
Guerra de Corea ("korean war") se han obtenido 49 páginas (además de 30
documentos electrónicos); para Bismarck (bismarck + germany), 20 (y 30 documentos
electrónicos); para Carlismo (carlism*), 27 (y 3 documentos electrónicos). En todos
estos casos las páginas encontradas tienen un grado de correspondencia con el criterio de
búsqueda desigual, si bien son escasas las que no guardan ninguna relación.
Metabusca. El primer metabuscador español. Ofrece
información de las páginas en español de la red contenidas en AltaVista en español,
Brújula, Chevere, El Indice, Global Net, Mexico Web Guide, Olé, Ozú, Yahoo en español
y Yupi. Junto a la descripción del contenido y procedencia de las páginas encontradas
proporciona la posibilidad de visualización previa. Su mayor inconveniente consiste en la
escasez de páginas disponibles, que limita considerablemente los aciertos en las
búsquedas. Da hasta un máximo de 50 referencias por cada búsqueda.
Resultados de las búsquedas
realizadas: El sistema de búsqueda por palabras permite la sintaxis de búsqueda
elemental y, en caso de introducir varias palabras, selecciona en primer lugar las
páginas que contienen todas ellas. Incluye una clasificación por temas de las páginas
más visitadas, dentro de la cual no figura ningún apartado dedicado a Ciencias Sociales
o Humanidades. Ningún hallazgo para Carlismo, tres para Durruti y ninguno para
Afrancesados (afrancesa*), aunque 50 para "guerra de la independencia", de los
cuales solamente dos son relevantes.
Aunque sobre una muestra tan
escasa no puede realizarse un análisis comparativo de los buscadores, sí que se perciben
algunos rasgos que merecen
destacarse:
grandes diferencias según el
tipo de buscador empleado: los motores de búsqueda proporcionan un número de hallazgos
muy superior a la modalidad temática, excesivo si lo que se está buscando no es algo muy
específico;
pobres resultados de los
buscadores españoles, en parte debidos a la escasez de materiales sobre historia
española, pero no únicamente, porque
los resultados con buscadores
extranjeros son mejores incluso para temas españoles;
la utilización de un
metabuscador es sencilla, proporciona resultados rápidos y aceptablemente adecuados a la
búsqueda, por lo que puede ser una buena alternativa si no se quiere realizar una
investigación exhaustiva.
Cualquier sugerencia o comentario sobre
esta página serán bien recibidos. Pueden enviarse a la siguiente dirección:
Esteve.Canales@uab.es
© Esteban Canales.
Abril 2002 |