Poca visibilidad de repositorios latinoamericanos en Google Scholar

Poca visibilidad de repositorios latinoamericanos en Google Scholar

El autoarchivo es la forma que tienen los autores de publicar en Acceso Abierto su producción académica, ya sean investigaciones originales, tesis, material de estudio y todas aquellas actividades vinculadas al conocimiento científico. Para esto, la mayoría de las universidades cuentan con repositorios institucionales donde se centraliza esta información. Para asegurarse si estos esfuerzos cumplen con sus propósitos, el procedimiento más directo y sencillo es saber qué presencia e impacto tienen estos  repositorios en la Web, especialmente en los principales buscadores que son: Google y Google Scholar (GS).

Un artículo reciente titulado Are Latin-American repositories invisible on Google and Google Scholar, presentó resultados muy pobres comparados con las expectativas de los investigadores, lo que fue el puntapié inicial de una interesante discusión en la red de Indicadores en Ciencia y Tecnología (INCYT) la última semana del mes de junio pasado.

La visibilidad y cobertura deficiente que tienen los repositorios en general en los buscadores Google y Google Scholar ya tiene su historia. En el año 2012, un artículo de Arlitschy O’Brien, que analizaba 21 repositorios en universidades de Estados Unidos, mostró que la cobertura de la indexación de Google y Google Scholar es baja con un ratio de documentos indexados del orden del 30% en GS. Después de esta investigación otro análisis similar se realizó sobre el repositorio de documentos del Banco Mundial, revelando que sólo un 17,5% de los más de 15.000 documentos están indexados en Google y Google Scholar. Para concluir, los resultados de la investigación que se acabaron de exponer, analizaron la visibilidad e impacto Web de 127 repositorios latinoamericanos que contienen 113.000 documentos PDF, donde hallaron que Google solo llega a una cobertura del 48,3% y apenas se detectan el 2,5% en GS. Si la búsqueda se amplía a todo tipo de documentos, el ratio de recuperación es mayor en Google, pero GS sólo llega a un tercio de los documentos existentes.

Estos resultados llevan a preguntarse: ¿por qué los repositorios son tan poco visibles?, ¿cómo lograr que sean correctamente indexados para hacer visibles sus documentos?, ¿cómo afecta esta situación la promoción de la carrera de un investigador que desea publicar en Acceso Abierto?.

Es importante destacar también que hay razones técnicas que podrían explicar los resultados a los que se arribaron:

-Problemas en los robots de Google y Google Scholar, y los procedimientos para recuperar documentos indexados. Es importante mencionar que Google y GS usan bases de datos, robots y criterios de indexación diferentes.

-Inconvenientes en las estructuras de los documentos depositados.

-Problemas en las arquitecturas de los Sitios Web de los repositorios que alojan los documentos.

Es fundamental entonces, poder encontrar soluciones en estas cuestiones ya que la visibilidad de los contenidos depende mucho de esos buscadores. La baja cobertura de indización por Google y Google Scholar a los repositorios afecta las ventajas del Acceso Abierto, porque esa documentación quedará oculta a los usuarios al no poder acceder vía GS y solamente podrían hallarse por el acceso directo en los repositorios. La superación de estos problemas es el gran desafío.

Fuente

http://blog.scielo.org/es/2014/09/18/repositorios-en-america-latina-tienen-poca-visiblidad-en-google-scholar/#.VCA0hZSSzTQ

ORDUÑA-MALEA, E., et al. Are Latin-American repositories invisible on Google and Google Scholar?.EC3 Google ScholarDigestReviews. 2014, nº 3. http://googlescholardigest.blogspot.com.es/2014/06/are-latin-americanrepositories.html

ARLITSCH, K., andO’BRIAN, P.S. Invisible institutionalrepositories: addressingthelowindexing ratios of IRs in Google. Tech Library Hi Tech. 2012, vol. 30, nº 1, pp. 60-81. https://jira.duraspace.org/secure/attachment/13020/Invisible_institutional.pdf