Schlagwörter des Wissenschaftssystems…
iFQ - Selbstzitate (William Dinkel)

Selbstzitate: Bedeutung, Verteilungsmuster und Methoden der Berechnung
William Dinkel © März 2011

Die Häufigkeit, mit der eine Publikation in den Referenzlisten anderer Publikationen genannt wird (Zitierhäufigkeiten), dient im Rahmen bibliometrischer Analysen als Näherungswert für die Aufmerksamkeit, die ihre Inhalte in wissenschaftlichen Kommunikationsprozessen erzielen. Neben Faktoren wie Inhalt der Publikation, dem zur Ermittlung von Zitierhäufigkeiten eingesetzten Verfahren, den spezifischen Publikations- und Zitiergewohnheiten einer Scientific Community, dem Land des Wissenschaftlers 1: Bedeutung, Verteilungsmuster und Methoden der Berechnung oder der Sprache der Publikation sind auch Selbstzitate ein Faktor, der Zitierhäufigkeiten beeinflusst. Angesichts der Tatsache, dass Selbstzitate vom Autor der Publikation selbst beeinflusst werden können, und damit von demjenigen, der potentiell am meisten von höheren Zitierhäufigkeiten profitiert, kommt ihnen eine besondere Bedeutung bei der Interpretation von Zitatraten zu. Im Folgenden soll anhand einschlägiger Literatur beleuchtet werden, was Selbstzitate abbilden, wie sie ermittelt werden und welche systematischen Verzerrungen in Angaben zum Anteil von Selbstzitierungen an Zitierhäufigkeiten zu erwarten sind.

Selbstzitate
Selbstzitate können auf mehreren Ebenen auftreten. Unterscheiden lassen sich Autoren-Selbstzitate, institutionelle Selbstzitate und Länder-Selbstzitate. Snyder und Bonzi (1998) beschreiben Autoren-Selbstzitate als all diejenigen Zitierungen, die von Publikationen eingehen, in denen einer der Autoren des zitierenden Dokuments den Namen eines der Autoren des zitierten Dokuments trägt. Institutionelle Selbstzitate werden im Anschluss daran als Zitierungen von Autoren, die der gleichen Institution zugeordnet sind, definiert; Selbstzitate auf Länderebene als Zitierungen, die von Publikationen ausgehen, die von mindestens einem Autor aus dem gleichen Land verfasst wurden. Lawani (1982) unterscheidet diachrone und synchrone Selbstzitate. Diachrone Selbstzitate sind von eigenen Publikationen eingehende Zitierungen, synchrone Selbstzitate sind Zitierungen, die auf eigene Publikationen referieren. Egghe und Rousseau (1990) definieren daran anknüpfend self-citing und self-cited rate als Indikatoren zur Abbildung der Rolle von Selbstzitaten in Zitierhäufigkeiten. Im Rahmen evaluativer Studien, aber auch bei der Analyse der Verteilung von Selbstzitierungen, werden in der Regel Angaben zu synchronen Zitierungen bzw. self-cited rates herangezogen.

Bedeutung
Für die Beantwortung der Frage nach der Bedeutung von Selbstzitierungen bieten sich unterschiedliche Ansatzpunkte.
Die Rolle, die Autoren-Selbstzitate in der wissenschaftlichen Kommunikation spielen, lässt sich aus zwei Perspektiven beleuchten. Einerseits wurde gezeigt, dass Autoren-Selbstzitate eine wichtige Rolle für die Attraktion externer Zitierungen spielen (van Raan 2008, Aksnes 2007). Je höher der Anteil der Autoren-Selbstzitate direkt nach der Publikation ist, desto höhere Zitatraten sind zu erwarten. Entsprechend scheint es plausibel, Autoren-Selbstzitate als gezieltes Mittel zur Generierung von Relevanz zu interpretieren. Andererseits haben Snyder/Bonzi (1990) basierend auf einer Befragung von Wissenschaftlern gezeigt, dass sich die Motivation für Autoren-Selbstzitate grundsätzlich nicht von derjenigen für externe Zitierungen unterscheidet. Der häufigste Grund für Zitierungen ist sowohl bei Zitierungen eigener als auch fremder Arbeiten die Benennung von Vorarbeiten, die Einfluss auf die zitierende Publikation haben. Angesichts des kumulativen Charakters (natur-)wissenschaftlichen Wissens scheint es gerechtfertigt anzunehmen, dass in früheren eigenen Arbeiten generiertes Wissen in neue Publikationen zu verwandten Themen einfließt. Entsprechend bilden auch Selbstzitate Informationsflüsse ab. Dadurch besteht insbesondere bei Autoren, die langfristig an einem Forschungsprogramm arbeiten, eine höhere Wahrscheinlichkeit, sich selbst zu zitieren. Andererseits lassen sich Autoren-Selbstzitate als Mittel zur Verbesserung der Stellung innerhalb der Scientific Community interpretieren. Dem zugrunde liegt die Annahme, dass Zitierhäufigkeiten und die daraus abgeleiteten Indikatoren durch strategisches Zitieren eigener Publikationen künstlich erhöht und dadurch eine de facto nicht vorhandene Relevanz von Publikationen in der Scientific Community suggeriert wird. Bestätigt wird diese Einschätzung durch die Tatsache, dass insbesondere Publikationen, die sich durch für ihre Vergleichsgruppe niedrige Zitierhäufigkeiten auszeichnen, einen relativ betrachtet hohen Anteil an Autoren-Selbstzitaten aufweisen. Unabhängig davon welche der beiden Perspektiven bei der Betrachtung der einer bestimmten Publikation plausibler erscheint, lässt sich kaum bestreiten, dass Autoren-Selbstzitate keinen unmittelbaren Hinweis auf die Rezeption von Publikationen innerhalb einer Community darstellen.
Wenngleich die Interpretation institutioneller und Länder-Selbstzitate weit schwieriger ist, bieten sich hier zwei ähnliche idealtypische Herangehensweisen. So kann ein hoher Anteil institutioneller Selbstzitierungen als Ausdruck der Existenz von sich intern strategisch zitierenden Fachbereichen herangezogen oder alternativ als natürliche Folge der Zusammenarbeit im Rahmen eines stark integrierten Forschungsschwerpunkts innerhalb einer Institution gewertet werden (vgl. Hendrix 2009). Und auch ein hoher Anteil Länder-Selbstzitate an allen Zitierungen kann entweder als Ausdruck der Isolation einer nationalen Scientific Community interpretiert werden oder die Folge der relativen Größe des Feldes im jeweiligen Land sein (Moed 2005: 294). Eine allgemein gültige Aussage darüber, welche Aspekte wissenschaftlicher Kommunikation institutionelle und Länder-Selbstzitate abbilden, ist kaum möglich.

Verteilungsmuster
Je nach Typus der Selbstzitierung lassen sich verschiedene Muster in der Verteilung selbiger ausmachen. Der weltweite Anteil an Autoren-Selbstzitaten wird auf rund 9 (Hendrix) bzw. 20 Prozent (Aksnes 2003, Glänzel 2004) beziffert. Den höchsten Anteil an der jährlichen Gesamtzahl von Zitierungen haben Selbstzitate im Zeitraum direkt nach Publikation. Dieser Anteil nimmt im Zeitverlauf nichtlinear ab (Aksnes 2003). Darüber hinaus zeigt sich, dass insgesamt unterdurchschnittlich zitierte Publikationen einen im Verhältnis höheren Anteil an Selbstzitierungen aufweisen (Aksnes 2003). Eine größere Rolle spielen Selbstzitate bei Publikationen, die von mehreren Autoren verfasst wurden. Dieser Effekt wird verstärkt, wenn Autoren aus unterschiedlichen Ländern beteiligt sind. Jedoch steigt der Anteil an Selbstzitaten nicht mit der Anzahl an Koautoren (Persson et al. 2004). Schließlich lassen sich disziplinäre Unterschiede in der Verteilung von Selbstzitaten ausmachen. Hendrix beziffert den Anteil an Selbstzitaten in der Physik auf 15 Prozent gegenüber 3 bzw. 6 Prozent in den Geistes- und Sozialwissenschaften. Der durchschnittliche Anteil institutioneller Selbstzitate wird auf rund 20 Prozent beziffert (Hendrix 2009:323). Entscheidend beeinflusst wird der Anteil institutioneller Selbstzitate durch die Größe der betrachteten Institution und den relativen Impact ihrer Publikationen. Der Anteil an institutionellen Selbstzitaten wächst mit der Größe der Gruppen und sinkt mit dem Impact der Publikationen der Gruppe (van Raan 2008: 18, Hendrix 2009). Der weltweite Anteil nationaler Selbstzitierungen wird für die 80er Jahre mit rund 70 Prozent angegeben. Es gibt eine klare Präferenz zur Zitierung von Publikationen aus dem nationalen Kontext, welche in den USA stärker ausgeprägt ist als in Europa. Eine Ursache hierfür mag in Sprachunterschieden und spezifischen nationalen Forschungsprofilen liegen (Moed 2005: 296).

Methoden der Berechnung
Aus den oben vorgestellten Ansätzen zur Operationalisierung von Selbstzitierungen ergeben sich einige methodische Herausforderungen bei deren Ermittlung. Grundlage der Ermittlung von Autoren-Selbstzitate sind Autorennamen. Entsprechend führen Homonyme und Schreibfehler zu Verzerrungen bei der Ermittlung des Anteils von Selbstzitaten. Insbesondere häufig auftretende Autorennamen sind damit ein unzureichendes Kriterium zur Bestimmung der Identität einzelner Autoren. Als Konsequenz kann davon ausgegangen werden, dass der Anteil an Selbstzitaten insbesondere für Publikationen von Autoren mit häufigen Autorennamen systematisch zu hoch angesetzt ist.
Auch die verlässliche Identifikation institutioneller Selbstzitate stellt eine Herausforderung dar. Neben der grundsätzlichen Frage, wie zuverlässig die Zuordnung von Autoren zu Institutionen basierend auf den Angaben in den Publikationen überhaupt ist, stellt die Codierung von Institutionen, also die Abbildung struktureller Veränderungen von Institutionen sowie die Bereinigung unterschiedlicher Schreibweisen, eine Fehlerquelle dar. Insbesondere wenn lange Zeiträume zwischen Publikation und Zitierung liegen, wird die Ermittlung von institutionellen Selbstzitaten erschwert. Eine Interpretation von Länder-Selbstzitaten ist ohne eine Normalisierung anhand der Gesamtzahl der zitierbaren Dokumente nur bedingt möglich.
Eine weitere methodische Herausforderung bei der Ermittlung von Selbstzitaten ist der Umgang mit Publikationen, die in Zusammenarbeit mehrerer Koautoren entstanden sind. In solchen Fällen bieten sich verschiedene Möglichkeiten der Definition von Selbstzitaten:

  1. Eines der Attribute (Autoren, Affiliationen, Länder) des zitierten Dokuments ist auch Attribut des zitierenden Dokuments.
  2. Alle Attribute (Autoren, Affiliationen, Länder) des zitierten Dokuments sind auch Attribut des zitierenden Dokuments.
  3. Einige der Attribute (Autoren, Affiliationen, Länder) des zitierten Dokuments sind auch Attribute des zitierenden Dokuments.

Als Korrektiv für die sich daraus ergebenden Verzerrungen im Anteil an Selbstzitierungen schlagen Schubert und Glänzel (2006) eine nach der Anzahl übereinstimmender Attribute gewichtete Zählung von Selbstzitaten vor. Autoren-Selbstzitate werden diesem Verfahren folgend ermittelt, indem die Anzahl unterschiedlicher Autoren, die sowohl an zitierter als auch zitierender Publikation beteiligt waren, in Verhältnis zu der Gesamtzahl unterschiedlicher Autoren der beiden Publikationen gestellt wird. Eine Selbstzitierung einer mit 4 Koautoren verfassten Publikation in einer Referenzliste einer Publikation, die der gleiche Autor zusammen mit 3 davon unterschiedlichen Koautoren verfasst hat, würde so als 1/8 gezählt. Insgesamt lässt sich festhalten, dass jede der Methoden potentiell zu Verzerrungen führt. Angaben zum Anteil von Selbstzitaten sind daher als Näherungen zu verstehen, deren Präzision mit der Qualität der verfügbaren Daten und der zur Identifikation eingesetzten Verfahren steigt.

Zusammenfassung
Es wurde gezeigt, dass Selbstzitierungen sehr unterschiedliche Aspekte der wissenschaftlichen Kommunikation abbilden. Der grundsätzliche Ausschluss von Selbstzitaten aus bibliometrischen Analysen hat daher einen Informationsverlust zur Folge. Gleichzeitig wurde gezeigt, dass insbesondere Autoren-Selbstzitate nur bedingt als  Indikator für die Rezeption von Publikationen in der Scientific Community herangezogen werden können. Um dem in der Interpretation bibliometrischer Studien insbesondere in evaluativen Kontexten und in Studien auf der Mikro- und Mesoebene Rechnung zu tragen, ist es daher sinnvoll, Indikatoren, die die Bedeutung von Autoren-Selbstzitaten abbilden, in die Analyse einzubeziehen  (vgl. Thijs/Glänzel 2006). Dabei gilt es Verzerrungen, die sich aus den Methoden der Ermittlung von Autoren-Selbstzitaten sowie der Methode der Zählung von Autoren-Selbstzitaten ergeben, zu berücksichtigen.

Literatur

Aksnes, D.W., 2003: A macro study of self-citation. Scientometrics, 56 (2), 235-246.
Bonzi, S. / Snyder, H.W., 1991: Motivations for citation: A comparison of self citation and citation to others. Scientometrics, 21 (2), 245-252.
Bonzi, S. / Snyder, H.W., 1998: Patterns of self citation across fields of inquiry. Journal of Information Science, 24 (6), 431-435.
Costas, R. / Bordons, M., 2005: Bibliometric indicators at the micro-level: Some results in the area of natural resources at the Spanish CSIC. Research Evaluation, 14 (2), 110-120.
Costas, R. / van Leeuwen, T.N. / Bordons, M., 2010: Self-citations at the meso and individual levels: Effects of different calculation methods. Scientometrics, 82 (3), 517-537.
Fowler, J.H. / Aksnes, D.W., 2007: Does self-citation pay? Scientometrics, 72 (3), 427-437.
Frandsen, T.F., 2007: Journal self-citations-Analysing the JIF mechanism. Journal of Informetrics, 1 (1), 47-58.
Glänzel, W. / Debackere, K. / Thijs, B. / Schubert, A., 2006: A concise review on the role of author self-citations in information science, bibliometrics and science policy. Scientometrics, 67 (2), 263-277.
Glänzel, W. / Thijs, B., 2004: Does co-authorship inflate the share of self-citations? Scientometrics, 61 (3), 395-404.
Glänzel, W. / Thijs, B., 2004: The influence of author self-citations on bibliometric macro indicators. Scientometrics, 59 (3), 281-310.
Glänzel, W. / Thijs, B. / Schlemmer, B., 2004: A bibliometric approach to the role of author self-citations in scientific communication. Scientometrics, 59 (1), 63-77.
Moed, H.F., 2005: Citation Analysis in research evaluation. Springer: Dordrecht.
Persson, O. / Glänzel, W. / Danell, R., 2004: Inflationary bibliometric values: the role of scientific collaboration and the need for relative indicators in evaluative studies. Scientometrics, 60 (3), 421-432.
Schubert, A. / Glänzel, W. / Thus, B., 2006: The weight of author self-citations. A fractional approach to self-citation counting. Scientometrics, 67 (3), 503-514.
Snyder, H. / Bonzi, S., 1998: Patterns of self-citation across disciplines (1980-1989). Journal of Information Science, 24 (6), 431-435.
Thijs, B. / Glänzel, W., 2005: The influence of author self-citations on bibliometric meso-indicators. The case of European universities. Scientometrics, 66 (1), 71-80.
Van Raan, A.F.J., 2008: Scaling rules in the science system: Influence of field-specific citation characteristics on the impact of research group. Journal of the American Society for Information Science and Technology, 59 (4), 565-576.
Van Raan, A.F.J., 2008: Self-citation as an impact-reinforcing mechanism in the science system. Journal of the American Society for Information Science and Technology 59 (10), 1631-1643.
Van Raan, A.F.J., 1998: The influence of international collaboration on the impact of research results: Some simple mathematical considerations concerning the role of self-citations. Scientometrics, 42 (3), 423-428.

 

1 Im Folgenden wird aus Gründen der besseren Lesbarkeit nur die männliche Form verwendet. Die weibliche Form ist selbstverständlich immer mit eingeschlossen.