In der sich ständig weiterentwickelnden Welt der Künstlichen Intelligenz (KI) und des Maschinellen Lernens (ML) hat die exponentielle Zunahme von Konferenzpapieren und technologischen Fortschritten die Verbreitung wissenschaftlicher Erkenntnisse erheblich verändert. Eine bemerkenswerte Entwicklung in diesem Bereich ist die Praxis der Online-Vorveröffentlichung auf Plattformen wie ArXiv, die es Forschern ermöglicht, frühzeitig auf Forschungsergebnisse zuzugreifen, oft Monate vor der offiziellen Veröffentlichung. Dies wirft Fragen zur sich verändernden Relevanz und Rezeption dieser Arbeiten in traditionellen akademischen Foren auf. Besonders interessant ist, wie Menschen in der heutigen digitalen Ära Forschungsarbeiten auswählen und lesen.
In diesem Kontext untersucht eine aktuelle Studie die Rolle von Social Media Influencern bei der Erhöhung der Sichtbarkeit von ML-Forschungsarbeiten, insbesondere der Zitationshäufigkeit von Arbeiten, die sie teilen. Die Studie verwendet ein umfangreiches Datenset von über 8.000 Arbeiten, das Tweets von Dezember 2018 bis Oktober 2023 umfasst, sowie 1:1-Matched Controls basierend auf Veröffentlichungsjahr, Veranstaltungsort und Abstract-Themen. Die Analyse zeigt einen signifikanten Anstieg der Zitationszahlen für von Influencern geteilte Arbeiten, mit medianen Zitationszahlen, die 2-3 Mal höher sind als die der Kontrollgruppe. Darüber hinaus untersucht die Studie die geografische, geschlechtsspezifische und institutionelle Vielfalt der hervorgehobenen Autoren.
Die Studie basiert auf retrospektiven Kohortenstudien, bei denen eine Behandlungs- und eine Kontrollgruppe mit identischen zugrunde liegenden Kovariaten verglichen werden, um den durchschnittlichen Behandlungseffekt zu bestimmen. In diesem Fall wird angenommen, dass die Zitationshäufigkeit einer Arbeit am stärksten durch die verstrichene Zeit, die Qualität und das Thema beeinflusst wird. Während die verstrichene Zeit einfach zu messen ist, sind die Qualität und das Thema einer Arbeit schwer zu quantifizieren. Die Publikationsstätte und das Jahr dienen als Proxy für die Qualität, und eine Texteinbettung des Titels und des Abstracts dient der Themenbestimmung.
Die Analyse ergab, dass Arbeiten, die von Social Media Influencern wie AK (@_akhaliq) und Aran Komatsuzaki (@arankomatsuzaki) geteilt wurden, signifikant höhere Zitationszahlen aufwiesen als nicht geteilte Arbeiten. Diese Influencer fungieren als wichtige Kuratoren in der Flut von Informationen und heben bedeutende Arbeiten für die Gemeinschaft hervor. Die Studie betont jedoch die Notwendigkeit eines ausgewogenen Forschungsökosystems. Eine Überbetonung einer ausgewählten Gruppe von Kuratoren könnte das Forschungsspektrum unabsichtlich verzerren und bestimmte Themen oder Perspektiven gegenüber anderen bevorzugen.
Die Studie kommt zu dem Schluss, dass Social Media eine konstruktive Rolle bei der Bewältigung der Herausforderungen durch die schiere Menge an Literatur spielt. Sie hebt die Bedeutung verantwortungsvoller Kurationspraktiken hervor und fordert Influencer auf, eine journalistische Integrität zu wahren, die eine vielfältige Darstellung von Forschungsthemen, Autoren und Institutionen umfasst. Darüber hinaus wird vorgeschlagen, dass die akademische Gemeinschaft, insbesondere Konferenzorganisatoren, eine Diskussion über die Weiterentwicklung des Konferenzsystems führen sollte. Diese Evolution ist notwendig, um die Kernherausforderung der Bewältigung einer überwältigenden Anzahl von Einreichungen anzugehen und sicherzustellen, dass qualitativ hochwertige Forschung effektiv anerkannt und verbreitet wird.