- Werfen Stoßen Wissen Schaffen
- Posts
- Gedanken zu Testungen und Assessments im Sport
Gedanken zu Testungen und Assessments im Sport
Vergangenes Wochenende habe ich mit Kaderathlet:innen eine Leistungsdiagnostik durchgeführt und am kommenden Wochenende steht der Landeskadertest an. Aktuell bin ich also umgeben von verschiedensten Testverfahren. Ein guter Anlass, einige Gedanken zur Testpraxis im Sport zu teilen und zu hinterfragen. Einsteigen möchte ich mit einer kleinen Geschichte:
Eine Frau spazierte abends eine Straße entlang. Vor einer Bar sieht sie einen Mann auf allen Vieren im Licht einer Straßenlaterne auf dem Boden herumkrabbeln. „Alles gut?“, fragt die Frau. „Ich suche meine Autoschlüssel, die sind mir heruntergefallen“, antwortet der sichtbar leicht angetrunkene Mann. „Dann helfe ich Ihnen“, sagt die Frau und beginnt ebenfalls nach den Schlüsseln zu suchen. Nach einer erfolglosen Weile fragt die Frau: „Sind Sie sich sicher, dass Sie die Schlüssel hier verloren haben?“ „Nein“, antwortet der Mann, „heruntergefallen sind sie mir dort drüben, aber hier ist das Licht viel besser zum Suchen.“
Warum testen?
Jeder von uns wurde schon getestet. Tests begleiten uns von der Schule bis hin zum Leistungssport. Vom IQ-Test über den Medizin-Check bis hin zum schlimmsten Test von allen – dem Cooper-Test. Jeder dieser Tests überprüft andere Dinge und hat unterschiedliche Inhalte. Dennoch zielen Tests generell auf zwei Dinge ab:
Die Feststellung des momentanen Leistungsstandes
Die Einordnung des Leistungsstandes in Relation zu einem Referenzrahmen
Dieser Referenzrahmen kann interindividuell (z.B. Normwerte, Rankings) oder intraindividuell (der Vergleich mit sich selbst) sein. Tests bestimmen also einen IST-Wert, der mit einem Referenz- oder SOLL-Wert verglichen wird.
Was ist ein guter Test?
Was macht einen guten Test aus? Die Qualität eines Tests, sowohl in Bezug auf Konzeption als auch auf Anwendung, wird klassisch anhand der drei Hauptgütekriterien bewertet [1]:
Objektivität: Das Testergebnis ist unabhängig davon, wer den Test durchführt, auswertet oder interpretiert.
Reliabilität: Bei gleichbleibenden Bedingungen liefert ein Test wiederholt dasselbe Ergebnis. Eine Veränderung des Testergebnisses sollte nur durch tatsächliche Leistungsänderungen und nicht durch Messfehler des Tests entstehen.
Validität: Ein Test misst tatsächlich das, was er zu messen vorgibt. Das Testergebnis liefert damit Aufschluss in Bezug auf die Zielparameter.
Weitere, sogenannte Nebengütekriterien, wie beispielsweise Ökonomie und Fairness sind ergänzend relevant. Ein Test, der hohe Präzision liefert, aber dessen Durchführung Stunden dauert und der nur mit teurer Spezialausrüstung möglich ist, verliert an Praxistauglichkeit. Schlussendlich können nicht jeder Trainer und jede Trainerin ein mobiles biomechanisches Labor mit sich herumfahren. Ebenso sollte ein Test so gestaltet sein, dass er nicht unbeabsichtigt diskriminiert, beispielsweise durch sprachlich überfordernde Instruktionen.
Welcher Test ist der beste?
Auch bei erfüllten Gütekriterien bleibt die Frage, welcher Test für mich der beste ist. Ein Test ist immer nur so sinnvoll wie seine Fragestellung. Wer wird getestet und was möchte ich überhaupt herausfinden? Wer den Blutzuckerspiegel messen will, sollte keinen IQ-Test durchführen, und wer Wurfleistungen verstehen will, sollte nicht nur die Maximalkraft beim Bankdrücken bestimmen. Tests müssen spezifisch sein, d.h., sie müssen die leistungsrelevanten Parameter unter möglichst realitätsnahen Bedingungen erfassen. In diesem Kontext werden Tests, vor allem in Bezug auf die (ökologische) Validität, häufig hinterfragt. Durch ein zu steriles Testumfeld oder eine zu starke Isolation von einzelnen Leistungsparametern (Laborbedingungen) steigen zwar die Objektivität und die Reliabilität eines Tests, der tatsächliche Erkenntnisgewinn im Transfer der Testergebnisse auf die Bahn und in den Kugelstoßring – auf die Realität – wird aber immer fragwürdiger.
Die Frage danach, welcher Test der beste sei, ist also falsch. Besser wäre, man fragt: Welcher Test beantwortet meine Fragen am besten? Für die Frage nach der sportlichen Leistung ist der Wettkampf der ultimative Test. In der kompetitiven Arena entscheidet sich, wer gewinnt und wer nicht. Wettkämpfe sollten aber nicht die einzigen Tests zur Überprüfung der Leistung sein. Sie sind hochbelastend und testet man erst im Wettkampf, ob das Training funktioniert hat und die Leistung stimmt, ist es zu spät, um noch fruchtbare Anpassungen zu erwirken. Zudem reduziert eine hohe Anzahl an Wettkämpfen die produktiv nutzbare Trainingszeit, was die Leistungsentwicklung negativ beeinflussen kann. Der Wettkampf allein reicht also nicht aus. Wir brauchen ergänzende Tests, die Rückmeldung über Teilleistungen geben, Anpassungen sichtbar machen und Trainingsentscheidungen unterstützen.
Der „beste“ Test ist also immer derjenige, der entscheidungsrelevant ist. Ein Test dient nicht dem Selbstzweck, sondern ist ein Werkzeug im Steuerungsprozess. Wenn ein Test keine trainingsrelevanten Fragen beantworten kann, dann ist er höchstwahrscheinlich überflüssig.
Testen im Trainingsprozess
Viele von euch nehmen das vielleicht nicht bewusst wahr, aber ihr alle testet bereits. Kelvin Giles formuliert es passend: „Training is testing and testing is training.” [2]. Lernen und Training sind ein Prozess. Diesen Prozess begleitet ihr als Trainer:innen jeden Tag und in jeder Trainingseinheit. Im Training wird permanent beobachtet, bewertet und angepasst. Diese fortlaufende Beobachtung ist bereits eine Form des Assessments. Ihr als Trainer:innen schätzt täglich die Entwicklung eurer Athleten ein, basierend auf einer Vielzahl von Informationen wie der Bewegungsausführung, dem Belastungsverhalten oder der emotionalen Stabilität. All diese Eindrücke haben enormen Wert und können häufig nicht durch standardisierte Tests erfasst werden.
Standardisierte Tests können diese subjektiven Coaching-Eindrücke jedoch sinnvoll ergänzen. Sie liefern objektives Feedback, an dem sich die Trainingssteuerung orientieren kann. Solche Tests müssen aber nicht immer, oder vielleicht sogar in den wenigsten Fällen, spezielle leistungsdiagnostische Verfahren sein. Tests können auch bestimmte Trainingseinheiten sein, wie bspw. Simulationsrennen, oder nahtlos in eine normale Trainingseinheit eingebaut werden, wie das Messen vom Kugelschocken während dem Aufwärmen. Wichtig ist nur, dass diese Testergebnisse bewusst verwertet werden, im Gesamtkontext des Trainings eingebettet sind und zu konkreten Handlungsempfehlungen führen.
Wann funktionieren Tests nicht?
Nicht alles, was getestet werden kann, ist relevant, und nicht alles, was relevant ist, kann getestet werden. Häufig werden Tests genutzt, ohne diese zu hinterfragen. Beispielsweise versprechen eine Vielzahl an Screenings, Verletzungen verhindern zu können. Dass diese Tests wahrscheinlich nicht funktionieren und, selbst wenn, trotzdem häufig keinen praktischen Nutzen haben [3], wird meist ignoriert. Erinnern wir uns zurück an die einleitende Geschichte: Nur, weil das Licht von Tests Klarheit verspricht, heißt es nicht, dass man dort die Antwort findet.

Ein Physiotherapeut sagt Verletzungen voraus
Fazit
Testen ist wichtig. Tests sollten aber nicht dafür genutzt werden, arbiträre Zahlen zu generieren und Tabellen zu füllen. Tests sollten nicht primär der Selektion, Klassifikation oder der Leistungsprognose dienen (dafür sind sie sowieso nicht geeignet [4, 5, 6]), sondern der Trainingssteuerung. Sie sollten Rückmeldung geben, Orientierung schaffen und Trainingsentscheidungen fundieren.
Fragt euch vor jeder Testung:
Was teste ich?
Warum teste ich?
Wie hilft mir das Ergebnis, mein Training zu verbessern?
Wenn ihr diese Fragen nicht beantworten könnt, dann spart euch die Zeit und den Aufwand.
Abschließend: Testet nicht nur Quantitäten, sondern auch Qualitäten. Zu häufig legen wir Wert auf das, was wir messen können, anstatt zu messen, was tatsächlich Wert hat.
Literatur
1 Döring, N., & Bortz, J. (2016). Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften. Springer. https://doi.org/10.1007/978-3-642-41089-5
2 Giles, K. (2015). Physical Competence Assessment Manual. Movement Dynamics UK Ltd.
3 Bahr, R. (2016). Why screening tests to predict injury do not work—and probably never will…: A critical review. British Journal of Sports Medicine, 50(13), 776–780. https://doi.org/10.1136/bjsports-2016-096256
4 Gogos, B. J., Larkin, P., Haycraft, J. A. Z., Collier, N. F., & Robertson, S. (2020). Combine performance, draft position and playing position are poor predictors of player career outcomes in the Australian Football League. PLOS ONE, 15(6), e0234400. https://doi.org/10.1371/journal.pone.0234400
5 Robbins, D. W. (2010). The National Football League (NFL) Combine: Does Normalized Data Better Predict Performance in the NFL Draft? The Journal of Strength & Conditioning Research, 24(11), 2888. https://doi.org/10.1519/JSC.0b013e3181f927cc
6 Söderström, T., Sandlund, S., Westerlund, R., & Tervo, T. (2024). The role of physiological testing for athlete development in sport: The elite athlete perspective. International Review for the Sociology of Sport, 59(8), 1244–1265. https://doi.org/10.1177/10126902241258677