Zusammenfassung Die Studie präsentiert Ergebnisse eines Forschungsvorhabens, durch welches in einem interdisziplinären Team aus Arbeitsmedizinern, Psychologen, Ingenieuren und Informatikern Analysen hinsichtlich anwenderbezogener Fragestellungen zum Langzeiteinsatz mobiler Augmented Reality (AR) durchgeführt werden. Allgemein geht es dabei um die Feststellung der psychischen Belastung durch die AR-Systeme und die dabei entstehenden subjektiven Beanspruchungen des Nutzers. Um die Ziele erreichen zu können, wurde eine erste Untersuchung durchgeführt, bei der im Langzeiteinsatz eine AR-gestützte Tätigkeit mit einer ähnlichen, nicht-AR-gestützten Tätigkeit bei 12 männlichen freiwilligen Probanden verglichen wurde. Dies diente dazu, zunächst kritische Parameter beim Einsatz solcher AR-Systeme zu ermitteln. Es wurde durch die Befindlichkeits-Skala, die Eigenzustandsskala und den Beschwerdenfragebogen die aktuelle Befindlichkeit des Probanden vor und nach der Arbeit eruiert. Insgesamt stellte sich dabei als Ergebnis heraus, dass die Arbeit mit AR keine eindeutig höhere Beanspruchung oder negative Veränderung der Motivationslage beim Nutzer hervorrief als die Arbeit mit einer Papierliste; bei Papier und AR fanden ähnliche Änderungen der Beanspruchungssituation statt. Die Ergebnisse der Fragebögen stützen die Hypothese, dass gegen Ende der zweistündigen Arbeitsphase alle Probanden stärker beansprucht waren. Diese Daten deuten darauf hin, dass während eines kontinuierlichen zweistündigen Einsatzes eines AR-Systems keine signifikante Mehrbeanspruchung beim Anwender entsteht. Schlüsselwörter AR-Systeme Beanspruchung EZ-Skala Befindlichkeitsskala Analysis of Subjective Strain During Application of Mobile Augmented Reality Systems Abstract This article presents first results of a research project of an interdisciplinary team of ergonomics, psychologists, engineers and computer scientists to investigate on user-related issues during long-term application of mobile Augmented Reality (AR). In general this concerns the identification of psychological loads and the respective strain caused by the AR system. Results of a user study comparing strain during an AR supported and a non-AR supported work task in a laboratory setting with 12 male subjects that voluntarily took part in the test are presented and discussed. This user study aimed on identifying critical parameters when using such AR-systems. Questionnaires used for acquiring data of subjective user strain before and after the tests were the discomfort questionnaire, sensitivity questionnaire and the EZ-scale. Altogether work with AR did not show a significantly higher subjective strain or negative change of motivation compared to work with a paper list. The increase of strain was comparable for both AR and paper. Results of the questionnaires support the hypothesis that the overall subjective strain after two hours of continuous work is higher than before work for all subjects. These results also tend to show that a continuous two hour application of an AR system does not result in a higher strain for the user. Key words AR-systems strain EZ-Scale Sensitivity questionnaire
Einführung
In Zeiten immer komplexerer technischer Produkte, fachlich anspruchsvollster medizinischer Eingriffe sowie hochkomplexer Visualisierungen, wie zum Beispiel im Bereich Architektur, gewinnen besonders Techniken der virtuellen Realität (Virtual Reality, VR) disziplinübergreifend an Bedeutung für die Einhaltung höchster Qualitätsstandards. Die virtuelle Realität ist eine Mensch-Maschine-Schnittstelle, die durch die Merkmale Interaktion, Immersion und Simulation gekennzeichnet ist, so dass ein Anwender sich frei in dieser Realität bewegen, mit ihr interagieren und in sie eintauchen kann. Nach Milgram et al.1 beschreibt das Realitäts-Virtualitäts-Kontinuum (Abbildung 1) zwischen dieser virtuellen Realität und unserer echten Realität den Bereich der Mixed Reality Technologien, welche sich wiederum in Augmented Reality (erweiterte Realität, AR) und Augmented Virtuality untergliedern lassen. Inzwischen hat sich für den Bereich zwischen Realität und VR allgemein der Begriff AR etabliert, die Begriffe Mixed Reality und Augmented Virtuality werden selten genutzt.
Im Gegensatz zur VR, bei der virtuelle dreidimensionale Szenarien komplett vom Computer repräsentiert und visualisiert werden, wird mit Hilfe der AR die reale Welt um einige wenige virtuelle Elemente ergänzt, sodass die Darstellung zusätzlicher Informationen in der realen Welt im Vordergrund steht. Dadurch spielt die Bereitstellung und Verarbeitung aller Arten von Informationen bei der erweiterten Realität eine wesentliche Rolle.
Azuma2 versteht unter der Augmented Reality die Kombination (teilweise Überlagerung) der virtuellen Realität und der Realität, wobei die Interaktivität in Echtzeit erfolgt sowie reale und virtuelle Objekte 3-dimensional zueinander in Bezug stehen. Diese Definition ist technisch betont. Immer mehr verbreitet ist aber eine Definition, die auch eine Ausweitung der Sinneswahrnehmung des Menschen durch Sensoren von Umgebungseigenschaften berücksichtigt. Durch die AR werden also Informationen situationsgerecht im Sichtfeld eines Anwenders z.B. per Head-Mounted Display (HMD) dargestellt. Bei einem Head-Mounted Display (engl. am Kopf befestigte Anzeige) handelt es sich um ein auf dem Kopf getragenes visuelles Ausgabegerät, das am Computer erzeugte Bilder auf einem augennahen Bildschirm darstellt oder direkt auf die Netzhaut projiziert.
Unter einem AR-System versteht man das System der notwendigen technischen Bestandteile, um eine AR-Anwendung aufzubauen, wie z.B. Kamera, Trackingsysteme (Positions- und Lageerkennung), Tracking-Algorithmen, Eingabegeräte und Unterstützungssoftware.
Während die Darstellung von Navigationshinweisen in Windschutzscheiben von Fahrzeugen sowie Head-Up-Displays in Kampfflugzeugen schon länger eingesetzt werden, findet die AR auch in der modernen Arbeitswelt zunehmend Einsatzfelder: z.B. bei Werkern der Automobil-, Flugzeug- und Schiffbauindustrie, bei Designern, Konstrukteuren, medizinischen Operateuren und Fabrikplanern. Die Darstellung und interaktive Analyse von Landschaften, Karten usw. in der Geologie sowie die Erstellung von virtuellen Prototypen oder in der Ergonomie sind als eine weitere Möglichkeit der Anwendung der erweiterten Realität zu nennen.
Die ersten funktionsfähigen HMDs baute Ivan Sutherland im Jahr 1968, also zwei Jahre nach seiner und Raymond Goertzs Entwicklung des Prototyps der ersten HMDs sowie eines Datenhandschuhs. Die Entwicklung wurde 1985 durch ein Forschungszentrum der NASA (Workstation VIEW) fortgesetzt. Fast zeitgleich kam das IHADSS (Integrated Helmet and Display Sight System) für den AH-64 Apache Helikopter auf den Markt, ein in den Helm des Piloten integriertes System. 1991 begann die Entwicklung der VRD (Virtual Retina Display) und 1993 die Konstruktion eines Wearable Computers, der Informationen auf einer Datenbrille erzeugt. Zwei der letzten Entwicklungen sind das Eyebud 800 von eMagin, ein neues HMD für den direkten Anschluss an den Apple iPod, und das RockwellCollins ProView SO35-MTV für den Einsatz in rauen Umgebungen.
Im Jahr 2005 wurde eine Literaturrecherche durchgeführt, um zu ermitteln, wie stark bisher in VR/AR-Publikationen auf nutzerbezogene Aspekte eingegangen wurde3. Untersucht wurden über 1100 Arbeiten der Jahre 1992 bis 2004, die auf den Veranstaltungen ISMAR (und deren Vorläufern), ISWC, IEEE VR und Presence vorgestellt wurden (Tabelle 1). Von diesen Publikationen beschrieben ca. 24% Arbeiten aus dem Bereich Augmented Reality. Von diesen AR-Arbeiten betrafen wiederum nur 14% Aspekte der Mensch-Maschine-Interaktion, nutzerbezogene Experimente wurden insgesamt sogar in nur 8% der AR-Arbeiten durchgeführt. Bis heute hat sich an diesem Verhältnis kaum etwas verändert.
Dies macht deutlich, dass die schwerpunktmäßige Orientierung im Bereich AR bisher nur wenig auf dem Anwender des Systems lag. Da auch auf Grund dieses Defizits bisherige Anwendungsdemonstratoren mobiler AR-Systeme nicht produktiv industriell eingesetzt werden, sind für eine erfolgreiche Weiterentwicklung der AR-Technologie zwingend Untersuchungen zu nutzerbezogenen Aspekten in geeigneten Einsatzfeldern notwendig. Bereits abgeschlossene Untersuchungen zu anwenderbezogenen Fragestellungen mit industriellem Einsatzfokus sind besonders im deutschsprachigen Forschungsraum zu finden. Dies lässt sich auf vorangegangene deutsche Leitprojekte wie ARVIKA oder ARTESAS zurückführen und setzt sich in aktuellen Vorhaben wie AVILUS fort.
Bisherige Untersuchungen verdeutlichten das hohe Potenzial der Technologie, zeigten jedoch auch deutlich Fragestellungen hinsichtlich nutzerbezogener Faktoren auf4. Die bisherigen Systeme sind noch relativ schwer, erfordern zudem eine starre Fixierung am Kopf, was den Einsatz in vielen Anwendungen bei realen Arbeitssituationen erschwert. So ist heute noch nicht eindeutig belegt, wie mögliche subjektive Beanspruchungen des Werkers, die durch den Langzeiteinsatz der AR-Technologie entstehen, optimiert werden können. Der hier vorliegende Beitrag präsentiert den aktuellen Stand eines arbeitspsychologischen Forschungsvorhabens, durch welches in einem interdisziplinären Team aus Psychologen, Arbeitsmedizinern, Ingenieuren und Informatikern Analysen hinsichtlich anwenderbezogener Fragestellungen zum Langzeiteinsatz mobiler AR-Technologien durchgeführt werden. Allgemein geht es dabei um die Feststellung der psychischen Belastung durch die AR-Systeme und die dabei entstehenden Beanspruchungen des Nutzers.
Kognitive Faktoren, zum Beispiel der Grad der Übereinstimmung des mentalen Modells des Nutzers mit dem anvisierten mentalen Modell des Assistenzsystems, sind ebenfalls von Bedeutung5. Insbesondere in Bezug auf einen länger andauernden Einsatz müssen perzeptive wie auch kognitive Prozesse und Lerneffekte des Anwenders berücksichtigt werden6 und es gilt zu untersuchen, ob eine möglichst geringe mentale Beanspruchung4 tatsächlich im realen Einsatz gewünscht ist (mögliche Unterforderung, Motivationsmangel, Konzentrationsabbau). Des Weiteren stehen Untersuchungen zu den Nacheffekten auf den Menschen nach Ablegen des Arbeitsmittels HMD noch aus. Motivationale Faktoren wie die Angenehmheit des Tragens oder die wahrgenommene Nützlichkeit des Medieneinsatzes müssen untersucht werden mit dem Ziel, die Akzeptanz deutlich zu verbessern. Bisherige Analysen bei Automobilherstellern, wie z.B. Volkswagen, bestätigen den dringenden Bedarf nachzuweisen, dass Vorteile durch die AR entstehen, ohne die Gesundheit und Leistungsbereitschaft der Anwender zu beeinträchtigen und ohne eine Steigerung der Arbeitsunfallgefahr durch das Tragen der Systeme.
Eines der wesentlichen Ziele der AR-Community muss heute darin bestehen, Erkenntnisse darüber zu erlangen, wie mobile AR-Assistenzsysteme benutzerorientiert gestaltet sein müssen, damit sie produktiv und beanspruchungsoptimiert im industriellen Langzeiteinsatz verwendet werden können. Bevor in ausgewählten industriellen Umgebungen Feldversuche durchgeführt werden, müssen geeignete Laboruntersuchungen stattfinden, um zunächst grundlegende Fragestellungen bearbeiten zu können, ohne den regulären Arbeitsbetrieb zu stören. Hierbei gilt es zum Beispiel, kritische Einflussfaktoren zu identifizieren, durch die eine Beanspruchung des Anwenders beim Einsatz der AR-Technologie ausgelöst wird. Daher war ein Ziel der hier beschriebenen Arbeiten, eine Referenz-Laborumgebung zu erstellen, an der arbeitsmedizinische, psychologische und ingenieurwissenschaftliche Aspekte beim Langzeit-Einsatz der AR-Technologie untersucht werden können, so dass wesentliche Einflussfaktoren bestimmt und später gezielt deren Wertebereiche optimiert werden können. Diese Referenzumgebung sollte auch in weiteren geplanten Vorhaben zur Beanspruchungsanalyse beim Verwenden mobiler AR-Systeme genutzt werden können.
Probanden und Methodik
Insgesamt nahmen 12 männliche Personen freiwillig (Durchschnittsalter 26,9 ± 2,97 Jahre) an den Untersuchungen teil. Alle Probanden hatten bereits Erfahrung mit AR oder VR.
In der hier beschriebenen Untersuchung sollte an diesem Referenzarbeitsbereich die subjektive Beanspruchung geprüft werden, um Erkenntnisse über Langzeiteffekte (motivational, physisch) beim Einsatz eines AR-Systems zu gewinnen und Aussagen zur Mehrbelastung des Nutzers zu treffen. Dazu wurde eine AR-gestützte Tätigkeit mit einer ähnlichen nicht-AR-gestützten Tätigkeit verglichen. Die dabei gewonnenen ersten Erfahrungen können helfen, in nachfolgenden Langzeittests gezielt die identifizierten wesentlichen Faktoren zu untersuchen.
Die Vorgehensweise wurde mit der Ethikkommission der Medizinischen Fakultät der Otto-von-Guericke Universität Magdeburg abgestimmt. Es liegt ein positives Votum der Ethikkommission für die Studie vor (Aktenzeichen 35/08).
Als Versuchsumgebung wurde ein Referenzarbeitsbereich (Abbildung 2) konzipiert und umgesetzt, welcher einem industriellen Kommissionierbereich ähnelt. Als Kommissionierung wird das auftragsbezogene Zusammenstellen von Warenkörben bezeichnet. Somit wird eine realistische Belastung der Probanden bei gleichzeitig gut quantifizierbarem Arbeitsergebnis (Fehler, Arbeitszeit) ermöglicht. Die Optimierung der Kommissionierung war nicht Ziel der Untersuchungen. Der Referenzarbeitsbereich bestand aus sechs Regalen mit insgesamt 58 Fächern, in denen sich je 10 Teile befanden. In jedem der Fächer lagerten sortenrein gleichartige Teile mit einer Teilenummer, die, ähnlich zu realen Teilenummern in der Automobilindustrie, aus einer Buchstaben-Zahlen-Kombination bestand. Die Teilenummern waren sich oft sehr ähnlich, so dass gleiche Sequenzen mit vereinzelt anderen Zahlen/Buchstaben an verschiedenen Orten in den Regalen lagerten. Ähnliche Teilenummern befanden sich sowohl im gleichen Regal als auch in anderen Regalen. Jedes der Teile war mit einem RFID-Smartlabel (13.56 MHz, ca. 55 x 55mm) versehen, welches eindeutig einem festen Fach zugeordnet war und per Lesegerät (Casio DT-X10) ausgelesen werden konnte. Unter jedem Fach wurden zudem optische Marker für das AR-Tracking angebracht und eingemessen. Die Versuchsumgebung war abgeschlossen. Es bestanden homogene Licht-, Temperatur- und Geräuschverhältnisse.
Innerhalb des Versuchsbereiches sollten die Probanden Kommissionieraufträge erfüllen. Diese Aufträge wurden auf zwei Wegen dargeboten: Einerseits stand der vollständige Auftrag auf einer Papierliste, wobei die Liste von oben nach unten abzuarbeiten war und dabei keine Wegeoptimierung vorgenommen werden durfte. Andererseits wurde der auszuführende Auftrag per Head Mounted Display als Kombination aus Text und Hinweisobjekten angezeigt. Jeder Proband musste beide Verfahren absolvieren. Um einen systematischen Fehler zu vermeiden, begann die eine Hälfte der Probanden mit der Papierversion und die andere Hälfte mit der AR-Version.
Das für die Versuche genutzte AR-System bestand aus einem Microvision Nomad ND2100, welches per Funk (Wireless LAN) mit einem im Schultergurt ebenfalls mitgeführten Ultra Mobile PC (UMPC) verbunden war. Auf dem UMPC lief die industriell etablierte Tracking-Software Unifeye SDK der Firma metaio. Sie verarbeitete das Kamerabild der am HMD befestigten Philips 2UCam2Pro Kamera für das Tracking optischer Marker zur Bestimmung von Position und Lage des Anwenders. Wurde der zum aktuell gesuchten Fach zugehörige Marker gefunden, wurde im HMD ein Rechteck als Zielmarkierung abgebildet. Wurde ein anderer Marker als der Zielmarker im Kamerabild gefunden, wurde dessen Position relativ zum Zielmarker ermittelt und die Anzeige eines 2D-Pfeils in Richtung des Zielmarkers genutzt (Abbildung 3). Zusätzlich wurden stets die aktuelle Regalnummer, Teilenummer und eine laufende Nummer angezeigt. Um den Versatz zwischen Kamera und Auge des Anwenders zu kompensieren, wurde als See-Through-Kalibrierung eine Eigenentwicklung basierend auf dem SPAAM-Algorithmus verwendet7. Wenn ein Zielfach gefunden und somit ein Teil entnommen wurde, quittierte der Proband per Druck auf die Leertaste einer Unterarm-Tastatur die Entnahme und forderte somit den nächsten Teilauftrag von einem Auftragsserver an.
Als mögliche Zeiten für die Versuchsdurchführung wurde 1215 Uhr und 1518 Uhr festgelegt, wobei randomisiert gleichverteilt die Probanden ihren Versuchsdurchlauf um 12 Uhr und 15 Uhr begannen. Die beiden gewählten Versuchszeiten entsprechen dem durch den circadianen Biorhythmus unterworfenen Beanspruchungsverhalten des Menschen. Wenn ein Proband einen Versuch um 12 Uhr begann, musste sein zweiter Versuch an einem anderen Tag ebenfalls 12 Uhr beginnen.
Jeder Proband bekam nacheinander mehrere Joblisten mit je 15 Elementen, die entweder vollständig auf eine Papierliste gedruckt oder sequenziell per AR abrufbar waren, wobei Mehrfachaufrufe und gleiche Teile hintereinander möglich waren. Die Auswahl und Reihenfolge der einzelnen Elemente innerhalb einer Jobliste war zufällig aber für alle Probanden gleich, so dass je Jobliste ca. 60 m Weg zu absolvieren waren. Die Probanden entnahmen gemäß der Jobliste Teile aus dem Regalsystem und legten sie in einem Warenkorb ab (Abbildung 4). Wurde eine Jobliste vollständig abgearbeitet, wurde der Warenkorb an die Versuchsleitung übergeben und die nächste Jobliste begonnen. Parallel dazu kontrollierte die Versuchsleitung mit Hilfe des RFID-Scanners die mit dem letzten Warenkorb kommissionierten Teile auf Korrektheit.
Während der Versuche wurde durch die Versuchsbetreuung rückkommissioniert. Um Fehler durch die Rückkommissionierung zu vermeiden, wurden alle Teile mit einer zweistelligen Fachnummer beschriftet, die nicht mit der Teilenummer identisch war und vor der eigentlichen Rückkommissionierung eine Vorsortierung vorgenommen. Nach den Versuchen wurden alle Kisten auf Fehler kontrolliert, die durch die Rückkommissionierung entstanden sein könnten.
Die Hälfte aller Probanden begann den Versuch mit den Papierlisten, die andere Hälfte begann mit AR.
Vor Beginn der Versuche wurden die Probanden über Ablauf und Zweck informiert. Es wurde durch den Befindlichkeitsfragebogen BFS8 sowie die Eigenzustandsskala EZ9 und den Beschwerdenfragebogen die aktuelle Befindlichkeit des Probanden vor und nach der Arbeit ermittelt. Die Auswertung der Fragebögen erfolgte doppelblind.
Befindlichkeitsskala
Bei der Befindlichkeitsskala nach Zerssen8 handelt es sich um ein standardisiertes Testverfahren zur Eruierung des momentanen Befindens des Probanden. Eine Objektivierung von Befindlichkeitsänderungen wird durch mehrmaligen Einsatz der BFS möglich. Der Fragenkatalog, der 28 Eigenschaftspaare enthält, wird im Rahmen psychologischer Untersuchungen eingesetzt.
Der Proband wählt bei jedem Eigenschaftspaar dasjenige Adjektiv aus, das seinem aktuellen Zustand am ehesten entspricht. Nur wenn keine der beiden Eigenschaften zutrifft, wird die Option weder noch gewählt. Bei der Auswertung, die dann computergestützt mit Hilfe des Wiener Testsystems (Fa. Schuhfried GmbH, Österreich) erfolgt, werden Roh-, Perzentil- und T-Werte ermittelt und die Rohwerte anschließend in die Stanine-Werte von 1 bis 9 überführt. Dabei sprechen das Absinken des Stanine-Wertes im Vorher-Nachher-Vergleich für eine Besserung und der Anstieg für eine Verschlechterung des Befindens.
Die durchschnittliche Bearbeitungsdauer der BFS beträgt etwa 3 Minuten.
Eigenzustandsskala EZ-Skala nach Nitsch
Die Eigenzustandsskala (EZ) nach NITSCH ist ein Verfahren zur hierarchisch-mehrdimensionalen Skalierung des aktuellen Befindens einer Person9. Die EZ-Skala ermöglicht die Bewertung der situationsgebundenen Beanspruchungs-, Motivations- und Stimmungslage einer Person als Ausdruck ihres augenblicklichen Gesamtbefindens von Nitsch als Eigenzustand bezeichnet. Diese wird als bedeutsam für die Handlungsregulation aufgefasst. Situationsbedingte Befindlichkeitsänderungen signalisieren jeweils Änderungen der Anforderungsstruktur in Abhängigkeit von personspezifischen Verarbeitungsprozessen.
Die Eigenzustandsskala enthält 40 Adjektive, die bezüglich ihres Zutreffens auf den momentanen Zustand des Probanden auf einer Ordinalskala von 1 (trifft kaum zu) bis 6 (trifft völlig zu) zu bewerten sind. Es handelt sich um eine hierarchische Faktorenanalyse (eine Hierarchie von insgesamt 14 Binärfaktoren), die den Eigenzustand analysiert, verstanden als erlebnismäßig repräsentierte aktuelle Handlungslage einer Person. Man unterscheidet die beiden Faktorengruppen Motivation und Beanspruchung.
Bei der Auswertung werden die Ränge der Adjektive zunächst durch flächentransformierte z-Werte ersetzt, die zu einem Binärfaktor gehörenden z-Werte dann aufsummiert und diese Summenwerte anschließend nach der Stanine-Transformation in die Werte 1 bis 9 überführt. Die Interpretation der erhaltenen Stanine-Werte erfolgt auf der Grundlage einer dreistufigen Faktorenhierarchie, die in Abbildung 5 schematisch dargestellt ist. Dabei werden die Aussagen von der ersten, allgemeinen zur dritten, speziellen Ebene immer detaillierter. Hohe Stanine-Werte für die einzelnen Faktoren bedeuten, dass die Probanden ihr gegenwärtiges Gesamtbefinden und damit ihre Handlungslage positiv einschätzen. Es muss allerdings beachtet werden, dass es sich bei den Faktoren 200 (Handlungsfähigkeit), 220 (Ermüdung), 221 (Erholtheit), 222 (Schläfrigkeit) und 212 (Spannungslage) um so genannte umgepolte Faktoren handelt. Für die Interpretation bedeutet dieser Sachverhalt, dass durch hohe Werte das genaue Gegenteil beschrieben wird; so signalisiert beispielsweise ein Stanine-Wert von 8 beim Binärfaktor 212 ein hohes Maß an Entspannung.
Dieses standardisierte Testverfahren benötigt eine Bearbeitungszeit von ungefähr 10 Minuten.
Beschwerdenfragebogen
Mittels dieses Verfahrens sollen das Vorhandensein und die Intensität körperlicher Beschwerden wie Kopfschmerzen, Muskelverspannung und verschiedene Augensymptome erfasst werden. Um beurteilen zu können, ob die Beschwerden durch die Belastung während des Versuches verursacht wurden oder ob es sich um bereits existierende Phänomene handelt, wurde auch dieser Fragenkatalog den Probanden vor und nach dem Versuch vorgelegt; die Bearbeitungsdauer beträgt etwa 3 Minuten.
Arbeitshypothesen
Die hier beschriebene Untersuchung hatte zum Ziel, die jeweiligen Beanspruchungssituationen vor und nach der Arbeit mit und ohne AR-System zu analysieren und dabei bedeutende Einflussfaktoren zu identifizieren. Dafür wurden zwei Arbeitshypothesen aufgestellt, die überprüft werden sollten.
Die Kommissionierarbeit am Referenzarbeitsbereich stellt sowohl körperliche als auch motivationale Anforderungen an die Probanden dar. Für den arbeitspsychologischen Teil der Untersuchung besagt Hypothese 1:
H1:
Die subjektive Beanspruchung nach der Arbeit ist höher als vor der Arbeit. Dies gilt sowohl für die Arbeit mit dem AR-System als auch mit der Papierliste.
Grundsätzlich stellt der Einsatz zusätzlicher körpergetragener Arbeitsmittel, so auch eines AR-Systems, eine zusätzliche Belastung für den Anwender dar. Dies wird durch die folgende Hypothese ausgedrückt:
H2:
Die subjektive Beanspruchung liegt beim Einsatz eines AR-Systems höher als bei der Arbeit ohne AR-System.
Bei dem Einsatz mobiler AR-Systeme handelt sich um die Anwendung, die das visuelle System beanspruchen kann. Daraus wird die Hypothese 3 formuliert:
H3:
Das visuelle System ist bei der Arbeit mit dem AR-System stärker beansprucht als bei der Arbeit mit der Papierliste.
Statistik
Der Datenumfang erforderte eine sehr detaillierte Aufarbeitung. Die statistische Auswertung erfolgte explorativ; die Testentscheidungen basierten auf einem Signifikanzniveau von 5%. Zur Darstellung der Ergebnisse wurden Mittelwert und Standardabweichung (MW ± SD) verwendet. Die statistischen Berechnungen der erfassten Daten wurden mittels SPSS/PC+ bzw. SPSS 15.0 für Windows durchgeführt.
Die statistische Unterschiede werden mit t, *, ** oder *** bezeichnet:
t p < 0,1; ** p < 0,01; * p < 0,05; *** p < 0,001. Im Falle eines nicht signifikanten Ergebnisses wird kein Zeichen verwendet. Ergebnisse
Befindlichkeitsskala
Die Befindlichkeitsskala (BFS) dient der Erfassung der subjektiven Motivationslage, die zusammengefasst durch einen Stanine-Wert repräsentiert wird. Eine deutliche Abweichung vom Mittelwert 5 (Test zu Retest) deutet auf eine subjektiv veränderte Motivationslage hin.
Insgesamt war über beide Verfahren ein signifikanter Anstieg der Stanine-Werte von 6,4 ± 1,14 auf 7,1 ± 1,0 (p = 0,003; Wilcoxon-Test), also eine veränderte Motivationslage, erkennbar. Die Einzelbetrachtung der Motivationslageveränderung bei den Probanden des Papier- und des HMD-Versuches zum Ende der Untersuchung ist in der Abbildung 6 dargestellt. Der Unterschied vorher zu nachher war beim Einsatz des HMD tendenziell vorhanden und bei der Papierliste signifikant (p = 0,071 bei AR und p = 0,013 bei Papier; Wilcoxon-Test) und lag bei beiden am Ende des Versuchs vergleichbar höher als am Anfang der Untersuchung.
Eine Gegenüberstellung beider Verfahren (Abbildung 7) zeigt eine sowohl am Anfang der Untersuchung als auch an deren Ende vergleichbare Motivation (p = 0,977; Mann-Whitney-Test).
Der Differenzwert des Stanine-Wertes vorher zu nachher war bei beiden Verfahren ähnlich und nicht signifikant (p = 0,478; Wilcoxon-Test). Dies deutet auf eine gleiche Beanspruchung bei beiden Verfahren hin.
EZ-Skala
Die Eigenzustandsskala beschreibt die subjektive Handlungslage einer Person durch Angabe von Stanine-Werten. Hohe Stanine-Werte für die einzelnen Faktoren bedeuten, dass die Probanden ihr gegenwärtiges Gesamtbefinden und damit ihre Handlungslage positiv einschätzen. Hierbei werden in die Zweige Motivation (EZ100) und Beanspruchung (EZ200) unterschieden (Abbildung 5).
Insgesamt verschlechterte sich sowohl die Motivations- als auch Beanspruchungslage beim Vergleich von vorher zu nachher über beide Verfahren meistens signifikant. Beim Einsatz der AR sind signifikante Verschlechterungen erkennbar (Abbildung 8), dies ist jedoch analog zum Verfahren Papier (Abbildung 9).
Sowohl am Anfang (Abbildung 10) der Untersuchung als auch an deren Ende (Abbildung 11) unterscheiden sich die Motivations- und Beanspruchungslage der Probanden mit AR nicht von denen mit der HMD. Bei allen 14 Binärfaktoren der EZ-Skala sind die Unterschiede nicht statistisch signifikant.
In der Differenz der Stanine-Werte (vorher und nachher) beider Verfahren sind keine signifikanten Unterschiede erkennbar (Abbildung 12). Dies deutet darauf hin, dass sowohl der Papier- als auch der AR-Einsatz eine Beanspruchung bewirken, die in einem vergleichbaren Rahmen liegt. Eine subjektiv verschlechterte Handlungslage durch Einsatz des AR-Systems konnte nicht nachgewiesen werden.
Beschwerdefragebogen
Der Beschwerdefragebogen dient zur Erfassung aktueller körperlicher Beschwerden, hier überwiegend bezogen auf das visuelle System des Nutzers.
Der Gesamtvergleich vorher zu nachher ergab, dass die Arbeit im Referenzarbeitsbereich mit AR (Abbildung 13) und Papier (Abbildung 14) allgemein eine Belastung für das visuelle System darstellt. Die Beschwerden Augenbrennen (p = 0,046) und Augenermüdung (p = 0,008) zeigten hier bei dem AR-Versuch signifikante Änderungen zum Ende der Untersuchung. Bei dem Papier-Versuch nahmen nur die Beschwerden Augenermüdung im Laufe des Versuches signifikant zu (p = 0,027). Dies deutet darauf hin, dass die Arbeit mit dem HMD eine zusätzliche Belastung für den Nutzer darstellt, die jedoch speziell hinsichtlich des visuellen Systems näher untersucht werden sollte.
Die Differenzwerte (Abbildung 15) zeigten keinen signifikanten Unterschied zwischen AR und Papier bei beiden Verfahren stiegen bzw. sanken die entsprechenden Werte in ähnlichen Dimensionen.
Insgesamt stellte sich dabei als Ergebnis heraus, dass die Arbeit mit AR keine eindeutig höhere Beanspruchung oder negative Veränderung der Motivationslage beim Nutzer hervorrief als die Arbeit mit einer Papierliste.
Fehler und Arbeitsleistung
Der wesentliche Fokus der beschriebenen Tests lag auf der Untersuchung der Beanspruchung, die durch die Belastung des AR-Systems beim Probanden entstand. Daneben wurde zudem ermittelt, wie viele Fehler durch das Verwenden des AR-Systems im Vergleich zur Papierliste entstanden. Hierbei konnte in folgende Fehlerarten unterschieden werden: fehlerhaftes Teil gegriffen oder Teil zu wenig/zu viel gegriffen. Im realen Produktionsalltag ist ein fehlerhaft gegriffenes Teil von der größten Bedeutung, da es hierdurch im schlimmsten Fall zu teurer Nacharbeit, mindestens jedoch zu Produktionsverzögerungen kommt.
Pro 1 000 Teile wurden bei AR im Schnitt 1,5 Teile fehlerhaft gegriffen und 0,9 Teile zu viel oder zu wenig geholt. Mit der Papierliste hingegen wurden 5,9 Teile fehlerhaft gegriffen und 1,1 Teile zu viel oder zu wenig geholt (Abbildung 16). Insgesamt lag die Häufigkeit von Fehlern beim AR-System unter den Fehlern beim Verwenden der Papierliste. Es besteht jedoch auf der Seite des AR-Systems Verbesserungsbedarf, da Fehler, die beim Einsatz des AR-Systems entstanden, auf folgende Ursachen zurückgeführt werden konnten:
· Fast alle Fehlgriffe beim AR-Einsatz konnten in einer Nachuntersuchung auf eine ungenügende Qualität der See-Through-Kalibrierung zurückgeführt werden. Bei einem Blick aus ungünstigen/spitzen Winkeln an Randbereichen des Displays auf eng beieinander stehende Fächer war die Überlagerung oftmals nicht genau auf dem Ziel, so dass der Nutzer in solchen Situationen schlecht entscheiden konnte, ob er z.B. links oder rechts in ein Fach greifen sollte. Ein Fehlgriff, der nicht auf die See-Through-Kalibrierung zurückzuführen war, entstand nur ein einziges Mal während der gesamten Untersuchung.
· Einige Probanden kommissionierten mit dem AR-System in manchen Jobs zu viel oder zu wenige Teile. Dies war nach Rücksprache mit den jeweiligen Personen darauf zurückzuführen, dass sie in solchen Situationen nicht mehr wussten, ob sie das entsprechende Teil soeben entnommen haben oder ob es noch entnommen werden muss. Dies ist besonders dann der Fall, wenn aus dem gleichen Fach mehrere Teile direkt hintereinander zu entnehmen waren. Ein wesentlicher Grund dafür war, dass alle Teile für die Probanden gleich aussahen.
Bei der Papierlistenkommissionierung hingegen entstanden Fehlgriffe durch fehlerhaftes Ablesen der Teilenummern vom Auftrag oder vom Regal sowie durch fehlerhaftes Einprägen von Lagerorten bestimmter Teile. Ebenso wurden oftmals Teile vergessen oder zu viel geholt, wenn nicht auf eine korrekte Abarbeitung der Liste geachtet wurde.
Insgesamt konnte somit am Rande dieser Untersuchung das hohe Potenzial der AR zur Fehlervermeidung nachgewiesen werden.
Neben der Vermeidung von Fehlern bietet die AR die Möglichkeit, Ausführungszeiten manueller Arbeitsschritte zu verkürzen. Mit dem hier genutzten AR-System gelang dies nicht, das AR-System war im Schnitt 30% langsamer, als die Bearbeitung der Papierliste (AR: 220 Teile pro Stunde, Papier: 310 Teile pro Stunde). Als Grund wurde hierfür die zu ungenaue See-Through-Kalibrierung und ein zu großes Lag zwischen realem/virtuellem Objekt (durchschnittlich 0.3 Sekunden) erkannt. Ebenso negativ wirkten sich die ungenügenden Interaktionsschemata sowie die lose am AR-System hängenden Kabel auf die Arbeitsgeschwindigkeit aus.
Für zukünftige Untersuchungen zur Arbeitsleistung mit mobiler AR muss daher ein optimales System genutzt werden, welches den Benutzer nicht beim Ausführen seiner primären Arbeitsaufgaben behindert, wobei ein Lag zwischen realem und virtuellem Objekt zu vermeiden und eine ausreichende Genauigkeit der See-Through-Kalibrierung erforderlich sind. Die genutzten Interaktionsschemata und Darstellungsmethoden müssen auf den jeweiligen Arbeitsprozess zugeschnitten sein.
Probandenfeedback
Das Feedback der Probanden zum Einsatz der AR war sehr positiv. Die Probanden erkannten das Potenzial der AR, verdeutlichten jedoch gleichfalls die Mängel des aktuellen Systems. Für einen effizienten Einsatz müssen die Interaktion, die Systemgeschwindigkeit sowie die Anzeigemetaphern verbessert werden. Für den Kommissionierbereich wurde als Anzeigemöglichkeit die Gummibandmetapher6 vorgeschlagen.
Eine grundsätzliche Schwachstelle des hier verwendeten HMD stellte der Kopfträger dar: Personen bekamen nach wenigen Minuten Kopfschmerzen, wenn der Kopfträger nicht optimal eingestellt war. Aus den Kommentaren der Probanden wird geschlossen, dass die Qualität des verwendeten Kopfträgers eine entscheidende Rolle für die Akzeptanz von HMD-basierten mobilen AR-Systemen darstellt.
Diskussion und Schlussfolgerungen
Die Ergebnisse der Fragebögen stützen die Hypothese H1, da gegen Ende der zweistündigen Arbeitsphase alle Probanden stärker beansprucht waren. Es wurde jedoch H2 widerlegt, da bei Papier und AR ähnliche Änderungen der Beanspruchungssituation stattfanden. Die Hypothese H3 kann teilweise bestätigt werden, die Beanspruchungen (nicht nur subjektiv empfundene, sondern auch objektiv messbare) im visuellen System bedürfen einer weiteren Untersuchung. Hier wären weitere psychophysiologische Methoden und Ansätze gefragt.
Diese Daten deuten darauf hin, dass während eines kontinuierlichen zweistündigen Einsatzes eines AR-Systems keine signifikante Mehrbelastung beim Anwender entsteht. Diese Aussage erfolgt sogar auf der Grundlage eines nicht optimalen AR-Systems. Zusätzliche Versuche mit 4, 6 oder 8 Stunden Arbeitsdauer sind nötig, um zu überprüfen, ob tatsächlich keine Höherbeanspruchung zum Beispiel während eines Vollschichteinsatzes der AR-Technologie vorliegt. Eine Studie von Ullmann10 deutete auf eine veränderte subjektive Beanspruchungslage beim 8-Stunden Langzeiteinsatz eines HMD hin. Während eines sechswöchigen Pilotversuches wurde in einem Komissionierlager eines Mercedes Benz LKW-Werkes das Potenzial einer mobilen Augmented Vision Technologie getestet, die eine Anreicherung der Realität mit zusätzlichen digitalen Informationen zur Arbeitsunterstützung am Einsatzort erlaubt. Um diese Eindrücke weiter zu untersuchen, wurde 2007 durch Fritzsche und Brau11 eine weitere Untersuchung durchgeführt, die jedoch bei der Arbeit mit dem HMD Nomad der Firma Microvision keinen signifikanten Einfluss auf die psychische Gesamtbeanspruchung der Teilnehmer nachweisen konnte.
Die Arbeitswelt unterliegt einem rasanten Wandel, wobei psychomentale Belastungen gegenüber physischen immer weiter in den Vordergrund treten. Dazu trägt vor allem auch die angesichts angestrebter Steigerung der Produktivität stetig zunehmende Technisierung des Arbeitsplatzes bei. Dementsprechend werden für die Evaluation dieser Belastungen Beanspruchungsmaße benötigt, die über die reine Bewertung von Stoffwechselprozessen hinausgehen.
Bei dem hier beschriebenen Versuch wurde primär die Beanspruchungssituation beim Ausführen einer manuellen Tätigkeit mit und ohne AR-System untersucht. Bisher war weitgehend unklar, welche Auswirkungen der länger andauernde Einsatz eines AR-Systems auf die Beanspruchungslage des Nutzers hat. Es konnte gezeigt werden, dass das genutzte AR-System eine Belastung für den Nutzer darstellt, die auch im längeren Einsatz eine biologisch verträgliche Beanspruchung hervorruft. Diese Beanspruchung ist vergleichbar mit einer durch herkömmliche Arbeit hervorgerufenen Beanspruchung, dies wurde hier am Beispiel einer Papierlisten-Kommissionierung nachgewiesen. Beim Verwenden eines optimierten Systems (geringeres Lag, verbesserte See-Through-Kalibrierung, verbesserte Systemperformance, in Kleidung integrierte Hardwarekomponenten, verbesserte Interaktion, gewichtsreduzierte HMD) ist eine Verringerung der Beanspruchung möglich, so dass die Arbeit mit einem AR-System sogar eine zusätzliche Entlastung für den Nutzer darstellen kann. Es wurde jedoch auch deutlich, dass insbesondere Untersuchungen zur Beanspruchung des visuellen Systems folgen müssen.
Neben der Beanspruchungsanalyse wurde zudem untersucht, wie gut mit Hilfe des AR-Systems Fehler im Versuchsbereich vermieden werden können. Obwohl ein suboptimales AR-System genutzt wurde, konnte nachgewiesen werden, dass Fehler sehr stark reduziert und möglicherweise ganz ausgeschlossen werden können.
Es wurde deutlich, dass erst dann alle Vorteile eines AR-Systems sichtbar werden, wenn das AR-System optimal hinsichtlich des Arbeitsprozesses angepasst wurde.
Zur statistischen Absicherung der hier ermittelten Ergebnisse sind weitere Versuche zu ähnlichen Fragestellungen mit einem deutlich verbesserten AR-System bei einer größeren Stichprobe und Versuche mit einem unterschiedlichen Einsatz (nach einem kurzzeitigen und einem langzeitigen Gebrauch) mobiler Systeme vorgesehen. Die Ergebnisse des Beschwerdefragebogens bestätigten, dass besonders hinsichtlich der Auswirkungen des AR-Systems auf das visuelle System des Anwenders zusätzliche Untersuchungen notwendig sind. Dabei werden neben weiteren Untersuchungen zur Beanspruchung beim Einsatz verschiedener HMD und Verfahren auch wahrnehmungspsychologische Aspekte und objektive Beanspruchungsmaße (ermittelt mit Hilfe von Herzvariabilitätsparametern) eine Rolle spielen.
Mittelfristig werden damit die Erstellung humanzentrierter, industrietauglicher AR-Systeme sowie deren Einsatz in der Industrie möglich. Diese bieten nicht nur ökonomische Vorteile (Effektivität und Genauigkeit der Arbeit), sondern können auch durch eine physiologische Optimierung positive Wirkungen auf den Anwender im Sinne der Gesundheitserhaltung, Leistungsförderung und Arbeitssicherheit entfalten.
Danksagung
Das Autorenkollektiv bedankt sich bei dem BMBF für die Förderung dieses AVILUS-Projektes (Förderkennzeichen 01 IM 08 001 Z).
· Literatur
Milgram P, Takemura H, Utsumi A, Kishino F. Augmented Reality: A class of displays on the reality-virtuality continuum Augmented Reality: A class of displays on the reality-virtuality continuum. (pdf), SPIE 235134. Proceedings of Telemanipulator and Telepresence Technologies, 1994
Azuma R. A Survey of Augmented Reality. (pdf), Presence: Teleoperators and Virtual Environments 1997; 6 (4): 355385
Swan J, Edward II, Gabbard JL. Survey of User-Based Experimentation in Augmented Reality. In: Proceedings 1st International Conference on Virtual Reality, Las Vegas, USA, 2005
Tang A, Owen C, Biocca F, Mou W. Comparative effectiveness of augmented reality in object assembly. In: CHI 03: Proceedings of the SIGCHI conference on Human factors in computing systems 7380. ACM Press, New York, NY, USA, 2003
Oehme O. Ergonomische Untersuchungen von kopfbasierten Displays für Anwendungen der erweiterten Realität in Produltion und Service. PhD thesis, RWTH Aachen. Schriftenreihe Rationalisierung und Humanisierung, Bd. 61. Shaker Verlag, Aachen, 2004
Schwerdtfeger B, Frimor T, Pustka D, Klinker G. Mobile information presentation schemes for logistics applications. In: 16th International Conference on Artificial Reality and Telexistence (ICAT 2006), Hangzhou, VR China. Zhejiang University of Technology, 2006
Tümler J, Mecke R, Xu J. See-Through Kalibrierverfahren für mobile Augmented Reality Assistenzsysteme. In: Gausemeier J, Grafe M (Eds.). Augmented und Virtual Reality in der Produktentstehung, Volume 6: 233247. Heinz Nixdorf Institut, Universität Paderborn, HNI-Verlagsschriftenreihe, 2007
v. Zerssen D, Koeller DM. Die Befindlichkeits-Skala, Parallelformen BFS und BFS. Beltz Test Gesellschaft mbH, Weinheim, 1976
Nitsch JR. Die Eigenzustandsskala (EZ-Skala) Ein Verfahren zur hierarchischmehrdimensionalen Befindlichkeitsskalierung. In: Nitsch IUJR (Eds.). Beanspruchung im Sport. Beiträge zur psychologischen Analyse sportlicher Leistungssituationen 81102. Bad Homburg, Germany, Limpert, 1976
Ullmann C. Nutzerakzeptanz von Augmented Reality Eine Fallstudie zum Vollschichteinsatz in der Automobilproduktion. Diplomarbeit, Universität Hamburg, 2006
Fritzsche L, Brau H. Mobile Augmented Vision in der Automobilproduktion: Laboruntersuchung zur Beanspruchung bei der ganztägigen Arbeit mit einem monokularen HMD. In: GfA (Hrsg.), Kompetenzentwicklung in realen und virtuellen Arbeitssystemen 311314. GfA Verlag, 2007