Tagging auf Knopfdruck

Mit chunkx möchten wir große Mengen an Lerninhalten nutzerspezifisch sortieren. Dafür ist es unerlässlich, die Lerninhalte automatisch zu analysieren und miteinander in Beziehung zu setzen. Wir nutzen Techniken des Natural Language Processing, um das möglich zu machen. Wie genau das funktioniert und was das für unsere Nutzer, unsere Lernapp und die betriebliche Weiterbildung bedeutet, erfahrt ihr in diesem Artikel. Viel Spaß beim Lesen!

Nutzerspezifisches Lernen, ohne Programmieraufwand für die Autoren

chunkx ergänzt oder ersetzt bestehende Lernmaßnahmen durch kontinuierliches Micro-Learning. Was heißt aber kontinuierliches Lernen im betrieblichen Kontext? Nun, typische Trainings, e-Learnings, Lernvideos, Webinare, etc. enden zu einem bestimmten Zeitpunkt – manchmal mit und manchmal ohne Wissenstest. Diese Begrenzung ist zeitlich für den Einzelnen und ökonomisch für das zahlende Unternehmen ein hohes Risiko: Denn bereits nach wenigen Tagen vergessen wir einen Großteil des Gelernten wieder. Ebbinghaus beziffert, dass wir nach 6 Tagen nur noch 23% des Gelernten wissen. Unabhängig von der Aussagekraft dieser konkreten Zahl, stellen wir uns mit chunkx der Herausforderung, die Vergessenskurve abzuflachen. 

Wiederholung und Verknüpfung

Ein erster Schritt dazu ist die Wiederholung gelernter Inhalte. Dafür nutzen wir in chunkx Lernaufgaben gefolgt von erläuterndem Feedback. a wir jedoch sehr viel aus ganz unterschiedlichen Bereichen lernen – seien es fachspezifische Inhalte, Regularien, neue Skills, oder Dauerbrenner wie Security, Safety und Compliance – müssen die Inhalte aus allen Themen in nutzerspezifischen Feeds zusammengebracht werden. Doch jeder Nutzer hat nur begrenzt Zeit, weswegen sein jeweiliger Feed idealerweise solche Inhalte priorisieren sollte, die er lernen möchte oder soll, aber noch nicht so gut kennt wie andere. Bei 10 Themen mit Lerninhalten von jeweils einer Stunde und einem Lerner, der gerade mal ein paar Minuten pro Woche in die kontinuierliche Wiederholung investieren kann, stellt sich die Frage, wie diese Herausforderung gelingen kann? Und wie können darauf aufbauend Lernenden zusätzlich Empfehlungen für neue Inhalte ausgesprochen werden?

chunkx creator: Tagging der Inhalte

Um Lerninhalte so passend wie möglich und individuell zusammenzustellen, müssen sie miteinander in Beziehung gebracht werden. Auf der ersten Ebene geschieht das über Kanäle: Alle Lerninhalte, z.B. zum Thema Steuerrecht, werden dem entsprechenden Kanal zugeordnet. Aber wie sieht es innerhalb des Kanals aus, welche Inhalte gehören dort wie zusammen? Und vielleicht gibt es passende Inhalte ja auch außerhalb dieses Kanals? 

Dafür ermöglichen wir unseren Autoren bereits das tagging von Lerninhalten. Über einzelne Stichwörter werden unterschiedliche Lernaufgaben verknüpft. Dies ermöglicht spezifische Auswertungen und erlaubt unserem Algorithmus, besser zu verstehen, welche Inhalte für Nutzer didaktisch relevant sind. 

Zwar ist das manuelle tagging zielführend, es kann aber auch aufwändig sein. Daher haben wir das taggingauf Knopfdruck entwickelt: Unsere Autoren können nach Eingabe der Aufgabentexte automatisch passende Stichwörter generieren, sie bei Bedarf wieder entfernen und weiterhin manuelle Stichworte ergänzen. Für diese Funktion nutzen wir Techniken des Natural Language Processing. Aber was heißt das genau?

Wie funktioniert auto-tagging durch Natural Language Processing?

Der Bereich des Natural Language Processing befasst sich mit der Analyse unserer Sprache. Je nach Anforderungsbereich reicht dazu manchmal einfache Statistik. Um wie in unserem Fall benötigt, intelligente Ergebnisse zu produzieren, müssen jedoch kompliziertere Methoden verwendet werden.

Word embeddings durch hochdimensionale Vektoren

Im Herzen unseres auto-taggings stehen sogenannte “word embeddings”. Diese übersetzen Wörter in hochdimensionale Vektoren, sodass Texte auch für den Computer verständlich werden. Solche Vektoren ermöglichen es uns dann, Kalkulationen vorzunehmen und die Nähe von Wörtern und Texten zueinander zu bestimmen. Man kann sich zum Beispiel vorstellen, dass sich die Begriffe „Steuerberater” und „Steuerrecht” relativ nah stehen. Genau diese Nähe kann durch Vektoren beschrieben werden. Natürlich sind nicht alle Vergleiche so eindeutig. Welches Wort sollte zum Beispiel näher an „Steuerberater” sein: „Anwalt” oder „Finanzen”? Beide Wörter haben einen anderen Bezug zu „Steuerberater”, weswegen eine klare, eindeutige Antwort schwerfällt.

Um alle möglichen Eigenschaften eines Wortes zu erfassen, bestehen unsere Wortvektoren deshalb aus einigen hundert Dimensionen. Damit diese Dimensionen auch aussagekräftig sind, muss das Modell, das die Wörter in Vektoren übersetzt, zuvor trainiert werden – in unserem Fall mit mehreren hundert Millionen Wörtern.

Von Vektoren zu tags

Für das Generieren der tags in chunkx, fassen wir zunächst alle erläuternden Felder eines Kanals (d.h. Titel, Beschreibung, Fragen, die korrekte Antwort, Feedback) als einen einzigen Vektor zusammen. Für thematisch sinnvolle tags und eine niedrigere Rechenzeit werden alle unnötigen Füllwörter aus den Texten herausgefiltert. Um nun tags für eine einzelne Aufgabe zu generieren, werden die Wörter sowohl untereinander als auch mit dem dazugehörigen Kanal verglichen. Die verschiedenen Abschnitte werden dabei unterschiedlich gewichtet und fortlaufend nachjustiert.

Die Wörter, deren Distanz zu dem Kanalvektor am niedrigsten sind und die einen gewissen Schwellenwert nicht überschreiten, werden dem Autor letztlich als tags vorgeschlagen.

Warum sind tags nun so wichtig?

Die Technologie zur Generierung der tags ist nicht nur eine Zeitersparnis für unsere Autoren, sondern ermöglicht auch die intelligente Verknüpfung von Inhalten. Betrachten wir beispielsweise unsere Lerninhalte zum Thema Steuerrecht: Ein Lerner weist Wissenslücken zum Thema Umsatzsteuer auf. Wir können nun diese ausgewählten Inhalte entsprechend wiederholen. Wir können aber auch unseren Algorithmus erfassen lassen, welche Lerninhalte aus anderen dem Lerner zur Verfügung stehenden Kanälen inhaltliche Nähe zum Thema Umsatzsteuer aufweisen. Diese können wir ihm dann vorgeschlagen und priorisiert auswählen, sobald er zu einem dieser Kanäle lernt. Die Auswahl der Inhalte passt sich dem Lerner somit adaptiv an und seine Lernzeit wird so effizient wie möglich genutzt: Nämlich mit den Inhalten, zu denen Lernbedarf besteht

Während klassische Web-based Trainings oder Lernvideos für alle Lerner die gleichen Inhalte in der gleichen Reihenfolge bieten, können bei chunkx die passendsten Inhalte ausgewählt werden – und das nicht nur innerhalb eines Kanals, sondern über unendlich viele Kanäle hinweg. 

Je mehr Kanäle und Themen Mitarbeiterinnen und Mitarbeitern eines Unternehmens in chunkx zur Verfügung gestellt werden, desto mehr inhaltliche Überschneidungen entstehen und umso mehr spielt kontinuierliches Micro-Learning mit chunkx seine volle Stärke aus. 

Kontakt aufnehmen

Haben wir deine Neugierde geweckt oder fühlst du dich von unserem Beispiel rund um Steuerrecht gelangweilt? Nun, lass uns auch lieber zu deinen Themen sprechen und wie wir das Lernen dazu mit chunkx am besten unterstützen können. Schreib uns und wir melden uns kurzfristig bei dir.