LLM? Deep Learning? – Eine Übersicht zu KI-Begrifflichkeiten

Aus dem beruflichen und privaten Alltag ist Künstliche Intelligenz kaum noch wegzudenken. Dennoch stolpert man regelmäßig über Vokabular, welches kompliziert klingt und nicht aus dem Stegreif definiert werden kann. Der folgende Artikel soll Ihnen einen Überblick verschaffen.

KI

Künstliche Intelligenz (KI oder oft auch AI): Unter einer künstlichen Intelligenz versteht man im Allgemeinen die Fähigkeit einer Maschine, menschliche Fähigkeiten, wie beispielsweise Denken, Lernen, Planen, Zusammenhänge oder auch Kreativität zu imitieren.

Die Anfänge derartiger Technologien gehen in die Mitte des 20. Jahrhunderts, als die ersten Computer aufkamen. Große Verbesserungen in Sachen Rechenleistung und Verfügbarkeit von Datenmengen führten unter anderem in jüngster Vergangenheit zu einem bahnbrechenden Fortschritt.

Machine Learning

Machine Learning: Das maschinelle Lernen ist ein Teilbereich der Künstlichen Intelligenz. Anhand von Trainingsdaten werden zugrunde liegende Muster erkannt. Typische Anwendungen sind Klassifikationsaufgaben, also das Zuordnen von Eingabedaten in vorgegebene Klassen (Beispiel: zeigt ein Bild einen Hund oder eine Katze) . Wenn dagegen den Eingabedaten kontinuierliche Werte zugeordnet werden sollen, dann spricht man von Regression (Beispiel: auf der Basis von Modell, Baujahr und Kilometerstand, wieviel ist ein Auto wert)

Überwachtes Lernen

Überwachtes Lernen: Beim überwachten Lernen handelt es sich um einen Ansatz des maschinellen Lernens, bei dem das entsprechende Modell mit gekennzeichneten Daten trainiert wird. Das bedeutet, dass die Eingaben mit den jeweils gewünschten Ausgabedaten versehen werden, d.h. die Ergebnisse vordefiniert werden. Auf Basis dessen wird der Algorithmus mit dem Ziel trainiert, ausgehend von den markierten Trainingsdatensätzen auch neue Daten korrekt einordnen zu können.

Unüberwachtes Lernen

Unüberwachtes Lernen: Bei diesem Ansatz ist, wie der Name es bereits vermuten lässt, genau das Gegenteil der Fall. Das Modell wird mit unmarkierten Daten trainiert, mit dem Ziel, eigenständig Muster oder Strukturen in den Daten zu finden und diese sinnvoll einzuordnen. Clustering ist eine typische Anwendung des unüberwachten Lernens.

Künstliche Neuronales Netzwerk

Künstliche Neuronales Netzwerk (KNN): Künstliche neuronale Netze bestehen aus künstlich erzeugten Neuronen, die den neuronalen Strukturen im menschlichen Gehirn nachempfunden sind. Diese finden Anwendung im Bereich des Maschinellen Lernens. Sie ermöglichen Computern, komplexe Probleme zu lösen, für die es schwierig ist, explizite Regeln aufzustellen, bei denen aber viele Daten als Beispiele für die gewünschten Ergebnisse zur Verfügung stehen.

Künstliche Neuronale Netzwerke sind die Grundlage für das sogenannte Deep Learning. Ab 2006 brachte Deep Learning bedeutende Fortschritte in der Analyse großer Datenmengen mit sich. Zu den ersten erfolgreichen Einsatzgebieten des Deep Learning gehören die Bild- und die Spracherkennung.

Strukturierte und Unstrukturierte Daten

Strukturierte und Unstrukturierte Daten: Beide zusammen stellen die zwei größten Kategorien von erfassbaren Daten dar. Strukturierte Daten lassen sich problemlos in Datentabellen einordnen und enthalten Datentypen wie Zahlen, Kurztexte oder Datumsangaben. Strukturierte Daten passen also immer in ein Schema oder vordefiniertes Modell.
Für unstrukturierte Daten ist genau das nicht möglich. Weder Schemata noch konkret definierte Modelle sind für diesen Datentyp passend. Beispiele sind hier Audio-, Wetter, Geo- oder auch Überwachungsdaten.

Big Data

Big Data: In diesem Zusammenhang sind die drei Vs bekannt – Variety, Volume und Velocity. Diese Stichworte liefern auch eine grundlegende Definition von Big Data; hierbei geht es um Daten, die in großer Vielfalt, in unvorstellbar großen Mengen und mit hoher Geschwindigkeit anfallen. Oftmals entstehen dadurch so umfangreiche und komplexe Datensätze, dass traditionelle Datenverarbeitungsmethoden überfordert sind und spezielle Techniken zur Speicherung, Verarbeitung und Analyse notwendig werden. Obwohl Big Data also eine komplexe Handhabung mit sich bringt, ist sie oftmals eben aufgrund dieser vielen Daten interessant und wichtig für KI-Modelle und Analysen. Ein Beispiel wichtiger Big Data sind Sensordaten aus Maschinen oder Anlagen im Qualitätsmanagement.

Training und Over-Fitting

Training und Over-Fitting: Das Training einer KI beschreibt den Prozess des Lernens aus zugrundeliegenden Daten. Ziel ist es hierbei Parameter und Technik des Modells so anzupassen, sodass Fehler minimiert und Genauigkeit maximiert werden. Von dem Effekt des Over-Fittings spricht man, wenn ein Modell an Trainingsdaten zu genau angepasst ist und dadurch schlecht bei der Vorhersage neuer, noch unbekannter Daten abschneidet.

Fazit

Künstliche Intelligenz ist spätestens seit Ende 2022 mit dem Release von OpenAI’s „ChatGPT“ vollends in der Masse angekommen. Dennoch hat KI selbstverständlich viele weitere Anwendungen als die reine Chatbot-Funktion. Unsere anonymization.ai stell eine Lösung rund um das Thema Anonymisierung und Datenschutz dar. Sollte Ihr Interesse bezüglich KI-Anwendungen in diesem Bereich jetzt erst recht geweckt worden sein oder haben Sie noch weitere Fragen, kontaktieren Sie gerne unsere Teamlead Sales Vivienne für einen unverbindlichen Austausch.

Termine können Sie direkt hier buchen.

Mehr Infos finden Sie auf glanos.de

Data to boost your business.

Ihr Glanos-Team

Contact Us

  • Please contact vivienne.offermanns@glanos.de for product inquiries or arrange a meeting  for product demonstrations or call +49 89 998 299 157
  • If you want to apply for a job, please send your CV to info@glanos.de or leave a message on the answering machine of +49 89 998 299 150 and we will call you back.
  • For all further inquiries please write to info@glanos.de