PowerPoint-Präsentation - RWTH

Werbung
Erfassung der RWTH-Software-ShopDaten und Auswertung am
Beispiel von MATLAB Campus
Mareike van Heel
Rechen- und Kommunikationszentrum
Seminarvortrag
01.10.2012
Rechen- und Kommunikationszentrum (RZ)
Inhalt
 Einleitung
 Motivation
 Aufgabenstellung
 Datenerfassung
 Randbedingungen/ Aufbau der asknet-Exports
 Datenbankschema
 Daten einpflegen
 Datenauswertung (MATLAB Campus)
 Gesamtverkaufszahlen an der RWTH
 Erwerb durch Institute
 Fazit und Ausblick
2
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Einleitung
3
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Motivation 1
 Software-Shop
 Betrieben von der asknet AG
 Bietet Software für Institute, Mitarbeiter und Studierende der RWTH an
 Verschiedene Lizenzarten (z.B. Einzelplatz- und Netzwerk-Lizenzen)
 Liefert Infos darüber, was erworben wird
 Netzwerk-Lizenzen
 Lizenz-Server Logfiles
 Liefert Infos darüber, was genutzt wird
 ITSM
 Seit 2009 schrittweise am RZ eingeführt
 Ziel u.a.: Prozesse messbarer gestalten und dadurch ggf. verbessern
4
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Motivation 2
 Matlab Campus
 Seit 2007 im Software-Shop der RWTH für RWTH-Mitglieder
 Umfasst neben Matlab diverse häufig verwendete Toolboxen
 0-Euro-Kauf
 Finanziert durch Fakultäten 1, 4 und 6
 Zeitlich begrenzt gültige Netzwerk-Lizenz
5
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Aufgabenstellung
 Software-Shop Daten erfassen
 Exports analysieren
 Datenbankschema entwickeln
 Daten einpflegen
 Beispielhafte Auswertung MATLAB Campus
 Gesamt-Nutzung
 Studierende, Mitarbeiter, Institute getrennt
6
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Datenerfassung
7
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Randbedingungen/ Aufbau der Exports
 Exports der asknet AG
 Enthält alle Transaktionsdaten des Vortags
 Täglich als CSV auf VM des RZs
 Alle älteren Transaktionen in einem Export zusammengefasst
 Aufbau der Exports
 Beliebig viele Datensätze pro Export
 30 Attribute pro Datensatz
 Attribute getrennt durch “;“
8
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Aufbau der asknet-Exports
 Beispielhafter Datensatz
 Doppelte Attribute
 hersteller_name: Inhalt beider Felder identisch
 serien_nr: Inhalt unterschiedlich, mindestens eins leer
 Wichtige Attribute
 hersteller_nr: „LNR “ gefolgt von 4 Ziffern; dient zur Identifikation des
Beginns eines neuen Datensatzes
 artikel_beschreibung: enthält bei begrenzt gültigen Lizenzen ein Ablaufdatum
(Format variabel)
9
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Datenbankschema
 Attribute in Relationen unterteilen:
 Besteller
 Einrichtung
 Artikel
 Hersteller
 Transaktion
 Relationen aus Campus-Export:
 campus_einrichtung
 campus_fachbereich
10
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Datenbankschema
11
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Daten einpflegen
 Grober Ablauf:
 Export-Daten zeilenweise einlesen => formatieren
 Formatierte Daten zeilenweise einlesen
Datensatz aufteilen
 Hersteller-, Artikel-, Besteller-Daten und Transaktions-Daten in dieser
Reihenfolge bestimmen und in die Datenbank eintragen/aktualisieren
12
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Daten einpflegen
 asknet-Export/ Zeile formatieren
 Zeile beginnt mit „LNR “ gefolgt von 4 Ziffern => neuer Datensatz beginnt
 Vorherigen Datensatz auf Vollständigkeit (30 Attribute) überprüfen
 Kein neuer Datensatz beginnt: Zeile an vorherige anhängen
 Formatierte Datei: Ein vollständiger Datensatz pro Zeile
 Artikel bestimmen
 Wert benötigter Attribute bestimmen und in DB eintragen
Primärschlüssel bereits vorhanden => Daten aktualisieren
 Hersteller-, Besteller- und Einrichtungs-Daten analog
13
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Daten einpflegen
 Transaktion bestimmen
 Bis auf serien_nr und ablaufdatum Werte der Attribut wie in „Artikel
bestimmen“ festlegen
 serien_nr: beide Einträge, in denen Serien-Nummern stehen können
aneinander hängen
 ablaufdatum: artikel_beschreibung auf Schlüsselwörter und Datums-Formate
untersuchen (Vgl. Seminararbeit)
 Transaktion in DB eintragen
14
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Datenauswertung (MATLAB
Campus)
15
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Gesamtverkaufszahlen an der RWTH
 Insgesamt steigende Verkaufszahlen
Intervall
Anzahl
Intervall
Anzahl
2007/2008
3302
2009/2010
5431
2008/2009
2701
2010/2011
5774
 Aktuelles Intervall: bis zum 29.08.2012 6458 erworbene Lizenzen
 Erwerb nach Gruppen
 Studenten größte Erwerber-Gruppe (71%)
 Institute 26%
 Mitarbeiter (privat) kleinste Gruppe (3%)
16
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb durch Institute – Gesamt 1
17
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb durch Institute - Gesamt 2.1
 Verkaufszahlen zu Beginn eines Intervalls deutlich höher
 Grund: Dauerhafte Nutzung => Dauerhaft Lizenzen nötig
 Großteil der Lizenzen in den ersten 3 Monaten (2010/2011: 77,8%)
 Grund: Lizenzen dauerhaft notwendig => zu Beginn kaufen
 „Sättigungseffekt“
18
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb durch Institute - Gesamt 2.2
19
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb durch Institute - Gesamt 3.1
 Zu Beginn eines Intervalls wenig gültige Lizenzen (2010/2011: 11%)
 Grund: Lizenzen müssen erworben werden
 Aber: Insgesamt steigende Anzahl gültiger Lizenzen zu Beginn eines
Intervalls
Grund: Institute erwerben häufiger neue Lizenzen vor Ablauf der alten
 Sprungstellen
 Grund: Institute kaufen teilweise große Anzahlen von Lizenzen auf einmal
20
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb durch Institute - Gesamt 3.2
21
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb durch Institute - Gesamt 4.1
 Stark unterschiedliche Gesamt-Anzahl erworbener Lizenzen pro
Laufzeit-Intervall
 Im ersten/ dritten Jahr werden jeweils wesentlich mehr Lizenzen erworben als
im Zweiten/ Vierten
Grund: Institute vergessen Lizenzen zu erneuern (gilt erst seit 2007) =>
Institute werden erinnert (2009) => Mehr Lizenzen werden wieder
erworben
 Insgesamt positive Tendenz
Grund: z.B. steigende Mitarbeiterzahlen, stärkere Nutzung, „Kaufen auf
Vorrat“ (Lizenzen, die nur möglicherweise genutzt werden, da 0-Euro-
Kauf)
22
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb durch Institute - Gesamt 4.2
23
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb nach Fakultäten - Gesamt
 Interessant, da Matlab Campus von bestimmten Fakultäten finanziert
wird
 Erwerbszahlen von Oktober 2007 bis September 2011
Fakultäten Insgesamt Lizenzen/Mitarbeiter
4
44%
1,49
6
20%
1,75
5
15%
1,36
1
9%
0,41
Sonstige
12%
0,17
 Verhältnis Lizenz/Mitarbeiter bei Finanzierenden (und 5) deutlich
höher, mit Ausnahme von Fakultät 1
24
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Erwerb nach Fakultäten - Verlauf
 Auch deutlich schwankende Erwerbs-Zahlen je nach Intervall
 Im ersten Intervall überall
 Im zweiten nur Fakultät 5, 6
 Bedarf von Sonstigen steigt seit 08/09
 Fakultät 5: 09/10 Ausreißer
 Sonst ca. so viele wie Fakultät 1
 Grund für Ausreißer: weitere Auswertungen notwendig, z.B. nach Instituten
der Fakultät
25
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Fazit und Ausblick
26
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Fazit
 Daten werden in Datenbank erfasst
 Schnelle Antworten auf verschiedene Fragestellungen
 Darstellung und Auswertung der MATLAB Campus Daten
 Information über Verlauf
 Verbesserung des Angebots möglich, z.B.:
Bei Fakultät 5 nachforschen, warum so viele Lizenzen erworben werden
aber keine Kostenbeteiligung stattfindet
27
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Ausblick
 Zuordnung von Studierenden-Lizenzen zu Fakultäten
 Webservice, der Liste von TIM-Kennungen Fakultäten zuordnet, notwendig
 Voraussichtlich im November fertig (andere Bachelor-Arbeit)
 Tatsächliche Nutzung der Lizenzen interessant
 Auswertung der Log-Files der Lizenzserver notwendig
Bachelor-Arbeit
28
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Literaturverzeichnis
 ITIL, www.itil-ocialsite.com/AboutITIL , August 2012
 Stephan Kleuker, Grundkurs Software-Engineering mit UML, Vieweg+Teubner
2009
 Stéphane Faroult, The Art of SQL, O'Reilly 2006
 MathWorks, http://www.mathworks.de/ , August 2012
 Institut für Regelungstechnik der RWTH Aachen, http://www.matlab.rwthaachen.de/ , August 2012
 RWTH Aachen, Zahlenspiegel 2007-2011,
http://www.rwthaachen.de/cms/root/Die_RWTH/Prol/enw/Daten_Fakten/, August
2012
29
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Vielen Dank für die
Aufmerksamkeit!
30
Seminarvortrag
Mareike van Heel| Rechen- und Kommunikationszentrum
Herunterladen