Ihre Persistenzschicht? Ihr Kunde, Chef, DBA? Tuning von Hibernate und JPA Anwendungen Michael Plöd Michael Plöd • Architekt bei Senacor Technologies AG in Nürnberg • http://www.senacor.com • [email protected] • http://rockingcode.blogspot.com • Twitter: @bitboss IST ORM LANGSAM Zu viele Abfragen Zu langsame Abfragen Gründe für schlechte Performance Falsch getunte Datenbank Falsch getunte Infrastruktur Anzahl der Abfragen Klassifizierung von Abfragen 1.500 1.125 750 375 0 0 225 450 675 900 Durchschnittliche Laufzeit in [ms] Ursachen Hohe Häufigkeit Hohe Laufzeit ★ Applikations-Logik ★ Zu hohe Selektivität ★ Mappings ★ Variablen-Übergabe ★ Kein Caching ★ Fehlende Indizes ★ N+1 Selects Problem ★ Karthesisches Produkt ★ Locks ★ Datenbankstruktur N+1 Selects Problem @Entity public class Konto { ... @ManyToOne(fetch=FetchType.LAZY) public Person getKunde() {...} ... } List list = s.createCriteria(Konto.class).list(); for (Iterator it = list.iterator(); it.hasNext();) { Konto kto = (Konto) it.next(); kto.getKunde().getName(); } SELECT SELECT SELECT SELECT ... * * * * FROM FROM FROM FROM KONTEN PERSONEN WHERE PERSON_ID = ? PERSONEN WHERE PERSON_ID = ? PERSONEN WHERE PERSON_ID = ? +1 N Karthesisches Produkt @Entity public class Konto { ... @OneToMany(fetch=FetchType.EAGER) public Set<Buchung> getBuchungen() {...} @OneToMany(fetch=FetchType.EAGER) public Set<Vollmacht> getVollmachten() {...} ... } select konto.*, buchung.*, vollmacht.* from KONTEN konto left outer join BUCHUNGEN buchung on konto.ID = buchung.KTO_ID left outer join VOLLMACHTEN vollmacht on konto.ID = vollmacht.KTO_ID Karthesisches Produkt select konto.*, buchung.*, vollmacht.* from KONTEN konto left outer join BUCHUNGEN buchung on konto.KTO_ID = buchung.KTO_ID left outer join VOLLMACHTEN vollmacht on konto.KTO_ID = vollmacht.KTO_ID KTO_ID KTO_NR ... BUCH_ID BUCH_BETRAG ... VM_ID VM_NAME ... 1 12344 ... 10 1000,00 € ... 200 Michael Plöd ... 1 12344 ... 10 1000,00 € ... 300 Martin Plöd ... 1 12344 ... 20 -324,23 € ... 200 Michael Plöd ... 1 12344 ... 20 -324,23 € ... 300 Martin Plöd ... 1 12344 ... 30 543,11 € ... 200 Michael Plöd ... 1 12344 ... 30 543,11 € ... 300 Martin Plöd ... 2 21300 ... 40 -4323,23 € ... 400 Sandra Ulrich ... 2 21300 ... 40 -4323,23 € ... 400 Melanie Ulrich ... 2 21300 ... 40 -4323,23 € ... 400 Herbert Ulrich ... ... ... ... ... ... ... ... ... ... Gutes TUNING Anzahl oder Laufzeit? ist IMMER eine Frage der BALANCE FETCHING CACHING ABFRAGEN ★ Batch ★ 1st Level Cache ★ Selektivität ★ Subselect ★ 2nd Level Cache ★ Query Cache ★ Eager ★ Stateless Session ★ Bind Variablen LOGIK ★ Schleifen ★ Datenmenge LOCKS ★ Optimistic Locking Runtime ★ DB Entwurf ★ Konfiguration ★ Connection Pool Mappings Batch Fetching @Entity public class Konto { @ManyToOne(...) public Person getKunde() {...} ... } @Entity @BatchSize(size=5) public class Person { ... } SELECT k.* FROM KONTEN k SELECT * FROM PERSONEN WHERE PERSON_ID IN (?, ?, ?, ?, ?) SELECT * FROM PERSONEN WHERE PERSON_ID IN (?, ?, ?, ?, ?) SELECT * FROM PERSONEN WHERE PERSON_ID IN (?, ?, ?) Batch Fetching 1.500 ★ Schätzung 1.125 ★ Einfach 750 ★ Lazy 375 0 0 225 450 675 900 ★ (N / Batch Size) + 1 Subselect Fetching @Entity public class Konto { @OneToMany @Fetch(FetchMode.SUBSELECT) public Set getBuchungen() {...} ... } SELECT k.* FROM KONTEN k SELECT b.* FROM BUCHUNGEN b WHERE b.KTO_ID IN ( SELECT k.KTO_ID FROM KONTEN k ) Subselect Fetching ★ Nur für Collections 1.500 ★ Keine Schätzung 1.125 750 ★ Einfach 375 0 ★ Lazy 0 225 450 675 900 ★ 2 Abfragen Eager Fetching @Entity public class Konto { @OneToMany( fetch = FetchType.EAGER ) public Set getBuchungen() {...} @ManyToOne( fetch = FetchType.EAGER ) public Kunde getEigentuemer() {...} } SELECT FROM LEFT on LEFT on ko.*, b.*, KONTEN ko OUTER JOIN b.KTO_ID = OUTER JOIN ko.KU_ID = ku.* BUCHUNGEN b ko.KTO_ID KUNDEN ku ku.KU_ID Eager Fetching ★ Nie bei 2+ Collections! 1.500 1.125 ★ Nicht Lazy 750 ★ 1 Abfrage 375 0 ★ Nie in globalen Fetch 0 225 450 675 900 Plan aufnehmen Caching Caching Architektur First Level Cache Persistenz Kontext A Persistenz Kontext B Persistenz Kontext C Second Level Cache Cache Concurrency Strategy Query Cache Cache Implementierung Klassen Cache Region Collection Cache Region Query Cache Region Update Timestamps Cache Region Welche EXCEPTION bekomme ich, wenn ich 10.000.000 Objekte lade? OutOfMemory ! Hibernate verwaltet den 1st Level Cache nicht von selbst! Grundregeln ★ ORM ist kein Batch Tool! ★ Bei Massen-Verarbeitung regelmässig flushen und clearen! ★ JDBC Batch-Size anpassen for ( int i=0; i<100000; i++ ) { Konto konto = new Konto(...); session.save(konto); if ( i % 50 == 0 ) { session.flush(); session.clear(); } } Concurrency Strategies Transactional Isolation bis zu repeatable read Read-Write Isolation bis zu read commited Keine Konsistenz Garantie, aber Nonstrict-read-write Timeouts Read-only Nur für Daten, die sich nie ändern Cache Provider Read-write Nonstrict Read-write Read-only EHCache x x x OSCache x x x x x Transactional SwarmCache JBoss Cache x x Konfiguration org.hibernate.cache.provider_class EHCache org.hibernate.cache.EhCacheProvider OSCache org.hibernate.cache.OsCacheProvider SwarmCache org.hibernate.cache.SwarmCacheProvider JBoss Cache org.hibernate.cache.TreeCacheProvider Mappings ★ Annotation: @Cache(usage=CacheConcurrencyStrategy.READ_WRITE) ★ XML: <cache usage=“read-write“> ★ Sowohl auf Klassen als auch auf Collection Level ★ Volles Caching: Klasse + Collection! Beispiel @Entity @Cache(usage=CacheConcurrencyStrategy.NONSTRICT_READ_WRITE) public class Author implements Serializable { ... @Override public int hashCode() { ... } @Override public boolean equals(Object obj) { ... } } @Entity @Cache(usage=CacheConcurrencyStrategy.READ_WRITE) public class RecordReview implements Article { ... @OneToMany(fetch=FetchType.LAZY) @Cache(usage=CacheConcurrencyStrategy.NONSTRICT_READ_WRITE) private Set<Author> authors = new HashSet<Author>(); ... } Cache Regions ★ Einteilung in Cache Regions mit Naming Convention ★ Cache Regions werden in Cache Provider Konfiguration referenziert Klasse Voll qualifizierter Name de.allschools.domain.Band de.allschools.domain.Band Collection Klasse + „.“ + Attribut de.allschools.domain.Record#bands de.allschools.domain.Record.bands EhCache Beispiel ehchache.xml <ehcache> <diskStore path="java.io.tmp"/> <defaultCache maxElementsInMemory="10000" eternal="true" overflowToDisk="true" /> <cache name="de.allschools.domain.Author" maxElementsInMemory="30" eternal="false" timeToIdleSeconds="900" timeToLiveSeconds="1800" overflowToDisk="true" /> <cache name="de.allschools.domain.RecordReview.authors" maxElementsInMemory="500" eternal="false" timeToIdleSeconds="600" timeToLiveSeconds="1200" overflowToDisk="true" /> ... </ehcache> Auswahl von Caching Kandidaten? KONSERVATIV ★ Wenige Inserts und Updates ★ Viele Lesezugriffe ★ Unkritische Daten ★ Von vielen Sessions benötigt ★ Von vielen Usern benötigt Abfragen Selektivität ★ Nur benötige Daten laden ★ Möglichst früh einschränken ★ Projection verwenden Query query = getSession().createQuery( "select new TourCityInfo(t.name, d.timestamp, l) from Tour t inner join t.tourDates d with d.timestamp > :datum inner join d.location l where l.stadt=:stadt order by t.name asc" ); "from User u where u.name=" + name ✦ SQL Injection ✦ Performance Killer ✦ Heimtückisch ! IMMER BIND VARIABLEN verwenden Query query = session.createQuery("from User u where u.name= :name"); q.setString("name", "michael"); Query Cache ★ Wird selten benötigt ★ Nur für bestimmte Queries geeignet ★ Wird extra konfiguriert: hibernate.cache.use_query_cache=true ★ Muss pro Query / Criteria aktiviert werden: query.setCacheable(true); Analyse Logging ★ Sehr detailliert, viele Informationen ★ Interessant sind für Tuning: ➡ org.hibernate.jdbc - TRACE ➡ org.hibernate.SQL - TRACE ★ Logging auch in User Types integrieren ★ Sicht auf plain SQL Statistics ★ Extrem wertvolle Informationen ★ Müssen extra aktiviert werden ➡ Konfiguration: ➡ Programmatisch: hibernate.generate_statistics sessionFactory.getStatistics().setStatisticsEnabled(true) ★ Zugriff ➡ Programmatisch: sessionFactory.getStatistics() ➡ JMX Entity Collection Statistics Query Cache Datenbank + Infrastruktur ★ Auch in der Datenbank analysieren ➡ Sind alle Indizes korrekt gesetzt? ➡ Wie ist das Laufzeitverhalten? ★ Gleiches gilt für Infrastruktur ➡ Connection Pool ➡ Transaktions Monitor ➡ Applikations Server Laufen lassen Messdaten erheben Analyse pro Anwendungsfall Nur eine Tuning Massnahme Vergleich mit Referenz und Doku VIELEN DANK! FRAGEN? Michael Plöd Senacor Technologies AG [email protected]