- 앤티티 매니저(Entity Manager)는 엔티티를 저장하고, 수정하고, 삭제하고, 조회하는 등 엔티티와 관련된 모든 일을 처리한다.
- 개발자 입장에서 엔티티 매니저는 엔티티를 저장하는 가상의 데이터베이스로 생각하면 된다.
엔티티 매니저 팩토리와 엔티티 매니저
- 데이터베이스 하나만 사용하는 애플리케이션은 일반적으로
EntityManagerFactory
를 하나만 생성한다. - 엔티티 매니저 팩토리는 엔티티 매니저를 만드는 공장인데 ,공장을 만드는 비용은 상당히 크다.
- 따라서 한 개만 만들어서 애플리케이션 전체에서 공유하도록 설계되어 있다.
- 엔티티 매니저 팩토리는 여러 스레드가 동시에 접근해도 안전하므로 서로 다른 스레드 간에 공유해도 되지만, 엔티티 매니저는 여러 스레드가 동시에 접근하면 동시성 문제가 발생하므로 스레드 간에 절대 공유하면 안 된다.
- 엔티티 매니저는 데이터베이스 연결이 꼭 필요한 시점까지 커넥션을 얻지 않는다.
- 일반적으로 트랜잭션을 시작할 때 커넥션을 획득한다.
- 하이버네이트를 포함한 JPA 구현체들은 엔티티 매니저 팩토리를 생성할 때 커넥션풀도 만드는데 이것은 J2SE 환경에서 사용하는 방법이다.
- JPA를 J2EE 환경(스프링 프레임워크 포함)에서 사용하면 컨테이너가 제공하는 데이터소스를 사용한다.
J2SE: 자바 프로그래밍 언어의 표준 기능을 제공하여 데스크톱 애플리케이션이나 일반적인 프로그램 개발에 사용된다. J2EE: J2SE를 기반으로 엔터프라이즈 수준의 애플리케이션 개발을 위한 추가 라이브러리와 API를 제공합니다. 주로 웹 서비스 개발에 사용된다.
영속성 컨텍스트란?
- 영속성 컨텍스트(persistence context): 엔티티를 영구 저장하는 환경
- 엔티티 매니저로 저장하거나 조회하면 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리한다.
- 아래 메서드를 호출하면 ‘엔티티 매니저를 사용해서 엔티티를 영속성 컨텍스트에 저장’ 한다.
dm.persist(member)
- 영속성 컨텍스트는 엔티티 매니저를 생성할 때 하나 만들어진다.
- 엔티티 매니저를 통해서 용속성 컨텍스트에 접근할 수 있고, 영속성 컨텍스트를 관리할 수 있다.
엔티티의 생명주기
엔티티에는 4가지 상태가 존재한다.
- 비영속(new/transient): 영속성 컨텍스트와 전혀 관계가 없는 상태
- 영속(managed): 영속성 컨텍스트에 저장된 상태
- 준영속(detached): 영속성 컨텍스트에 저장되었다가 분리된 상태
- 삭제(removed): 삭제된 상태
비영속: 순수한 객체 상태이며 영속성 컨텍스트나 데이터베이스와는 전혀 관련이 없다.
영속: 영속성 컨텍스트가 관리하는 엔티티
- 영속성 컨텍스트에 의해 관리된다는 의미
em.find()
나 JPQL을 사용해서 조회한 엔티티도 영속성 컨텍스트가 관리하는 영속 상태다.
준영속: 영속 상태의 엔티티를 영속성 컨텍스트가 관리하지 않으면 준영속 상태가 된다.
- 특정 엔티티를 준영속 상태로 만들려면
em.detach()
를 호출하면 된다. em.close()
를 호출해서 영속성 컨텍스트를 닫거나em.clear()
를 호출해서 영속성 컨텍스트를 초기화해도 영속성 컨텍스트가 관리하던 영속 상태의 엔티티는 준영속 상태가 된다.
- 특정 엔티티를 준영속 상태로 만들려면
삭제: 영속성 컨텍스트와 데이터베이스에서 삭제한다.
em.remove(member)
를 호출하면 삭제 상태가 된다.
영속성 컨텍스트의 특징
- 영속 상태인 엔티티는 반드시 식별자 값(
@Id
로 테이블의 기본 키와 매핑한 값)이 있어야 한다. - JPA는 보통 트랜잭션을 커밋하는 순간 영속성 컨텍스트에 새로 저장된 엔티티를 데이터베이스에 반영하는데 이것을 플러시(flush)라 한다.
- 영속성 컨텍스트가 엔티티를 관리하면 얻는 장점
- 1차 캐시
- 동일성 보장
- 트랜잭션을 지원하는 쓰기 지연
- 변경 감지
- 지연 로딩
엔티티 조회
- 영속성 컨텍스트는 내부에 캐시를 가지고 있는데 이것을 1차 캐시라 한다.
- 영속 상태의 엔티티는 모두 이곳에 저장된다.
- 1차 캐시의 키는 엔티티의 식별자 값이다.
em.find()
메소드의 두 번째 파라미터는 조회할 엔티티의 식별자 값이다.
em.find()
로 엔티티를 찾을 때 1차 캐시에 엔티티가 있으면 데이터베이스를 조회하지 않고 메모리에 있는 1차 캐시에서 엔티티를 조회한다.em.find()
를 호출했는데 엔티티가 1차 캐시에 없으면 엔티티 매니저는 데이터베이스를 조회해서 엔티티를 생성하고, 1차 캐시에 저장한 후에 영속 상태의 엔티티를 반환한다.- 영속성 컨텍스트는 1차 캐시에 있는 인스턴스를 반환하기 때문에, 식별자가 같은 엔티티에 대해서 동일성을 보장한다.
- JPA는 1차 캐시를 통해 REPEATABLE READ 등급의 트랜잭션 격리 수준을 애플리케이션 차원에서 제공한다.
엔티티 등록
- 엔티티 매니저는 트랜잭션에 커밋하기 직전까지 데이터베이스에 엔티티를 저장하지 않고 내부 쿼리 저장소에 INSERT SQL을 차곡차곡 모아둔다.
- 트랜잭션을 커밋할 때 모아둔 쿼리를 데이터베이스에 보내는데 이것을 트랜잭션을 지원하는 쓰기 지연(transactional write-behind)이라 한다.
- 모아둔 등록 쿼리를 커밋하는 시점에 데이터베이스에 한 번에 전달해서 성능을 최적화할 수 있다.
의문점: 엔티티 등록시 쓰기 지연이 발생하는데 어떻게 auto-increment인 primary key인 엔티티에서 id 조회가 가능하지? auto-increment인 primary key를 선언할 때는 주로
@GeneratedValue(strategy = GenerationType.IDENTITY)
로 식별자에 선언하는데 이 경우에는 엔티티 등록 시 쓰기 지연이 동작하지 않는다. https://vvekpandey.medium.com/jpa-auto-generated-values-be5bd7f90200
엔티티 수정
- JPA로 엔티티를 수정할 때는 단순히 엔티티를 조회해서 데이터만 변경하면 된다.
- 엔티티의 변경사항을 데이터베이스에 자동으로 반영하는 기능을 변경 감지(dirty checking)라 한다.
- 변경 감지는 영속성 컨텍스트가 관리한느 영속 상태의 엔티티엠나 적용된다.
- 변경 감지 과정
- 트랜잭션을 커밋하면 엔티티 매니저 내부에서 먼저 플러시(
flush()
)가 호출된다. - 엔티티와 스냅샷을 비교해서 변경된 엔티티를 찾는다.
- 변경된 엔티티가 있음녀 수정 쿼리를 생성해서 쓰기 지연 SQL 저장소에 보낸다.
- 쓰기 지연 저장소의 SQL을 데이터베이스에 보낸다.
- 데이터베이스 트랜잭션을 커밋한다.
- 트랜잭션을 커밋하면 엔티티 매니저 내부에서 먼저 플러시(
- JPA의 기본 적략은 엔티티의 모든 필드를 업데이트한다.
- 모든 필드를 업데이트하는 전략의 장점
- 수정 쿼리가 항상 같기 때문에 애플리케이션 로딩 시점에 수정 쿼리를 미리 생성해두고 재사용할 수 있다.
- 데이터베이스에 동일한 쿼리를 보내면 데이터베이스는 이전에 한 번 파싱된 쿼리를 재사용할 수 있다.
- 필드가 많거나 저장되는 내용이 너무 크면 동적으로 UPDATE SQL을 생성하는 전략을 사용하면 된다.
- 이때는 하이버네이트 확장 기능을 사용해야 한다.
- 아래와 같이
@DynamicUpdate
어노테이션을 사용하면 수정된 데이터만 사용해서 동적으로 UDPATE SQL을 생성한다. - 상황에 따라 다르지만 컬럼이 대략 30 이상이 되면 동적 수정 쿼리가 빠르다고 한다.
- 가장 정확한 것은 본인 환경에서 직접 테스틑해보는 것이고, 기본 전략을 사용하다가 최적화가 필요할 정도로 느리면 그때 전략을 수정하면 된다.
엔티티 삭제
em.remove()
를 호출하면 데이터베이스에 즉시 삭제하는 것이 아니라, 쓰기 지연 SQL 저장소에 삭제 쿼리를 등록한다.- 또한
em.remove()
를 호출하는 순간 해당 엔티티는 영속성 컨텍스트에서 제거된다.
- 또한
- 이렇게 삭제된 엔티티는 재사용하지 말고 자연스럽게 가비지 컬렉션의 대상이 되도록 두는 것이 좋다.
플러시
- 플러시: 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영한다.
- 플러시를 실행하면 다음과 같은 일이 일어난다.
- 변경 감지가 동작해서 영속성 컨텍스트에 있는 모든 엔티티를 스냅샷과 비교해서 수정된 엔티티를 찾는다. 수정된 엔티티는 수정 쿼리를 만들어 쓰기 지연 SQL 저장소에 등록한다.
- 쓰기 지연 SQL 저장소의 쿼리를 데이터베이스에 전송한다.(등록, 수정, 삭제 쿼리)
- 영속성 컨텍스트를 플러시하는 방법 3가지
em.flush()
직접 호출한다.- 테스트나 다른 프레임워크와 JPA를 함께 사용할 때를 제외하고 거의 사용하지 않는다.
- 트랜잭션 커밋 시 플러시가 자동 호출된다.
- 데이터베이스에 변경 내용을 SQL로 전달하지 않고 트랜잭션만 커밋하면 어떤 데이터도 데이터베이스에 반영되지 않기 때문에, 플러시를 호출해서 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영해야 한다.
- JPQL 쿼리 실행 시 플러시가 자동 호출된다.
- 쿼리를 실행하기 위해서는 영속성 컨텍스트에 있는 변경사항이 데이터베이스에 반영되어야 하기 때문에 플러시가 발생한다.
플러시 모드 옵션
- 엔티티 매니저에 플러시 모드를 직접 지정하려면
FlushModeType
을 사용하면 된다.FlushModeType.AUTO
: 커밋이나 쿼리를 실행할 때 플러시(기본값)FlushModeTYpe.COMMIT
: 커밋할 때만 플러시
- COMMIT 모드는 성능 최적화를 위해 사용할 수 있다.
- 플러시를 한다고 영속성 컨텍스트에 보관된 엔티티자 지워지지 않는다.
- 플러시는 영속성 컨텍스트의 변경 내용을 데이터베이스에 동기화하는 것이다.
준영속
- 준영속 상태의 엔티티는 영속성 컨텍스트가 제공하는 기능을 사용할 수 없다.
엔티티를 준영속 상태로 전환: detach()
em.detach()
를 호출하는 순간 영속성 컨텍스트의 1차 캐시부터 쓰기 지연 SQL 저장소까지 해당 엔티티를 관리하기 위한 모든 정보가 제거된다.
영속성 컨텍스트 초기화: clear()
em.clear()
는 영속성 컨텍스트를 초기화해서 해당 영속성 컨텍스트의 모든 엔티티를 준영속 상태로 만든다.
영속성 컨텍스트 종료: close()
em.close()
로 영속성 컨텍스트를 종료하면 영속성 컨텍스트가 관리하던 영속 상태의 엔티티가 모두 준영속 상태가 된다.
준영속 상태의 특징
- 거의 비영속 상태에 가깝다.
- 1차 캐시, 쓰기 지연, 변경 감지, 지연 로딩을 포함한 영속성 컨텍스트가 제공하는 어떤한 기능도 동작하지 않는다.
- 식별자 값을 가지고 있다.
- 비영속 상태는 식별자 값이 없을 수도 있지만 준영속 상태는 이미 한 번 영속 상태였으므로 반드시 식별자 값을 가지고 있다.
- 지연 로딩을 할 수 없다.
- 지연 로딩은 실제 객체 대싱 프록시 객체를 로딩해두고 해당 객체를 실제 사용할 때 영속성 컨텍스트를 통해 데이터를 불러오는 방법이다.
- 하지만 준영속 상태는 영속성 컨텍스트가 더 관리하지 않으므로 지연 로딩 시 문제가 발생한다.
병합: merge()
- 준영속 상태의 엔티티를 다시 영속 상태로 변경하려면 병합을 사용하면 된다.
merge()
메소드는 준영속 상태의 엔티티를 받아서 그 정보로 새로운 영속 상태의 엔티티를 반환한다.merge()
동작 방식- 파라미터로 넘어온 준영속 엔티티의 식별자 값으로 1차 캐시에서 엔티티를 조회한다. 만약 1차 캐시에 엔티티가 없으면 데이터베이스에서 엔티티를 조회하고 1차 캐시에 저장한다.
- 조회한 영속 엔티티(
mergeMember
)에member
엔티티의 값을 채워 넣는다. mergeMember
를 반환한다.
- 병합은 비영속 엔티티도 영속 상태로 만들 수 있다.
- 병합은 save or update 기능을 수행한다.