• 앤티티 매니저(Entity Manager)는 엔티티를 저장하고, 수정하고, 삭제하고, 조회하는 등 엔티티와 관련된 모든 일을 처리한다.
  • 개발자 입장에서 엔티티 매니저는 엔티티를 저장하는 가상의 데이터베이스로 생각하면 된다.

엔티티 매니저 팩토리와 엔티티 매니저

  • 데이터베이스 하나만 사용하는 애플리케이션은 일반적으로 EntityManagerFactory를 하나만 생성한다.
  • 엔티티 매니저 팩토리는 엔티티 매니저를 만드는 공장인데 ,공장을 만드는 비용은 상당히 크다.
    • 따라서 한 개만 만들어서 애플리케이션 전체에서 공유하도록 설계되어 있다.
  • 엔티티 매니저 팩토리는 여러 스레드가 동시에 접근해도 안전하므로 서로 다른 스레드 간에 공유해도 되지만, 엔티티 매니저는 여러 스레드가 동시에 접근하면 동시성 문제가 발생하므로 스레드 간에 절대 공유하면 안 된다.
  • 엔티티 매니저는 데이터베이스 연결이 꼭 필요한 시점까지 커넥션을 얻지 않는다.
    • 일반적으로 트랜잭션을 시작할 때 커넥션을 획득한다.
  • 하이버네이트를 포함한 JPA 구현체들은 엔티티 매니저 팩토리를 생성할 때 커넥션풀도 만드는데 이것은 J2SE 환경에서 사용하는 방법이다.
    • JPA를 J2EE 환경(스프링 프레임워크 포함)에서 사용하면 컨테이너가 제공하는 데이터소스를 사용한다.

J2SE: 자바 프로그래밍 언어의 표준 기능을 제공하여 데스크톱 애플리케이션이나 일반적인 프로그램 개발에 사용된다. J2EE: J2SE를 기반으로 엔터프라이즈 수준의 애플리케이션 개발을 위한 추가 라이브러리와 API를 제공합니다. 주로 웹 서비스 개발에 사용된다.

영속성 컨텍스트란?

  • 영속성 컨텍스트(persistence context): 엔티티를 영구 저장하는 환경
  • 엔티티 매니저로 저장하거나 조회하면 매니저는 영속성 컨텍스트에 엔티티를 보관하고 관리한다.
  • 아래 메서드를 호출하면 ‘엔티티 매니저를 사용해서 엔티티를 영속성 컨텍스트에 저장’ 한다.
    • dm.persist(member)
  • 영속성 컨텍스트는 엔티티 매니저를 생성할 때 하나 만들어진다.
  • 엔티티 매니저를 통해서 용속성 컨텍스트에 접근할 수 있고, 영속성 컨텍스트를 관리할 수 있다.

엔티티의 생명주기

  • 엔티티에는 4가지 상태가 존재한다.

    • 비영속(new/transient): 영속성 컨텍스트와 전혀 관계가 없는 상태
    • 영속(managed): 영속성 컨텍스트에 저장된 상태
    • 준영속(detached): 영속성 컨텍스트에 저장되었다가 분리된 상태
    • 삭제(removed): 삭제된 상태
  • 비영속: 순수한 객체 상태이며 영속성 컨텍스트나 데이터베이스와는 전혀 관련이 없다.

  • 영속: 영속성 컨텍스트가 관리하는 엔티티

    • 영속성 컨텍스트에 의해 관리된다는 의미
    • em.find()나 JPQL을 사용해서 조회한 엔티티도 영속성 컨텍스트가 관리하는 영속 상태다.
  • 준영속: 영속 상태의 엔티티를 영속성 컨텍스트가 관리하지 않으면 준영속 상태가 된다.

    • 특정 엔티티를 준영속 상태로 만들려면 em.detach()를 호출하면 된다.
    • em.close()를 호출해서 영속성 컨텍스트를 닫거나 em.clear()를 호출해서 영속성 컨텍스트를 초기화해도 영속성 컨텍스트가 관리하던 영속 상태의 엔티티는 준영속 상태가 된다.
  • 삭제: 영속성 컨텍스트와 데이터베이스에서 삭제한다.

    • em.remove(member)를 호출하면 삭제 상태가 된다.

영속성 컨텍스트의 특징

  • 영속 상태인 엔티티는 반드시 식별자 값(@Id로 테이블의 기본 키와 매핑한 값)이 있어야 한다.
  • JPA는 보통 트랜잭션을 커밋하는 순간 영속성 컨텍스트에 새로 저장된 엔티티를 데이터베이스에 반영하는데 이것을 플러시(flush)라 한다.
  • 영속성 컨텍스트가 엔티티를 관리하면 얻는 장점
    • 1차 캐시
    • 동일성 보장
    • 트랜잭션을 지원하는 쓰기 지연
    • 변경 감지
    • 지연 로딩

엔티티 조회

  • 영속성 컨텍스트는 내부에 캐시를 가지고 있는데 이것을 1차 캐시라 한다.
    • 영속 상태의 엔티티는 모두 이곳에 저장된다.
    • 1차 캐시의 키는 엔티티의 식별자 값이다.
    • em.find() 메소드의 두 번째 파라미터는 조회할 엔티티의 식별자 값이다.
  • em.find()로 엔티티를 찾을 때 1차 캐시에 엔티티가 있으면 데이터베이스를 조회하지 않고 메모리에 있는 1차 캐시에서 엔티티를 조회한다.
  • em.find()를 호출했는데 엔티티가 1차 캐시에 없으면 엔티티 매니저는 데이터베이스를 조회해서 엔티티를 생성하고, 1차 캐시에 저장한 후에 영속 상태의 엔티티를 반환한다.
  • 영속성 컨텍스트는 1차 캐시에 있는 인스턴스를 반환하기 때문에, 식별자가 같은 엔티티에 대해서 동일성을 보장한다.
  • JPA는 1차 캐시를 통해 REPEATABLE READ 등급의 트랜잭션 격리 수준을 애플리케이션 차원에서 제공한다.

엔티티 등록

  • 엔티티 매니저는 트랜잭션에 커밋하기 직전까지 데이터베이스에 엔티티를 저장하지 않고 내부 쿼리 저장소에 INSERT SQL을 차곡차곡 모아둔다.
  • 트랜잭션을 커밋할 때 모아둔 쿼리를 데이터베이스에 보내는데 이것을 트랜잭션을 지원하는 쓰기 지연(transactional write-behind)이라 한다.
  • 모아둔 등록 쿼리를 커밋하는 시점에 데이터베이스에 한 번에 전달해서 성능을 최적화할 수 있다.

의문점: 엔티티 등록시 쓰기 지연이 발생하는데 어떻게 auto-increment인 primary key인 엔티티에서 id 조회가 가능하지? auto-increment인 primary key를 선언할 때는 주로 @GeneratedValue(strategy = GenerationType.IDENTITY) 로 식별자에 선언하는데 이 경우에는 엔티티 등록 시 쓰기 지연이 동작하지 않는다. https://vvekpandey.medium.com/jpa-auto-generated-values-be5bd7f90200

엔티티 수정

  • JPA로 엔티티를 수정할 때는 단순히 엔티티를 조회해서 데이터만 변경하면 된다.
  • 엔티티의 변경사항을 데이터베이스에 자동으로 반영하는 기능을 변경 감지(dirty checking)라 한다.
  • 변경 감지는 영속성 컨텍스트가 관리한느 영속 상태의 엔티티엠나 적용된다.
  • 변경 감지 과정
    1. 트랜잭션을 커밋하면 엔티티 매니저 내부에서 먼저 플러시(flush())가 호출된다.
    2. 엔티티와 스냅샷을 비교해서 변경된 엔티티를 찾는다.
    3. 변경된 엔티티가 있음녀 수정 쿼리를 생성해서 쓰기 지연 SQL 저장소에 보낸다.
    4. 쓰기 지연 저장소의 SQL을 데이터베이스에 보낸다.
    5. 데이터베이스 트랜잭션을 커밋한다.
  • JPA의 기본 적략은 엔티티의 모든 필드를 업데이트한다.
    • 모든 필드를 업데이트하는 전략의 장점
      • 수정 쿼리가 항상 같기 때문에 애플리케이션 로딩 시점에 수정 쿼리를 미리 생성해두고 재사용할 수 있다.
      • 데이터베이스에 동일한 쿼리를 보내면 데이터베이스는 이전에 한 번 파싱된 쿼리를 재사용할 수 있다.
  • 필드가 많거나 저장되는 내용이 너무 크면 동적으로 UPDATE SQL을 생성하는 전략을 사용하면 된다.
    • 이때는 하이버네이트 확장 기능을 사용해야 한다.
    • 아래와 같이 @DynamicUpdate 어노테이션을 사용하면 수정된 데이터만 사용해서 동적으로 UDPATE SQL을 생성한다.
    • 상황에 따라 다르지만 컬럼이 대략 30 이상이 되면 동적 수정 쿼리가 빠르다고 한다.
    • 가장 정확한 것은 본인 환경에서 직접 테스틑해보는 것이고, 기본 전략을 사용하다가 최적화가 필요할 정도로 느리면 그때 전략을 수정하면 된다.

엔티티 삭제

  • em.remove()를 호출하면 데이터베이스에 즉시 삭제하는 것이 아니라, 쓰기 지연 SQL 저장소에 삭제 쿼리를 등록한다.
    • 또한 em.remove()를 호출하는 순간 해당 엔티티는 영속성 컨텍스트에서 제거된다.
  • 이렇게 삭제된 엔티티는 재사용하지 말고 자연스럽게 가비지 컬렉션의 대상이 되도록 두는 것이 좋다.

플러시

  • 플러시: 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영한다.
  • 플러시를 실행하면 다음과 같은 일이 일어난다.
    1. 변경 감지가 동작해서 영속성 컨텍스트에 있는 모든 엔티티를 스냅샷과 비교해서 수정된 엔티티를 찾는다. 수정된 엔티티는 수정 쿼리를 만들어 쓰기 지연 SQL 저장소에 등록한다.
    2. 쓰기 지연 SQL 저장소의 쿼리를 데이터베이스에 전송한다.(등록, 수정, 삭제 쿼리)
  • 영속성 컨텍스트를 플러시하는 방법 3가지
    • em.flush() 직접 호출한다.
      • 테스트나 다른 프레임워크와 JPA를 함께 사용할 때를 제외하고 거의 사용하지 않는다.
    • 트랜잭션 커밋 시 플러시가 자동 호출된다.
      • 데이터베이스에 변경 내용을 SQL로 전달하지 않고 트랜잭션만 커밋하면 어떤 데이터도 데이터베이스에 반영되지 않기 때문에, 플러시를 호출해서 영속성 컨텍스트의 변경 내용을 데이터베이스에 반영해야 한다.
    • JPQL 쿼리 실행 시 플러시가 자동 호출된다.
      • 쿼리를 실행하기 위해서는 영속성 컨텍스트에 있는 변경사항이 데이터베이스에 반영되어야 하기 때문에 플러시가 발생한다.

플러시 모드 옵션

  • 엔티티 매니저에 플러시 모드를 직접 지정하려면 FlushModeType을 사용하면 된다.
    • FlushModeType.AUTO: 커밋이나 쿼리를 실행할 때 플러시(기본값)
    • FlushModeTYpe.COMMIT: 커밋할 때만 플러시
  • COMMIT 모드는 성능 최적화를 위해 사용할 수 있다.
  • 플러시를 한다고 영속성 컨텍스트에 보관된 엔티티자 지워지지 않는다.
    • 플러시는 영속성 컨텍스트의 변경 내용을 데이터베이스에 동기화하는 것이다.

준영속

  • 준영속 상태의 엔티티는 영속성 컨텍스트가 제공하는 기능을 사용할 수 없다.

엔티티를 준영속 상태로 전환: detach()

  • em.detach()를 호출하는 순간 영속성 컨텍스트의 1차 캐시부터 쓰기 지연 SQL 저장소까지 해당 엔티티를 관리하기 위한 모든 정보가 제거된다.

영속성 컨텍스트 초기화: clear()

  • em.clear()는 영속성 컨텍스트를 초기화해서 해당 영속성 컨텍스트의 모든 엔티티를 준영속 상태로 만든다.

영속성 컨텍스트 종료: close()

  • em.close()로 영속성 컨텍스트를 종료하면 영속성 컨텍스트가 관리하던 영속 상태의 엔티티가 모두 준영속 상태가 된다.

준영속 상태의 특징

  • 거의 비영속 상태에 가깝다.
    • 1차 캐시, 쓰기 지연, 변경 감지, 지연 로딩을 포함한 영속성 컨텍스트가 제공하는 어떤한 기능도 동작하지 않는다.
  • 식별자 값을 가지고 있다.
    • 비영속 상태는 식별자 값이 없을 수도 있지만 준영속 상태는 이미 한 번 영속 상태였으므로 반드시 식별자 값을 가지고 있다.
  • 지연 로딩을 할 수 없다.
    • 지연 로딩은 실제 객체 대싱 프록시 객체를 로딩해두고 해당 객체를 실제 사용할 때 영속성 컨텍스트를 통해 데이터를 불러오는 방법이다.
    • 하지만 준영속 상태는 영속성 컨텍스트가 더 관리하지 않으므로 지연 로딩 시 문제가 발생한다.

병합: merge()

  • 준영속 상태의 엔티티를 다시 영속 상태로 변경하려면 병합을 사용하면 된다.
  • merge() 메소드는 준영속 상태의 엔티티를 받아서 그 정보로 새로운 영속 상태의 엔티티를 반환한다.
  • merge() 동작 방식
    1. 파라미터로 넘어온 준영속 엔티티의 식별자 값으로 1차 캐시에서 엔티티를 조회한다. 만약 1차 캐시에 엔티티가 없으면 데이터베이스에서 엔티티를 조회하고 1차 캐시에 저장한다.
    2. 조회한 영속 엔티티(mergeMember)에 member 엔티티의 값을 채워 넣는다.
    3. mergeMember를 반환한다.
  • 병합은 비영속 엔티티도 영속 상태로 만들 수 있다.
    • 병합은 save or update 기능을 수행한다.