본문 바로가기
데이터 무결성(Data Integrity, DI)/DI 심화

AI 기반 시스템에서의 DI 실현 전략

by KDKKDK22 2025. 5. 16.

AI 기반 시스템에서의 DI 실현 전략

 

✅ AI 기반 시스템에서의 DI 실현 전략

– Explainability 기반 무결성 적용 가이드 –

 

"인공지능 시스템의 의사결정은 검증 가능하고
이해 가능한 방식으로 기록되어야 하며,
데이터 무결성은 이 원칙의 전제 조건이다."
— MHRA, GxP Data Integrity Guidance and Definitions, 2021

 

 

 


 

 

🔹 개요 - 자동화 및 AI 시대의 데이터 무결성 패러다임

 

GMP 환경은 디지털 전환의 가속화로 기존 자동화 시스템을 넘어선 혁신을 맞이하고 있습니다.

  • 자동화 시스템의 진화:
    • 기존 자동화 시스템 (MES, LIMS, CDS 등)
    • 예측형 인공지능(AI), 머신러닝 기반 분석, 자동 해석 알고리즘 도입
    • 적용 범위 확장

이러한 기술 발전에 따라 데이터 무결성(DI)은
다음 요소들을 포함하는 체계적 접근으로 진화하고 있습니다.

  • 데이터 무결성(DI)의 진화:
    • AI 의사결정 프로세스
    • 학습 데이터셋
    • 변경 이력 관리

본 포스팅에서는 자동화 및 AI 시스템 환경에서의
효과적인 DI 구현 방안을 다음과 같이 제시합니다.

  • DI 구현 방안:
    • 자동화 및 AI 시스템 환경
    • 국내 규제 요건 기반
    • AI 관련 국제 기준 (MHRA, GAMP 5) 참조
    • 포괄적인 전략 수립
  •  

 

 


 

 

🔹 본론 – 자동화·AI 환경에서의 DI 요구사항 적용 전략

 

✅ 자동화 시스템 내 DI 핵심 적용 포인트 (MES, LIMS 등)

  1. 자동화 기록의 실시간성 확보
    • 타임스탬프 자동 생성, 입력자 매핑 구조 확인
    • Manual Override 시 별도 로그 기록, 사용자 인증 요구
  2. Audit Trail 독립성과 검토 체계 구축
    • 변경 이력은 삭제 불가 구조로 설계, QA가 검토 가능해야 함
  3. CSV 절차 내 DI 요구사항 반영 (URS~PQ)
    • 접근권한, 감사기록, 백업 요건 포함
    • 시스템 검증 항목과 DI 검토를 병렬 설계

 


 

✅ AI 시스템 내 DI 고려사항 (Explainable AI 중심)

  1. Explainability 구조 수립
    • 예측 결과의 판단 경로 설명 문서화 (모델 해석, 입력 데이터 영향도)
    • 사용된 변수 및 정합성 기준의 추적 가능성 확보
  2. Training 데이터의 무결성
    • 원본 데이터 보존 및 변경 이력 기록
    • 수집 기준 및 전처리 과정 문서화
  3. AI 모델 검증 및 변경관리 체계 수립
    • 반복 학습, 파라미터 변경, 알고리즘 교체 시 Change Control 적용
    • 학습 버전관리, 성능 비교 이력 보존
  4. AI 자동 의사결정 체계와 인적 검토 병행
    • 공정 변경, 시험 자동 판독 등에서 QA 이의제기 권한 보장
    • "AI 판단 보조" 또는 "자동 승인" 여부의 명확한 구분

 

 


 

✅ AI 시스템 적용 시 DI 흐름도

 

AI 시스템 적용 시 DI 흐름도

 

 

 


 

 

🔹 결론 - AI 시스템의 데이터 무결성 핵심 요소

 

자동화 및 AI 시스템은 운영 효율성과 품질 신뢰성을 향상시키지만,
데이터 무결성 기준이 미흡하면 GMP 규정 준수에 심각한 위험을 초래할 수 있습니다.
따라서 AI 시스템 도입 시에는 데이터 무결성 확보를 위한 핵심 요소들을
종합적으로 고려한 전략 수립이 필수적입니다.

 

데이터 무결성을 보장하기 위한 핵심 요소는 다음과 같습니다.

  • 의사결정 과정의 투명성 (Explainability):
    • AI 시스템의 판단 근거를 명확히 제시하여 신뢰성을 확보해야 합니다.
  • 적절한 인적 관리감독 체계:
    • AI 시스템의 운영과 결과에 대한 책임 있는 인력 관리 및 감독 체계를 구축해야 합니다.
  • 데이터 및 모델 이력의 체계적 관리:
    • 데이터의 수집, 처리, 저장, 활용 전 과정과 모델의 개발 및 변경 이력을 추적하고 관리해야 합니다.

GMP 조직은 AI 시스템 구현 시 컴퓨터 시스템 밸리데이션 원칙과 연계하여
위의 핵심 요소들이 통합된 데이터 무결성 전략을 수립해야 합니다.
이를 통해 GMP 규정 준수와 시스템의 신뢰성을 확보할 수 있습니다.

 

 


 

 

📚 주요 용어 정리

용어 정의
Explainable AI (XAI) AI의 예측 과정과 판단 기준이 사람에게 설명 가능하도록 설계된 구조
Manual Override 자동화된 판단 또는 입력값을 수동으로 조작하거나 변경하는 사용자 행위
AI 모델 검증 학습된 AI 알고리즘이 의도대로 작동하며 오류 없이 결과를 산출하는지 검토하는 절차
Training Data Integrity 학습용 데이터의 출처, 수집 경로, 변경 이력 및 품질이 유지되는 상태
AI 변경관리 AI 모델 업데이트 또는 파라미터 조정 시 DI 영향을 검토하고 공식 기록화하는 활동
GxP-AI Interface AI가 GxP 품질관리 체계 내 어디에 통합되고 누구의 검토 대상이 되는지를 정의한 구조

 

 

 


 

 

📕 참고문헌

  • MHRA, GxP Data Integrity Guidance and Definitions, 2021
  • PIC/S PI 041-1, Good Practices for Data Management and Integrity, 2021
  • ISPE, GAMP 5 2nd Edition – A Risk-Based Approach to Compliant GxP Computerized Systems, 2022
  • 식품의약품안전처, 첨단바이오의약품 데이터 완전성 안내서, 2023

 

 


 

 

🔗 관련 포스팅 링크