Spaces:

LLDDWW
/

MedCard

Sleeping

LLDDWW Claude commited on Oct 1

Commit

7138a91

1 Parent(s): c74ab95

chore: switch to Korean-optimized TrOCR model

- Replace microsoft/trocr-large-printed with ddobokki/ko-trocr
- This model is specifically trained for Korean text and handles 초성 better

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <[email protected]>

Files changed (1) hide show

app.py +5 -5

app.py CHANGED Viewed

@@ -8,8 +8,8 @@ import torch
 from PIL import Image
 from transformers import VisionEncoderDecoderModel, TrOCRProcessor, AutoTokenizer, AutoModelForCausalLM
-# Stage 1: OCR 모델 (TrOCR로 문서에서 텍스트 추출)
-OCR_MODEL_ID = "microsoft/trocr-large-printed"
 # Stage 2: LLM 모델 (텍스트에서 약 이름 추출)
 LLM_MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"
@@ -40,9 +40,9 @@ def _load_llm_model():
     return model, tokenizer
-print("🔄 Loading TrOCR model...")
 OCR_MODEL, OCR_PROCESSOR = _load_ocr_model()
-print("✅ TrOCR model loaded!")
 print("🔄 Loading Qwen2.5-7B-Instruct...")
 LLM_MODEL, LLM_TOKENIZER = _load_llm_model()
@@ -304,7 +304,7 @@ with gr.Blocks(theme=gr.themes.Soft(), css=CUSTOM_CSS) as demo:
     ---
     **ℹ️ 2단계 파이프라인**
-    - **Stage 1**: TrOCR (OCR) - 이미지에서 모든 텍스트 추출
     - **Stage 2**: Qwen2.5 7B (LLM) - 추출된 텍스트에서 약 이름만 식별
     실제 복약은 의사·약사의 지시를 따르세요.

 from PIL import Image
 from transformers import VisionEncoderDecoderModel, TrOCRProcessor, AutoTokenizer, AutoModelForCausalLM
+# Stage 1: OCR 모델 (한국어 TrOCR로 문서에서 텍스트 추출)
+OCR_MODEL_ID = "ddobokki/ko-trocr"
 # Stage 2: LLM 모델 (텍스트에서 약 이름 추출)
 LLM_MODEL_ID = "Qwen/Qwen2.5-7B-Instruct"
     return model, tokenizer
+print("🔄 Loading Korean TrOCR model (ddobokki/ko-trocr)...")
 OCR_MODEL, OCR_PROCESSOR = _load_ocr_model()
+print("✅ Korean TrOCR model loaded!")
 print("🔄 Loading Qwen2.5-7B-Instruct...")
 LLM_MODEL, LLM_TOKENIZER = _load_llm_model()
     ---
     **ℹ️ 2단계 파이프라인**
+    - **Stage 1**: Korean TrOCR (ddobokki/ko-trocr) - 이미지에서 한국어 텍스트 추출
     - **Stage 2**: Qwen2.5 7B (LLM) - 추출된 텍스트에서 약 이름만 식별
     실제 복약은 의사·약사의 지시를 따르세요.