Spaces:

pawankr007
/

NEtraAi

Sleeping

App Files Files Community

Pavanupadhyay27 commited on 20 days ago

Commit

c40c998

1 Parent(s): 7c11686

Apply memory optimizations to ONNX Runtime to enable real biometric face recognition on Render Free Tier

Browse files

Files changed (2) hide show

backend/app/api/v1/kiosk.py +0 -5
backend/app/services/face_engine.py +16 -4

backend/app/api/v1/kiosk.py CHANGED Viewed

@@ -199,11 +199,6 @@ def scan_face(
     # Similarity = 1 - Distance
     similarity = 1.0 - float(distance)
-    if face_engine.mock_mode:
-        # Override match similarity in mock mode to allow functional kiosk scans during demos
-        import random
-        similarity = random.uniform(0.81, 0.94)
     if similarity < face_threshold:
         # Low confidence match -> Unknown
         log_entry = crud.create_attendance_log(

     # Similarity = 1 - Distance
     similarity = 1.0 - float(distance)
     if similarity < face_threshold:
         # Low confidence match -> Unknown
         log_entry = crud.create_attendance_log(

backend/app/services/face_engine.py CHANGED Viewed

@@ -66,25 +66,37 @@ class FaceEngine:
     def _init_sessions(self):
         try:
-            # Initialize ONNX Runtime Inference Sessions
-            # CPU Execution Provider is used by default for cross-platform compatibility
             opts = ort.SessionOptions()
-            opts.intra_op_num_threads = 4
             providers = ['CPUExecutionProvider']
             # If GPU is available (optional setup)
             if 'CUDAExecutionProvider' in ort.get_available_providers():
                 providers = ['CUDAExecutionProvider'] + providers
-            logger.info(f"Initializing ONNX sessions with providers: {providers}")
             self.det_session = ort.InferenceSession(self.det_model_path, opts, providers=providers)
             self.rec_session = ort.InferenceSession(self.rec_model_path, opts, providers=providers)
             self.live_session_27 = ort.InferenceSession(self.liveness_model_27, opts, providers=providers)
             # Optional 1.8 liveness model
             if os.path.exists(self.liveness_model_18):
                 self.live_session_18 = ort.InferenceSession(self.liveness_model_18, opts, providers=providers)
             else:
                 self.live_session_18 = None

     def _init_sessions(self):
         try:
+            import gc
+            # Initialize ONNX Runtime Inference Sessions with memory-optimized settings
+            # to prevent OOM crashes on low-resource servers (like Render's 512MB Free Tier)
             opts = ort.SessionOptions()
+            opts.intra_op_num_threads = 1
+            opts.inter_op_num_threads = 1
+            opts.execution_mode = ort.ExecutionMode.ORT_SEQUENTIAL
+            opts.graph_optimization_level = ort.GraphOptimizationLevel.ORT_DISABLE_ALL
+            opts.enable_cpu_mem_arena = False
+            opts.add_session_config_entry("memory.enable_memory_arena_shrinkage", "cpu:0")
             providers = ['CPUExecutionProvider']
             # If GPU is available (optional setup)
             if 'CUDAExecutionProvider' in ort.get_available_providers():
                 providers = ['CUDAExecutionProvider'] + providers
+            logger.info(f"Initializing ONNX sessions with memory optimization and providers: {providers}")
             self.det_session = ort.InferenceSession(self.det_model_path, opts, providers=providers)
+            gc.collect()
             self.rec_session = ort.InferenceSession(self.rec_model_path, opts, providers=providers)
+            gc.collect()
             self.live_session_27 = ort.InferenceSession(self.liveness_model_27, opts, providers=providers)
+            gc.collect()
             # Optional 1.8 liveness model
             if os.path.exists(self.liveness_model_18):
                 self.live_session_18 = ort.InferenceSession(self.liveness_model_18, opts, providers=providers)
+                gc.collect()
             else:
                 self.live_session_18 = None