2025-07-12 09:09:45,944 [CRITICAL] 致命错误: 'maix._maix.nn.OCR_Object' object has no attribute 'copy'

2025-07-12 09:23:25,327 [CRITICAL] 致命错误: 'builtin_function_or_method' object has no attribute 'strip'。修改代码后输出完整代码

错误信息指出：尝试在builtin_function_or_method对象上调用strip()方法。这通常是因为我们错误地将一个方法（而不是调用方法）当成了字符串。在之前的代码中，我们使用obj.char_str来获取字符串，但可能在某些...

下面的代码不能实现识别物体并拍照保存，然后load照片读取文字的功能，只能运行到识别物体阶段 from maix import camera, display, image, nn, app import os model = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model) cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) disp = display.Display() image.load_font("ppocr", "/maixapp/share/font/ppocr_keys_v1.ttf", size = 20) image.set_default_font("ppocr") while not app.need_exit(): img = cam.read() objs = ocr.detect(img) for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) disp.show(img) # 执行对拍到的照片进行文字读取 model = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model) SAVE_DIR = "/root/models/mymodel/" # 加载最新保存的图片 def process_latest_image(): files = sorted([f for f in os.listdir(SAVE_DIR) if f.endswith(".jpg")], key=lambda x: os.path.getmtime(os.path.join(SAVE_DIR, x)), reverse=True) if files: latest_file = os.path.join(SAVE_DIR, files[0]) img = image.load(latest_file) objs = ocr.detect(img) # 绘制结果 disp = display.Display() for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) disp.show(img) return objs return [] # 执行处理 results = process_latest_image() print(f"识别到{len(results)}个文字区域")

from maix import camera, display, image, nn, app import os, time # 初始化部分 model_path = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model_path) SAVE_DIR = "/root/images/ocr_captures/" os.makedirs...

from maix import camera, display, image, nn, app import time import os # 初始化存储目录 SAVE_DIR = "/root/models/mymodel/" os.makedirs(SAVE_DIR, exist_ok=True) # 初始化YOLOv5模型和硬件 detector = nn.YOLOv5(model="/root/models/mymodel/model_127448.mud", dual_buff=True) det_cam = camera.Camera(detector.input_width(), detector.input_height(), detector.input_format()) # 初始化OCR模型和硬件 ocr_model_path = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(ocr_model_path) ocr_cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) disp = display.Display() # 加载专用字体 image.load_font("ppocr", "/maixapp/share/font/ppocr_keys_v1.ttf", size=20) image.set_default_font("ppocr") # 状态变量 last_save_time = 0 save_count = 0 def process_image(img_path): """加载并处理保存下来的图片""" try: saved_img = image.Image().load(img_path) objs = ocr.detect(saved_img) # 在原始图像上绘制OCR识别结果 for obj in objs: points = obj.box.to_list() saved_img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) saved_img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) return saved_img except Exception as e: print(f"OCR处理异常: {str(e)}") return None # 主循环 while not app.need_exit(): try: det_img = det_cam.read() objs = detector.detect(det_img, conf_th=0.5, iou_th=0.45) # 打印调试信息 print(f"检测到 {len(objs)} 个物体 | 冷却时间剩余: {max(3 - (time.time()-last_save_time), 0):.1f}s") # 如果有物体被检测到且距离上次保存超过3秒，则保存当前帧 if len(objs) > 0 and (time.time() - last_save_time) >= 3: filename = f"{SAVE_DIR}detect_{save_count}_{int(time.time())}.jpg" try: det_img.save(filename, quality=85) print(f"保存成功: {filename}") # 对刚保存的图片执行OCR处理 processed_img = process_image(filename) if processed_img is not None: # 显示含有OCR结果的图像 disp.show(processed_img) last_save_time = time.time() save_count += 1 except Exception as e: print(f"保存失败: {str(e)}") # 实时显示带有检测框的图像 for obj in objs: det_img.draw_rect(obj.x, obj.y, obj.w, obj.h, color=image.COLOR_RED) msg = f'{detector.labels[obj.class_id]}: {obj.score:.2f}' det_img.draw_string(obj.x, obj.y+2, msg, scale=0.5, color=image.COLOR_RED) disp.show(det_img) except Exception as e: print(f"主循环异常: {str(e)}") break 整合后的代码反馈保存成功: /root/models/mymodel/detect_1_1742902780.jpg OCR处理异常: init(): incompatible constructor arguments. The following argument types are supported: 1. maix._maix.image.Image(width: int, height: int, format: maix._maix.image.Format = <Format.FMT_RGB888: 0>)要怎么修改？

好的，用户遇到了一个错误，需要帮助解决。首先，我需要仔细分析问题。错误信息是“OCR处理异常: __init__(): incompatible constructor arguments...”看起来是在创建image.Image对象时参数不兼容。用户提供的代码...

理解下面maixcam代码，修改代码1里的yolo5模型识别逻辑改成代码2的ocr模型识别逻辑。当ocr识别到01、02、03、04、05、06、07时，运行代码1的elif 1 <= obj.class_id <= 18:逻辑。当ocr识别到08，执行if obj.class_id == 19的逻辑。代码1：import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime # 日志配置 logging.basicConfig( level=logging.INFO, format='%(asctime)s [%(levelname)s] %(message)s', handlers=[ logging.FileHandler("/root/operation.log"), logging.StreamHandler() ] ) logger = logging.getLogger("MAIX_PRO") # 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2# 特殊处理模式（标签19） WAIT_FOR_LABEL1 = 3 # 等待标签1状态 # 模型加载 try: detector = nn.YOLOv5(model="/root/models/mymodels/model_195130.mud", dual_buff=True) logger.info("YOLOv5 model loaded") except Exception as e: logger.critical(f"Model load failed: {str(e)}") exit(1) # 保存目录 # SAVE_DIR = "/root/models/mymodel/" SAVE_DIR = "/boot/Pictures/" os.makedirs(SAVE_DIR, exist_ok=True) # 硬件初始化（调整为硬件支持的分辨率） try: cam = camera.Camera(width=1080, height=640) # 使用标准VGA分辨率 logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}") except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}") exit(1) disp = display.Display() # UART初始化 device = "/dev/ttyS0" serial0 = uart.UART(device, 38400) logger.info("UART initialized") # 登录获取token login_url = "http://111.230.114.23/api/user/login" headers_login = {'Content-Type': 'application/json'} login_data = {"userAccount": "lanyating", "userPassword": 12345678} json_data = json.dumps(login_data) try: login_response = requests.post(login_url, data=json_data, headers=headers_login) response_json = login_response.json() token = response_json.get('data') if token: logger.info(f"Login successful, token obtained: {token[:10]}...") # 只显示部分token以保护隐私 else: logger.error(f"Login failed: No token returned in response") exit(1) except Exception as e: logger.critical(f"Login failed: {str(e)}") exit(1) def send_uart(data): try: serial0.write_str(data + "\n") logger.info(f"UART sent: {data}") except Exception as e: logger.error(f"UART send failed: {str(e)}") class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward self.send_uart("forward") # 初始化 photo_url 和 data_url self.photo_url = "http://111.230.114.23/api/file/upload" self.data_url = "http://111.230.114.23/api/data/add" # 确保 token 在整个类中可用 self.token = token def send_uart(self, command): try: serial0.write_str(command + "\n") logger.info(f"UART sent: {command}") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0 : logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") return None def save_data(self, data): try: params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0 : logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") def handle_detection(self, objs, img): with self.lock: current_time = time.time() # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: if obj.class_id == 19: logger.info("Special label 19 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 1秒后保存并上传 def delayed_save(): print("开始上传") data = self.save_and_upload(img, 19) print("上传成功") if data: self.save_data(data) self.send_uart("back") self.add_timer(1.0, delayed_save) break elif 1 <= obj.class_id <= 18: logger.info(f"Label {obj.class_id} detected") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 1秒后保存并上传 def delayed_save(): print("开始上传") data = self.save_and_upload(img, obj.class_id) print("上传成功") if data: self.save_data(data) self.add_timer(1.0, delayed_save) # 2秒后发送forward def delayed_forward(): self.send_uart("forward") self.state = SystemState.NORMAL self.add_timer(2.0, delayed_forward) break elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass # 在同步上传的情况下不需要等待标志位 elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: if obj.class_id == 1: logger.info("Label1 after special handling") self.send_uart("stop") self.add_timer(1.0, lambda: self.send_uart("forward")) self.state = SystemState.NORMAL break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") # 主控制实例 controller = OperationController() # 创建 Color 对象 red_color = image.Color(255, 0, 0) # 定义标准红色 # 主循环 try: while not app.need_exit(): try: img = cam.read() except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 执行检测 try: objs = detector.detect(img, conf_th=0.6) except Exception as e: logger.error(f"目标检测失败: {str(e)}") disp.show(img) continue # 处理结果 if len(objs) > 0: controller.handle_detection(objs, img) # 显示画面 for obj in objs: # 绘制检测框（使用位置参数） img.draw_rect( obj.x, obj.y, obj.w, obj.h, red_color, # 颜色参数位置 2 # 线宽参数位置 ) # 绘制标签文本 img.draw_string( obj.x, obj.y, f"{detector.labels[obj.class_id]} {obj.score:.2f}", scale=0.5, color=red_color ) disp.show(img) except KeyboardInterrupt: logger.info("用户中断") except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info("系统关闭") 代码2：from maix import camera, display, image, nn, app, time, touchscreen def is_in_button(x, y, btn_pos): return x > btn_pos[0] and x < btn_pos[0] + btn_pos[2] and y > btn_pos[1] and y < btn_pos[1] + btn_pos[3] def main(disp): model = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model) cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) ts = touchscreen.TouchScreen() img_back = image.load("/maixapp/share/icon/ret.png") back_rect = [0, 0, 32, 32] back_rect_disp = image.resize_map_pos(cam.width(), cam.height(), disp.width(), disp.height(), image.Fit.FIT_CONTAIN, back_rect[0], back_rect[1], back_rect[2], back_rect[3]) image.load_font("ppocr", "/maixapp/share/font/ppocr_keys_v1.ttf", size = 20) image.set_default_font("ppocr") while not app.need_exit(): img = cam.read() objs = ocr.detect(img) for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) img.draw_image(0, 0, img_back) disp.show(img) x, y, pressed = ts.read() if is_in_button(x, y, back_rect_disp): app.set_exit_flag(True) if name == 'main': screen = display.Display() try: main(screen) except Exception: import traceback e = traceback.format_exc() print(e) img = image.Image(screen.width(), screen.height()) img.draw_string(2, 2, e, image.COLOR_WHITE, font="hershey_complex_small", scale=0.6) screen.show(img) while not app.need_exit(): time.sleep(0.2)

我们有两个代码片段，代码1是基于YOLOv5的目标检测，代码2是基于PP_OCR的文本识别。任务要求：修改代码1，将其中使用YOLOv5模型识别物体的逻辑替换为使用OCR模型（如代码2所示）的识别逻辑。具体规则： 1. 当...

理解下面maixcam代码，修改代码1里的yolo5模型识别逻辑改成代码2的ocr模型识别逻辑。当ocr识别到01、02、03、04、05、06、07时，运行代码1的elif 1 <= obj.class_id <= 18逻辑。当ocr识别到08，执行if obj.class_id == 19的逻辑，接着执行SystemState.WAIT_FOR_LABEL1的逻辑。这里的运行代码1的elif 1 <= obj.class_id <= 18逻辑是指直接修改代码1里的条件使逻辑运行。代码1：import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime 日志配置 logging.basicConfig( level=logging.INFO, format=‘%(asctime)s [%(levelname)s] %(message)s’, handlers=[ logging.FileHandler(“/root/operation.log”), logging.StreamHandler() ] ) logger = logging.getLogger(“MAIX_PRO”) 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2# 特殊处理模式（标签19） WAIT_FOR_LABEL1 = 3 # 等待标签1状态模型加载 try: detector = nn.YOLOv5(model=“/root/models/mymodels/model_195130.mud”, dual_buff=True) logger.info(“YOLOv5 model loaded”) except Exception as e: logger.critical(f"Model load failed: {str(e)}") exit(1) 保存目录 SAVE_DIR = “/root/models/mymodel/” SAVE_DIR = “/boot/Pictures/” os.makedirs(SAVE_DIR, exist_ok=True) 硬件初始化（调整为硬件支持的分辨率） try: cam = camera.Camera(width=1080, height=640) # 使用标准VGA分辨率 logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}“) except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}”) exit(1) disp = display.Display() UART初始化 device = “/dev/ttyS0” serial0 = uart.UART(device, 38400) logger.info(“UART initialized”) 登录获取token login_url = “http://111.230.114.23/api/user/login” headers_login = {‘Content-Type’: ‘application/json’} login_data = {“userAccount”: “lanyating”, “userPassword”: 12345678} json_data = json.dumps(login_data) try: login_response = requests.post(login_url, data=json_data, headers=headers_login) response_json = login_response.json() token = response_json.get(‘data’) if token: logger.info(f"Login successful, token obtained: {token[:10]}…“) # 只显示部分token以保护隐私 else: logger.error(f"Login failed: No token returned in response”) exit(1) except Exception as e: logger.critical(f"Login failed: {str(e)}") exit(1) def send_uart(data): try: serial0.write_str(data + “\n”) logger.info(f"UART sent: {data}“) except Exception as e: logger.error(f"UART send failed: {str(e)}”) class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward self.send_uart("forward") # 初始化 photo_url 和 data_url self.photo_url = "http://111.230.114.23/api/file/upload" self.data_url = "http://111.230.114.23/api/data/add" # 确保 token 在整个类中可用 self.token = token def send_uart(self, command): try: serial0.write_str(command + "\n") logger.info(f"UART sent: {command}") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0 : logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") return None def save_data(self, data): try: params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0 : logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") def handle_detection(self, objs, img): with self.lock: current_time = time.time() # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: if obj.class_id == 19: logger.info("Special label 19 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 1秒后保存并上传 def delayed_save(): print("开始上传") data = self.save_and_upload(img, 19) print("上传成功") if data: self.save_data(data) self.send_uart("back") self.add_timer(1.0, delayed_save) break elif 1 <= obj.class_id <= 18: logger.info(f"Label {obj.class_id} detected") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 1秒后保存并上传 def delayed_save(): print("开始上传") data = self.save_and_upload(img, obj.class_id) print("上传成功") if data: self.save_data(data) self.add_timer(1.0, delayed_save) # 2秒后发送forward def delayed_forward(): self.send_uart("forward") self.state = SystemState.NORMAL self.add_timer(2.0, delayed_forward) break elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass # 在同步上传的情况下不需要等待标志位 elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: if obj.class_id == 1: logger.info("Label1 after special handling") self.send_uart("stop") self.add_timer(1.0, lambda: self.send_uart("forward")) self.state = SystemState.NORMAL break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") 主控制实例 controller = OperationController() 创建 Color 对象 red_color = image.Color(255, 0, 0) # 定义标准红色主循环 try: while not app.need_exit(): try: img = cam.read() except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 执行检测 try: objs = detector.detect(img, conf_th=0.6) except Exception as e: logger.error(f"目标检测失败: {str(e)}") disp.show(img) continue # 处理结果 if len(objs) > 0: controller.handle_detection(objs, img) # 显示画面 for obj in objs: # 绘制检测框（使用位置参数） img.draw_rect( obj.x, obj.y, obj.w, obj.h, red_color, # 颜色参数位置 2 # 线宽参数位置 ) # 绘制标签文本 img.draw_string( obj.x, obj.y, f"{detector.labels[obj.class_id]} {obj.score:.2f}", scale=0.5, color=red_color ) disp.show(img) except KeyboardInterrupt: logger.info(“用户中断”) except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info(“系统关闭”) 代码2：from maix import camera, display, image, nn, app, time, touchscreen def is_in_button(x, y, btn_pos): return x > btn_pos[0] and x < btn_pos[0] + btn_pos[2] and y > btn_pos[1] and y < btn_pos[1] + btn_pos[3] def main(disp): model = “/root/models/pp_ocr.mud” ocr = nn.PP_OCR(model) cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) ts = touchscreen.TouchScreen() img_back = image.load("/maixapp/share/icon/ret.png") back_rect = [0, 0, 32, 32] back_rect_disp = image.resize_map_pos(cam.width(), cam.height(), disp.width(), disp.height(), image.Fit.FIT_CONTAIN, back_rect[0], back_rect[1], back_rect[2], back_rect[3]) image.load_font("ppocr", "/maixapp/share/font/ppocr_keys_v1.ttf", size = 20) image.set_default_font("ppocr") while not app.need_exit(): img = cam.read() objs = ocr.detect(img) for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) img.draw_image(0, 0, img_back) disp.show(img) x, y, pressed = ts.read() if is_in_button(x, y, back_rect_disp): app.set_exit_flag(True) if name == ‘main’: screen = display.Display() try: main(screen) except Exception: import traceback e = traceback.format_exc() print(e) img = image.Image(screen.width(), screen.height()) img.draw_string(2, 2, e, image.COLOR_WHITE, font=“hershey_complex_small”, scale=0.6) screen.show(img) while not app.need_exit(): time.sleep(0.2)

我们需要将代码1中的目标检测（YOLOv5）逻辑替换为OCR识别逻辑（来自代码2的PP_OCR模型）。要求： 1. 当OCR识别到文本为"01"、"02"、...、"07"时，执行原代码1中elif 1 <= obj.class_id 的逻辑（注意：这里obj....

[SAMPLE_COMM_ISP_Thread]-95: ISP Dev 0 running! 0 R:1257 B:3920 CT:2788 1 R:1588 B:2858 CT:3968 2 R:2169 B:1819 CT:7154 Golden 1588 1024 2858 wdrLEOnly:1 [SAMPLE_COMM_VO_StartChn]-351: u32Width:480, u32Height:640, u32Square:1 -- [I] [Maix Comm Protocol] exit... -- [I] [Maix Comm Protocol] exit success -- [I] [Maix Comm Protocol] UART /dev/serial0 ready to init 2025-07-11 15:21:45,777 [INFO] UART initialized 2025-07-11 15:21:45,904 [CRITICAL] Login failed: Expecting value: line 1 column 1 (char 0) maix multi-media driver released. ISP Vipipe(0) Free pa(0x8abdf000) va(0x0x3fde3a8000) program exit failed. exit code: 1. import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime # 日志配置 logging.basicConfig( level=logging.INFO, format='%(asctime)s [%(levelname)s] %(message)s', handlers=[ logging.FileHandler("/root/operation.log"), logging.StreamHandler() ] ) logger = logging.getLogger("MAIX_PRO") # 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2# 特殊处理模式（标签19） WAIT_FOR_LABEL1 = 3 # 等待标签1状态 # 模型加载 try: model = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model) logger.info("OCR model loaded") except Exception as e: logger.critical(f"Model load failed: {str(e)}") exit(1) # 保存目录 # SAVE_DIR = "/root/models/mymodel/" SAVE_DIR = "/boot/Pictures/" os.makedirs(SAVE_DIR, exist_ok=True) # 硬件初始化（调整为硬件支持的分辨率） try: cam = camera.Camera(width=1080, height=640) # 使用标准VGA分辨率 logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}") except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}") exit(1) disp = display.Display() # UART初始化 device = "/dev/ttyS0" serial0 = uart.UART(device, 38400) logger.info("UART initialized") # 登录获取token login_url = "http://111.230.114.23/api/user/login" headers_login = {'Content-Type': 'application/json'} login_data = {"userAccount": "lanyating", "userPassword": 12345678} json_data = json.dumps(login_data) try: login_response = requests.post(login_url, data=json_data, headers=headers_login) response_json = login_response.json() token = response_json.get('data') if token: logger.info(f"Login successful, token obtained: {token[:10]}...") # 只显示部分token以保护隐私 else: logger.error(f"Login failed: No token returned in response") exit(1) except Exception as e: logger.critical(f"Login failed: {str(e)}") exit(1) def send_uart(data): try: serial0.write_str(data + "\n") logger.info(f"UART sent: {data}") except Exception as e: logger.error(f"UART send failed: {str(e)}") class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward self.send_uart("forward") # 初始化 photo_url 和 data_url self.photo_url = "http://111.230.114.23/api/file/upload" self.data_url = "http://111.230.114.23/api/data/add" # 确保 token 在整个类中可用 self.token = token def send_uart(self, command): try: serial0.write_str(command + "\n") logger.info(f"UART sent: {command}") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0 : logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") return None def save_data(self, data): try: params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0 : logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") def handle_detection(self, objs, img): with self.lock: current_time = time.time() img=cam.read() objs = ocr.detect(img) # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: if obj.char_str() == 8: logger.info("Special label 19 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 1秒后保存并上传 def delayed_save(): print("开始上传") data = self.save_and_upload(img, 19) print("上传成功") if data: self.save_data(data) self.send_uart("back") self.add_timer(1.0, delayed_save) break elif 1 <= char_str() <= 7: logger.info(f"Label {obj.class_id} detected") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 1秒后保存并上传 def delayed_save(): print("开始上传") data = self.save_and_upload(img, obj.class_id) print("上传成功") if data: self.save_data(data) self.add_timer(1.0, delayed_save) # 2秒后发送forward def delayed_forward(): self.send_uart("forward") self.state = SystemState.NORMAL self.add_timer(2.0, delayed_forward) break elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass # 在同步上传的情况下不需要等待标志位 elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: if obj.class_id == 1: logger.info("Label1 after special handling") self.send_uart("stop") self.add_timer(1.0, lambda: self.send_uart("forward")) self.state = SystemState.NORMAL break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") # 主控制实例 controller = OperationController() # 创建 Color 对象 red_color = image.Color(255, 0, 0) # 定义标准红色 # 主循环 try: while not app.need_exit(): try: img = cam.read() except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 执行检测 try: objs = detector.detect(img, conf_th=0.6) except Exception as e: logger.error(f"目标检测失败: {str(e)}") disp.show(img) continue # 处理结果 if len(objs) > 0: controller.handle_detection(objs, img) # 显示画面 for obj in objs: # 绘制检测框（使用位置参数） img.draw_rect( obj.x, obj.y, obj.w, obj.h, red_color, # 颜色参数位置 2 # 线宽参数位置 ) # 绘制标签文本 img.draw_string( obj.x, obj.y, f"{detector.labels[char_str()]} {obj.score:.2f}", scale=0.5, color=red_color ) disp.show(img) except KeyboardInterrupt: logger.info("用户中断") except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info("系统关闭") 查找错误原因

另外，在程序启动时，我们看到的日志中已经有一个CRITICAL日志：2025-07-11 15:21:45,904 [CRITICAL] Login failed: Expecting value: line 1 column 1 (char 0)，所以可以确定是登录问题。因此，我们需要确保...

给下面的maixcam代码继续注释from maix import camera, display, image, nn, app, time, touchscreen def is_in_button(x, y, btn_pos): return x > btn_pos[0] and x < btn_pos[0] + btn_pos[2] and y > btn_pos[1] and y < btn_pos[1] + btn_pos[3] def main(disp): model = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model) cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) ts = touchscreen.TouchScreen() img_back = image.load("/maixapp/share/icon/ret.png") back_rect = [0, 0, 32, 32] back_rect_disp = image.resize_map_pos(cam.width(), cam.height(), disp.width(), disp.height(), image.Fit.FIT_CONTAIN, back_rect[0], back_rect[1], back_rect[2], back_rect[3]) image.load_font("ppocr", "/maixapp/share/font/ppocr_keys_v1.ttf", size = 20) image.set_default_font("ppocr") while not app.need_exit(): img = cam.read() objs = ocr.detect(img) for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) img.draw_image(0, 0, img_back) disp.show(img) x, y, pressed = ts.read() if is_in_button(x, y, back_rect_disp): app.set_exit_flag(True) if name == 'main': screen = display.Display() try: main(screen) except Exception: import traceback e = traceback.format_exc() print(e) img = image.Image(screen.width(), screen.height()) img.draw_string(2, 2, e, image.COLOR_WHITE, font="hershey_complex_small", scale=0.6) screen.show(img) while not app.need_exit(): time.sleep(0.2)

ocr = nn.PP_OCR(model) # 创建PP_OCR模型实例 # 初始化摄像头（使用模型要求的输入尺寸和格式） cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) # 初始化触摸屏 ts = ...

from maix import camera, display, image, nn, app import time, os # 初始化存储目录 # SAVE_DIR = "/SD/Pictures/" SAVE_DIR = "/root/models/mymodel/" os.makedirs(SAVE_DIR, exist_ok=True) detector = nn.YOLOv5(model="/root/models/mymodel/model_127448.mud", dual_buff=True) cam = camera.Camera(detector.input_width(), detector.input_height(), detector.input_format()) disp = display.Display() last_save_time = 0 save_count = 0 # 新增保存计数器 while not app.need_exit(): try: img = cam.read() objs = detector.detect(img, conf_th=0.5, iou_th=0.45) # 调试输出 print(f"检测到 {len(objs)} 个物体 | 冷却时间剩余: {max(3 - (time.time()-last_save_time), 0):.1f}s") if len(objs) > 0 and (time.time() - last_save_time) >= 3: filename = f"{SAVE_DIR}detect_{save_count}_{int(time.time())}.jpg" try: img.save(filename, quality=85) print(f"保存成功: {filename}") last_save_time = time.time() save_count += 1 except Exception as e: print(f"保存失败: {str(e)}") # 绘制检测框 for obj in objs: img.draw_rect(obj.x, obj.y, obj.w, obj.h, color=image.COLOR_RED) msg = f'{detector.labels[obj.class_id]}: {obj.score:.2f}' img.draw_string(obj.x, obj.y+2, msg, scale=0.5, color=image.COLOR_RED) disp.show(img) except Exception as e: print(f"主循环异常: {str(e)}") break 在保存好照片后用以下代码载入刚拍的照片提取文字 from maix import camera, display, image, nn, app model = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model) cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) disp = display.Display() image.load_font("ppocr", "/maixapp/share/font/ppocr_keys_v1.ttf", size = 20) image.set_default_font("ppocr") while not app.need_exit(): img = cam.read() objs = ocr.detect(img) for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) disp.show(img)

好的，我现在需要帮助用户理解他们的Python代码，特别是关于如何在Maix设备上使用摄像头进行物体检测并保存照片，然后使用OCR提取文字。首先，我需要仔细阅读用户提供的两段代码，并分析它们的功能和结构。首先看...

帮我把下面的代码排好序 from maix import camera, display, image, nn, app import time, os 初始化存储目录 # SAVE_DIR = "/SD/Pictures/" SAVE_DIR = "/root/models/mymodel/" os.makedirs(SAVE_DIR, exist_ok=True) detector = nn.YOLOv5(model="/root/models/mymodel/model_127448.mud", dual_buff=True) cam = camera.Camera(detector.input_width(), detector.input_height(), detector.input_format()) disp = display.Display() last_save_time = 0 save_count = 0 # 新增保存计数器 while not app.need_exit(): try: img = cam.read() objs = detector.detect(img, conf_th=0.5, iou_th=0.45) # 调试输出 print(f"检测到 {len(objs)} 个物体 | 冷却时间剩余: {max(3 - (time.time()-last_save_time), 0):.1f}s") if len(objs) > 0 and (time.time() - last_save_time) >= 3: filename = f"{SAVE_DIR}detect_{save_count}_{int(time.time())}.jpg" try: img.save(filename, quality=85) print(f"保存成功: {filename}") last_save_time = time.time() save_count += 1 except Exception as e: print(f"保存失败: {str(e)}") # 绘制检测框 for obj in objs: img.draw_rect(obj.x, obj.y, obj.w, obj.h, color=image.COLOR_RED) msg = f'{detector.labels[obj.class_id]}: {obj.score:.2f}' img.draw_string(obj.x, obj.y+2, msg, scale=0.5, color=image.COLOR_RED) disp.show(img) except Exception as e: print(f"主循环异常: {str(e)}") break 在保存好照片后用以下代码载入刚拍的照片提取文字 from maix import camera, display, image, nn, app model = "/root/models/pp_ocr.mud" ocr = nn.PP_OCR(model) cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) disp = display.Display() image.load_font("ppocr", "/maixapp/share/font/ppocr_keys_v1.ttf", size = 20) image.set_default_font("ppocr") while not app.need_exit(): img = cam.read() objs = ocr.detect(img) for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) disp.show(img)

嗯，用户让我帮忙排序代码，并且之后还要用OCR提取文字。首先我要仔细看看用户提供的代码结构，可能存在哪些问题。用户可能不太熟悉Python的语法，或者代码缩进有问题，导致运行出错。首先，检查第一段代码。注意...

利用以上改善代码的思路帮我改善下面的代码 from maix import camera, display, image, nn, app import time, os # 初始化模型 detector = nn.YOLOv5(model="/root/models/mymodel/model_127448.mud", dual_buff=True) ocr = nn.PP_OCR("/root/models/pp_ocr.mud") # OCR模型初始化 SAVE_DIR = "/root/models/mymodel/" os.makedirs(SAVE_DIR, exist_ok=True) # 硬件初始化（关键修改点1） cam = camera.Camera( detector.input_width(), detector.input_height(), format=image.FORMAT_BGR888 # 强制指定摄像头输出格式 ) disp = display.Display() # 状态变量 last_save_time = 0 save_count = 0 # 调试信息打印（关键修改点2） print(f"[系统诊断] 摄像头格式: {cam.format}") print(f"[系统诊断] 检测器输入格式: {detector.input_format}") print(f"[系统诊断] OCR输入格式: {ocr.input_format}") def ocr_processing(img_path): """ 增强版OCR处理函数 """ try: # 加载并转换图像格式（关键修改点3） img = image.load(img_path) if img.format != ocr.input_format: print(f"[格式转换] 原始格式: {img.format} -> 目标格式: {ocr.input_format}") img = img.convert(format=ocr.input_format) # OCR识别处理 objs = ocr.detect(img) text = ''.join([obj.char_str() for obj in objs]) print(f"[识别结果] {text}") # 可视化增强处理 for obj in objs: points = obj.box.to_list() img.draw_keypoints(points, image.COLOR_RED, 4, -1, 1) img.draw_string(obj.box.x4, obj.box.y4, obj.char_str(), image.COLOR_RED) disp.show(img) return text except Exception as e: print(f"[OCR异常] {str(e)}") return "" while not app.need_exit(): try: img = cam.read() objs = detector.detect(img, conf_th=0.5, iou_th=0.45) # 物体检测处理（关键修改点4） if len(objs) > 0 and (time.time() - last_save_time) >= 3: filename = f"{SAVE_DIR}detect_{save_count}_{int(time.time())}.jpg" # 创建保存用图像副本 save_img = img.copy().convert(format=image.FORMAT_BGR888) # 确保保存格式一致 if save_img.save(filename, quality=85): print(f"[图像保存] {filename}") last_save_time = time.time() save_count += 1 ocr_result = ocr_processing(filename) print(f"[识别日志] {ocr_result}") # 显示处理增强 for obj in objs: img.draw_rect(obj.x, obj.y, obj.w, obj.h, color=image.COLOR_RED) msg = f'{detector.labels[obj.class_id]}: {obj.score:.2f}' img.draw_string(obj.x, obj.y+2, msg, scale=0.5, color=image.COLOR_RED) disp.show(img) except Exception as e: print(f"[运行异常] {str(e)}") break

他们的代码是关于使用Maix库进行物体检测和OCR识别的，可能是在嵌入式设备上运行的，比如K210之类的开发板。用户提到的关键修改点有四个：硬件初始化、调试信息打印、OCR处理中的图像格式转换，以及物体检测处理。...

上面的完整代码运行后有以下反馈 rec_model: /root/models/ch_PP_OCRv4_rec_int8.cvimodel -- [I] load cvimodel from: /root/models/ch_PP_OCRv4_rec_int8.cvimodel -- [I] rec_model info: rec_mean:127.500000 127.500000 127.500000 rec_scale:0.007843 0.007843 0.007843 labels num: 6623 [系统崩溃] 硬件初始化失败: module 'maix._maix.image' has no attribute 'FORMAT_BGR888'

根据你提供的错误信息module 'maix._maix.image' has no attribute 'FORMAT_BGR888'，这个问题的解决需要分步排查。以下是详细分析及解决方案： --- ### **1. 错误原因分析** - **核心问题**：代码尝试调用 ...

修改下面代码# 处理01-07的情况的部分，使保存完图片先发送前进命令 (0x02)后进入三秒 UPLOADING = 4 # 上传处理中状态的状态，以保证不会同一张照片多次保存 import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime # 日志配置 logging.basicConfig( level=logging.INFO, format='%(asctime)s [%(levelname)s] %(message)s', handlers=[ logging.FileHandler("/root/operation.log"), logging.StreamHandler() ] ) logger = logging.getLogger("MAIX_PRO") # 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2 # 特殊处理模式（标签08） WAIT_FOR_LABEL1 = 3 # 等待标签1状态 UPLOADING = 4 # 上传处理中状态 PAUSED = 5 # 暂停状态，等待UART信号 # OCR模型加载 try: ocr = nn.PP_OCR(model="/root/models/pp_ocr.mud") logger.info("OCR model loaded") except Exception as e: logger.critical(f"OCR model load failed: {str(e)}") exit(1) # 保存目录 SAVE_DIR = "/boot/Pictures/" os.makedirs(SAVE_DIR, exist_ok=True) # 更新ROI区域定义 (x, y, w, h) - 使用新参数 (138, 139, 44, 85) ROI_X = 138 ROI_Y = 139 ROI_W = 44 ROI_H = 85 # 硬件初始化（使用OCR模型要求的分辨率） try: cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}") except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}") exit(1) disp = display.Display() # UART初始化 device = "/dev/ttyS0" serial0 = uart.UART(device, 115200) logger.info("UART initialized") # 使用固定token替换登录流程 token = "eyJhbGciOiJIUzI1NiJ9.eyJpZCI6MTkwNTgwNDA0MTExNjU2OTYwMSwidXNlclJvbGUiOiJhZG1pbiIsImV4cCI6ODY0MTc1MjM3MDQzNiwidXNlcm5hbWUiOm51bGx9.3TxID4LJExTSDFxo4jr8LuIgFYgO2cSp7Z3sqPATVc0" logger.info(f"Using fixed token: {token[:10]}...") # 只打印前10位避免日志过长 class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward命令 (0x02) self.send_uart("right") # 初始化 photo_url 及 data_url self.photo_url = "http://111.230.114.23/api/file/upload" self.data_url = "http://111.230.114.23/api/data/add" # 使用固定token self.token = token # 启动UART接收线程 self.uart_receive_thread = threading.Thread(target=self.uart_receive_loop, daemon=True) self.uart_receive_thread.start() logger.info("UART receive thread started") def uart_receive_loop(self): """UART接收线程，处理接收到的数据""" while True: try: # 读取UART数据 data = serial0.read(1) # 每次读取一个字节 if data is not None and len(data) > 0: # 将字节转换为整数 byte_val = data[0] logger.info(f"UART received byte: {hex(byte_val)}") if byte_val == 0x02: # 收到0x02时重置状态为NORMAL with self.lock: logger.info("Received 0x02, reset state to NORMAL") self.state = SystemState.NORMAL # 发送前进命令 self.send_uart("right") except Exception as e: logger.error(f"UART receive error: {str(e)}") time.sleep_ms(10) # 避免过度占用CPU def send_uart(self, command): """发送带十六进制前缀的UART命令，命令为单字节""" # 如果当前处于上传状态，则不发送任何UART命令 if self.state == SystemState.UPLOADING: logger.warning(f"Blocked UART command during upload: {command}") return try: # 命令映射表 command_map = { "stop": 0x00, # 停止命令 "left": 0x01, # 左转命令 "right": 0x02 # 右转/前进命令 } # 获取命令对应的字节值 if command in command_map: cmd_byte = bytes([command_map[command]]) else: logger.error(f"Unknown command: {command}") return # 创建十六进制前缀字节序列 header = bytes.fromhex('ffff02') # 组合所有部分：header + cmd_byte data_to_send = header + cmd_byte # 发送完整的字节序列 serial0.write(data_to_send) logger.info(f"UART sent: {data_to_send.hex()} (hex)") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info(f"Starting upload for label {label} (UART blocked)") # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0: logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info(f"Upload completed for label {label} (UART unblocked)") return None def save_data(self, data): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info("Starting data save (UART blocked)") params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0: logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info("Data save completed (UART unblocked)") def get_ocr_text(self, obj): """安全获取OCR文本内容""" try: # 尝试获取文本内容 text = obj.char_str # 如果char_str是方法则调用它 if callable(text): text = text() # 确保是字符串类型 return str(text).strip() except Exception as e: logger.error(f"获取OCR文本失败: {str(e)}") return "" def handle_detection(self, objs, img): with self.lock: current_time = time.time() # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: # 使用安全方法获取文本 text = self.get_ocr_text(obj) logger.info(f"OCR detected text: {text}") # 处理01-07的情况 if text in ["01", "02", "03", "04", "05", "06", "07"]: num = int(text) # 转换为整数 logger.info(f"Label {num} detected via OCR") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): data = self.save_and_upload(img, num) if data: self.save_data(data) self.add_timer(1.0, delayed_save) # 2秒后发送前进命令 def delayed_forward(): self.send_uart("right") # 发送前进命令 (0x02) self.state = SystemState.NORMAL self.add_timer(2.0, delayed_forward) break # 处理一个有效结果后退出循环 # 处理08的情况 elif text == "08": logger.info("Special label 08 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): data = self.save_and_upload(img, 8) if data: self.save_data(data) self.send_uart("left") # 发送左转命令 (0x01) # 进入等待标签1状态 self.state = SystemState.WAIT_FOR_LABEL1 self.add_timer(1.0, delayed_save) break # 处理一个有效结果后退出循环 elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: text = self.get_ocr_text(obj) if text == "01": logger.info("Label1 after special handling") self.send_uart("stop") # 发送停止命令 (0x00) break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") # 主控制实例 controller = OperationController() # 创建颜色对象 red_color = image.Color(255, 0, 0) # 红色 - 用于检测框 green_color = image.Color(0, 255, 0) # 绿色 - 用于ROI框 blue_color = image.Color(0, 0, 255) # 蓝色 - 用于文本 yellow_color = image.Color(255, 255, 0) # 黄色 - 用于警告信息 # 主循环 try: # 帧率计算变量 frame_count = 0 last_log_time = time.time() while not app.need_exit(): try: # 读取图像 img = cam.read() frame_count += 1 except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 绘制ROI区域边框 - 使用新的矩形参数 (138, 139, 44, 85) img.draw_rect(ROI_X, ROI_Y, ROI_W, ROI_H, green_color, thickness=2) # 添加ROI区域标签 img.draw_string(ROI_X, ROI_Y - 20, f"ROI: {ROI_X},{ROI_Y},{ROI_W},{ROI_H}", scale=0.7, color=blue_color) # 裁剪ROI区域 try: # 使用crop方法裁剪ROI区域 roi_img = img.crop(ROI_X, ROI_Y, ROI_W, ROI_H) except Exception as e: logger.error(f"ROI裁剪失败: {str(e)}") disp.show(img) continue # 执行OCR识别（仅在ROI区域） try: objs = ocr.detect(roi_img) except Exception as e: logger.error(f"OCR识别失败: {str(e)}") disp.show(img) continue # 调整检测框坐标（从ROI坐标转换到原始图像坐标） adjusted_objs = [] for obj in objs: # 直接修改原始对象坐标 obj.box.x1 += ROI_X obj.box.y1 += ROI_Y obj.box.x2 += ROI_X obj.box.y2 += ROI_Y obj.box.x3 += ROI_X obj.box.y3 += ROI_Y obj.box.x4 += ROI_X obj.box.y4 += ROI_Y adjusted_objs.append(obj) # 处理结果 if len(adjusted_objs) > 0: controller.handle_detection(adjusted_objs, img) # 显示OCR结果 for obj in adjusted_objs: # 绘制检测框（四个点） points = obj.box.to_list() img.draw_keypoints( points, red_color, # 颜色 4, # 点大小 -1, # 连接所有点 1 # 线宽 ) # 安全获取文本内容 try: text = controller.get_ocr_text(obj) # 绘制识别文本 img.draw_string( obj.box.x4, obj.box.y4, text, scale=0.5, color=red_color ) except Exception as e: logger.error(f"绘制OCR文本失败: {str(e)}") img.draw_string( obj.box.x4, obj.box.y4, "ERROR", scale=0.5, color=yellow_color ) # 显示状态信息 state_text = f"State: {controller.state}" img.draw_string(5, 5, state_text, scale=0.8, color=blue_color) # 显示检测结果数量 count_text = f"Detected: {len(adjusted_objs)}" img.draw_string(5, 25, count_text, scale=0.8, color=blue_color) # 显示当前时间 time_text = datetime.now().strftime("%H:%M:%S") img.draw_string(img.width() - 100, 5, time_text, scale=0.8, color=blue_color) # 显示帧率 if time.time() - last_log_time > 1.0: fps = frame_count img.draw_string(5, 45, f"FPS: {fps}", scale=0.8, color=blue_color) frame_count = 0 last_log_time = time.time() # 显示图像 disp.show(img) except KeyboardInterrupt: logger.info("用户中断") except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info("系统关闭")

我们需要修改处理01-07标签的代码部分，要求是：保存完图片后先发送前进命令（0x02），然后进入三秒的上传处理中状态（UPLOADING）以保证不会同一张照片多次保存。具体修改点： 1. 在保存并上传图片后（即delayed...

修改下面的# 处理01-07的情况的代码，使ocr识别到同一个01~07的数字10秒内只做一次保存图片处理。输出完整代码 import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime 日志配置 logging.basicConfig( level=logging.INFO, format=‘%(asctime)s [%(levelname)s] %(message)s’, handlers=[ logging.FileHandler(“/root/operation.log”), logging.StreamHandler() ] ) logger = logging.getLogger(“MAIX_PRO”) 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2 # 特殊处理模式（标签08） WAIT_FOR_LABEL1 = 3 # 等待标签1状态 UPLOADING = 4 # 上传处理中状态 PAUSED = 5 # 暂停状态，等待UART信号 OCR模型加载 try: ocr = nn.PP_OCR(model=“/root/models/pp_ocr.mud”) logger.info(“OCR model loaded”) except Exception as e: logger.critical(f"OCR model load failed: {str(e)}") exit(1) 保存目录 SAVE_DIR = “/boot/Pictures/” os.makedirs(SAVE_DIR, exist_ok=True) 更新ROI区域定义 (x, y, w, h) - 使用新参数 (138, 139, 44, 85) ROI_X = 138 ROI_Y = 139 ROI_W = 44 ROI_H = 85 硬件初始化（使用OCR模型要求的分辨率） try: cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}“) except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}”) exit(1) disp = display.Display() UART初始化 device = “/dev/ttyS0” serial0 = uart.UART(device, 115200) logger.info(“UART initialized”) 登录获取token login_url = “http://111.230.114.23/api/user/login” headers_login = {‘Content-Type’: ‘application/json’} login_data = {“userAccount”: “lanyating”, “userPassword”: 12345678} json_data = json.dumps(login_data) try: login_response = requests.post(login_url, data=json_data, headers=headers_login) response_json = login_response.json() token = response_json.get(‘data’) if token: logger.info(f"Login successful, token obtained: {token[:10]}…“) else: logger.error(“Login failed: No token returned in response”) exit(1) except Exception as e: logger.critical(f"Login failed: {str(e)}”) exit(1) class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward命令 (0x02) self.send_uart(“right”) # 初始化 photo_url 极 data_url self.photo_url = “http://111.230.114.23/api/file/upload” self.data_url = “http://111.230极114.23/api/data/add” # 确保 token 在整个类中可用 self.token = token # 启动UART接收线程 self.uart_receive_thread = threading.Thread(target=self.uart_receive_loop, daemon=True) self.uart_receive_thread.start() logger.info(“UART receive thread started”) def uart_receive_loop(self): """UART接收线程，处理接收到的数据""" while True: try: # 读取UART数据 data = serial0.read(1) # 每次读取一个字节 if data is not None and len(data) > 0: # 将字节转换为整数 byte_val = data[0] logger.info(f"UART received byte: {hex(byte_val)}") if byte_val == 0x02: # 收到0x02时重置状态为NORMAL with self.lock: logger.info("Received 0x02, reset state to NORMAL") self.state = SystemState.NORMAL # 发送前进命令 self.send_uart("right") except Exception as e: logger.error(f"UART receive error: {str(e)}") time.sleep_ms(10) # 避免过度占用CPU def send_uart(self, command): """发送带十六进制前缀的UART命令，命令为单字节""" # 如果当前处于上传状态，则不发送任何UART命令 if self.state == SystemState.UPLOADING: logger.warning(f"Blocked UART command during upload: {command}") return try: # 命令映射表 command_map = { "stop": 0x00, # 停止命令 "left": 0x01, # 左转命令 "right": 0x02 # 右转/前进命令 } # 获取命令对应的字节值 if command in command_map: cmd_byte = bytes([command_map[command]]) else: logger.error(f"Unknown command: {command}") return # 创建十六进制前缀字节序列 header = bytes.fromhex('ffff02') # 组合所有部分：header + cmd_byte data_to_send = header + cmd_byte # 发送完整的字节序列 serial0.write(data_to_send) logger.info(f"UART sent: {data_to_send.hex()} (hex)") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info(f"Starting upload for label {label} (UART blocked)") # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0: logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info(f"Upload completed for label {label} (UART unblocked)") return None def save_data(self, data): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info("Starting data save (UART blocked)") params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0: logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info("Data save completed (UART unblocked)") def get_ocr_text(self, obj): """安全获取OCR文本内容""" try: # 尝试获取文本内容 text = obj.char_str # 如果char_str是方法则调用它 if callable(text): text = text() # 确保是字符串类型 return str(text).strip() except Exception as e: logger.error(f"获取OCR文本失败: {str(e)}") return "" def handle_detection(self, objs, img): with self.lock: current_time = time.time() # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: # 使用安全方法获取文本 text = self.get_ocr_text(obj) logger.info(f"OCR detected text: {text}") # 处理01-07的情况 if text in ["01", "02", "03", "04", "05", "06", "07"]: num = int(text) # 转换为整数 logger.info(f"Label {num} detected via OCR") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): data = self.save_and_upload(img, num) if data: self.save_data(data) self.add_timer(1.0, delayed_save) # 2秒后发送前进命令 def delayed_forward(): self.send_uart("right") # 发送前进命令 (0x02) self.state = SystemState.NORMAL self.add_timer(2.0, delayed_forward) break # 处理一个有效结果后退出循环 # 处理08的情况 elif text == "08": logger.info("Special label 08 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): data = self.save_and_upload(img, 8) if data: self.save_data(data) self.send_uart("left") # 发送左转命令 (0x01) # 进入等待标签1状态 self.state = SystemState.WAIT_FOR_LABEL1 self.add_timer(1.0, delayed_save) break # 处理一个有效结果后退出循环 elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: text = self.get_ocr_text(obj) if text == "01": logger.info("Label1 after special handling") self.send_uart("stop") # 发送停止命令 (0x00) break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") 主控制实例 controller = OperationController() 创建颜色对象 red_color = image.Color(255, 0, 0) # 红色 - 用于检测框 green_color = image.Color(0, 255, 0) # 绿色 - 用于ROI框 blue_color = image.Color(0, 0, 255) # 蓝色 - 用于文本 yellow_color = image.Color(255, 255, 0) # 黄色 - 用于警告信息主循环 try: # 帧率计算变量 frame_count = 0 last_log_time = time.time() while not app.need_exit(): try: # 读取图像 img = cam.read() frame_count += 1 except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 绘制ROI区域边框 - 使用新的矩形参数 (138, 139, 44, 85) img.draw_rect(ROI_X, ROI_Y, ROI_W, ROI_H, green_color, thickness=2) # 添加ROI区域标签 img.draw_string(ROI_X, ROI_Y - 20, f"ROI: {ROI_X},{ROI_Y},{ROI_W},{ROI_H}", scale=0.7, color=blue_color) # 裁剪ROI区域 try: # 使用crop方法裁剪ROI区域 roi_img = img.crop(ROI_X, ROI_Y, ROI_W, ROI_H) except Exception as e: logger.error(f"ROI裁剪失败: {str(e)}") disp.show(img) continue # 执行OCR识别（仅在ROI区域） try: objs = ocr.detect(roi_img) except Exception as e: logger.error(f"OCR识别失败: {str(e)}") disp.show(img) continue # 调整检测框坐标（从ROI坐标转换到原始图像坐标） adjusted_objs = [] for obj in objs: # 直接修改原始对象坐标 obj.box.x1 += ROI_X obj.box.y1 += ROI_Y obj.box.x2 += ROI_X obj.box.y2 += ROI_Y obj.box.x3 += ROI_X obj.box.y3 += ROI_Y obj.box.x4 += ROI_X obj.box.y4 += ROI_Y adjusted_objs.append(obj) # 处理结果 if len(adjusted_objs) > 0: controller.handle_detection(adjusted_objs, img) # 显示OCR结果 for obj in adjusted_objs: # 绘制检测框（四个点） points = obj.box.to_list() img.draw_keypoints( points, red_color, # 颜色 4, # 点大小 -1, # 连接所有点 1 # 线宽 ) # 安全获取文本内容 try: text = controller.get_ocr_text(obj) # 绘制识别文本 img.draw_string( obj.box.x4, obj.box.y4, text, scale=0.5, color=red_color ) except Exception as e: logger.error(f"绘制OCR文本失败: {str(e)}") img.draw_string( obj.box.x4, obj.box.y4, "ERROR", scale=0.5, color=yellow_color ) # 显示状态信息 state_text = f"State: {controller.state}" img.draw_string(5, 5, state_text, scale=0.8, color=blue_color) # 显示检测结果数量 count_text = f"Detected: {len(adjusted_objs)}" img.draw_string(5, 25, count_text, scale=0.8, color=blue_color) # 显示当前时间 time_text = datetime.now().strftime("%H:%M:%S") img.draw_string(img.width() - 100, 5, time_text, scale=0.8, color=blue_color) # 显示帧率 if time.time() - last_log_time > 1.0: fps = frame_count img.draw_string(5, 45, f"FPS: {fps}", scale=0.8, color=blue_color) frame_count = 0 last_log_time = time.time() # 显示图像 disp.show(img) except KeyboardInterrupt: logger.info(“用户中断”) except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info(“系统关闭”)

我们要求：同一个01~07的数字在10秒内只做一次保存图片处理。思路：在OperationController类中增加一个字典（例如last_saved_time）来记录每个标签（01-07）最后一次保存的时间。在检测到01-07的标签时，检查...

修改代码，使# 处理01-07的情况部分的代码# 保存并上传图片立即# 进入3秒冷却状态，防止重复上传和同时发送前进命令。输出完整代码 import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime # 日志配置 logging.basicConfig( level=logging.INFO, format='%(asctime)s [%(levelname)s] %(message)s', handlers=[ logging.FileHandler("/root/operation.log"), logging.StreamHandler() ] ) logger = logging.getLogger("MAIX_PRO") # 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2 # 特殊处理模式（标签08） WAIT_FOR_LABEL1 = 3 # 等待标签1状态 UPLOADING = 4 # 上传处理中状态 PAUSED = 5 # 暂停状态，等待UART信号 COOLDOWN = 6 # 新增：冷却状态，防止重复上传 # OCR模型加载 try: ocr = nn.PP_OCR(model="/root/models/pp_ocr.mud") logger.info("OCR model loaded") except Exception as e: logger.critical(f"OCR model load failed: {str(e)}") exit(1) # 保存目录 SAVE_DIR = "/boot/Pictures/" os.makedirs(SAVE_DIR, exist_ok=True) # 更新ROI区域定义 (x, y, w, h) - 使用新参数 (138, 139, 44, 85) ROI_X = 138 ROI_Y = 139 ROI_W = 44 ROI_H = 85 # 硬件初始化（使用OCR模型要求的分辨率） try: cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}") except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}") exit(1) disp = display.Display() # UART初始化 device = "/dev/ttyS0" serial0 = uart.UART(device, 115200) logger.info("UART initialized") # 使用固定token替换登录流程 token = "eyJhbGciOiJIUzI1NiJ9.eyJpZCI6MTkwNTgwNDA0MTExNjU2OTYwMSwidXNlclJvbGUiOiJhZG1pbiIsImV4cCI6ODY0MTc1MjM3MDQzNiwidXNlcm5hbWUiOm51bGx9.3TxID4LJExTSDFxo4jr8LuIgFYgO2cSp7Z3sqPATVc0" logger.info(f"Using fixed token: {token[:10]}...") # 只打印前10位避免日志过长 class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward命令 (0x02) self.send_uart("right") # 初始化 photo_url 及 data_url self.photo_url = "http://111.230.114.23/api/file/upload" self.data_url = "http://111.230.114.23/api/data/add" # 使用固定token self.token = token # 启动UART接收线程 self.uart_receive_thread = threading.Thread(target=self.uart_receive_loop, daemon=True) self.uart_receive_thread.start() logger.info("UART receive thread started") def uart_receive_loop(self): """UART接收线程，处理接收到的数据""" while True: try: # 读取UART数据 data = serial0.read(1) # 每次读取一个字节 if data is not None and len(data) > 0: # 将字节转换为整数 byte_val = data[0] logger.info(f"UART received byte: {hex(byte_val)}") if byte_val == 0x02: # 收到0x02时重置状态为NORMAL with self.lock: logger.info("Received 0x02, reset state to NORMAL") self.state = SystemState.NORMAL # 发送前进命令 self.send_uart("right") except Exception as e: logger.error(f"UART receive error: {str(e)}") time.sleep_ms(10) # 避免过度占用CPU def send_uart(self, command): """发送带十六进制前缀的UART命令，命令为单字节""" # 如果当前处于上传状态，则不发送任何UART命令 if self.state == SystemState.UPLOADING: logger.warning(f"Blocked UART command during upload: {command}") return try: # 命令映射表 command_map = { "stop": 0x00, # 停止命令 "left": 0x01, # 左转命令 "right": 0x02 # 右转/前进命令 } # 获取命令对应的字节值 if command in command_map: cmd_byte = bytes([command_map[command]]) else: logger.error(f"Unknown command: {command}") return # 创建十六进制前缀字节序列 header = bytes.fromhex('ffff02') # 组合所有部分：header + cmd_byte data_to_send = header + cmd_byte # 发送完整的字节序列 serial0.write(data_to_send) logger.info(f"UART sent: {data_to_send.hex()} (hex)") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info(f"Starting upload for label {label} (UART blocked)") # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0: logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info(f"Upload completed for label {label} (UART unblocked)") return None def save_data(self, data): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info("Starting data save (UART blocked)") params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0: logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info("Data save completed (UART unblocked)") def get_ocr_text(self, obj): """安全获取OCR文本内容""" try: # 尝试获取文本内容 text = obj.char_str # 如果char_str是方法则调用它 if callable(text): text = text() # 确保是字符串类型 return str(text).strip() except Exception as e: logger.error(f"获取OCR文本失败: {str(e)}") return "" def handle_detection(self, objs, img): with self.lock: current_time = time.time() # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: # 使用安全方法获取文本 text = self.get_ocr_text(obj) logger.info(f"OCR detected text: {text}") # 处理01-07的情况 if text in ["01", "02", "03", "04", "05", "06", "07"]: num = int(text) # 转换为整数 logger.info(f"Label {num} detected via OCR") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): # 保存并上传图片 data = self.save_and_upload(img, num) if data: self.save_data(data) # 上传完成后立即发送前进命令 self.send_uart("right") # 进入3秒冷却状态，防止重复上传 self.state = SystemState.COOLDOWN logger.info(f"Entering 3-second cooldown state for label {num}") # 3秒后重置状态为NORMAL def reset_state(): self.state = SystemState.NORMAL logger.info(f"Cooldown finished, state reset to NORMAL for label {num}") self.add_timer(3.0, reset_state) self.add_timer(1.0, delayed_save) break # 处理一个有效结果后退出循环 # 处理08的情况 elif text == "08": logger.info("Special label 08 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): data = self.save_and_upload(img, 8) if data: self.save_data(data) self.send_uart("left") # 发送左转命令 (0x01) # 进入等待标签1状态 self.state = SystemState.WAIT_FOR_LABEL1 self.add_timer(1.0, delayed_save) break # 处理一个有效结果后退出循环 elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: text = self.get_ocr_text(obj) if text == "01": logger.info("Label1 after special handling") self.send_uart("stop") # 发送停止命令 (0x00) break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") # 主控制实例 controller = OperationController() # 创建颜色对象 red_color = image.Color(255, 0, 0) # 红色 - 用于检测框 green_color = image.Color(0, 255, 0) # 绿色 - 用于ROI框 blue_color = image.Color(0, 0, 255) # 蓝色 - 用于文本 yellow_color = image.Color(255, 255, 0) # 黄色 - 用于警告信息 # 主循环 try: # 帧率计算变量 frame_count = 0 last_log_time = time.time() while not app.need_exit(): try: # 读取图像 img = cam.read() frame_count += 1 except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 绘制ROI区域边框 - 使用新的矩形参数 (138, 139, 44, 85) img.draw_rect(ROI_X, ROI_Y, ROI_W, ROI_H, green_color, thickness=2) # 添加ROI区域标签 img.draw_string(ROI_X, ROI_Y - 20, f"ROI: {ROI_X},{ROI_Y},{ROI_W},{ROI_H}", scale=0.7, color=blue_color) # 裁剪ROI区域 try: # 使用crop方法裁剪ROI区域 roi_img = img.crop(ROI_X, ROI_Y, ROI_W, ROI_H) except Exception as e: logger.error(f"ROI裁剪失败: {str(e)}") disp.show(img) continue # 执行OCR识别（仅在ROI区域） try: objs = ocr.detect(roi_img) except Exception as e: logger.error(f"OCR识别失败: {str(e)}") disp.show(img) continue # 调整检测框坐标（从ROI坐标转换到原始图像坐标） adjusted_objs = [] for obj in objs: # 直接修改原始对象坐标 obj.box.x1 += ROI_X obj.box.y1 += ROI_Y obj.box.x2 += ROI_X obj.box.y2 += ROI_Y obj.box.x3 += ROI_X obj.box.y3 += ROI_Y obj.box.x4 += ROI_X obj.box.y4 += ROI_Y adjusted_objs.append(obj) # 处理结果 if len(adjusted_objs) > 0: controller.handle_detection(adjusted_objs, img) # 显示OCR结果 for obj in adjusted_objs: # 绘制检测框（四个点） points = obj.box.to_list() img.draw_keypoints( points, red_color, # 颜色 4, # 点大小 -1, # 连接所有点 1 # 线宽 ) # 安全获取文本内容 try: text = controller.get_ocr_text(obj) # 绘制识别文本 img.draw_string( obj.box.x4, obj.box.y4, text, scale=0.5, color=red_color ) except Exception as e: logger.error(f"绘制OCR文本失败: {str(e)}") img.draw_string( obj.box.x4, obj.box.y4, "ERROR", scale=0.5, color=yellow_color ) # 显示状态信息 state_text = f"State: {controller.state}" img.draw_string(5, 5, state_text, scale=0.8, color=blue_color) # 显示检测结果数量 count_text = f"Detected: {len(adjusted_objs)}" img.draw_string(5, 25, count_text, scale=0.8, color=blue_color) # 显示当前时间 time_text = datetime.now().strftime("%H:%M:%S") img.draw_string(img.width() - 100, 5, time_text, scale=0.8, color=blue_color) # 显示帧率 if time.time() - last_log_time > 1.0: fps = frame_count img.draw_string(5, 45, f"FPS: {fps}", scale=0.8, color=blue_color) frame_count = 0 last_log_time = time.time() # 显示图像 disp.show(img) except KeyboardInterrupt: logger.info("用户中断") except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info("系统关闭")

我们要求修改的是# 处理01-07的情况部分的代码，使其在保存并上传图片后立即进入3秒冷却状态，同时发送前进命令。根据之前的修改，我们在delayed_save函数中已经实现了： - 上传完成后发送前进命令 - 进入3秒...

修改代码使保存照片期间不发送uart信息，输出完整代码 import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime 日志配置 logging.basicConfig( level=logging.INFO, format=‘%(asctime)s [%(levelname)s] %(message)s’, handlers=[ logging.FileHandler(“/root/operation.log”), logging.StreamHandler() ] ) logger = logging.getLogger(“MAIX_PRO”) 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2 # 特殊处理模式（标签19） WAIT_FOR_LABEL1 = 3 # 等待标签1状态 OCR模型加载 try: ocr = nn.PP_OCR(model=“/root/models/pp_ocr.mud”) logger.info(“OCR model loaded”) except Exception as e: logger.critical(f"OCR model load failed: {str(e)}") exit(1) 保存目录 SAVE_DIR = “/root/models/mymodel/” SAVE_DIR = “/boot/Pictures/” os.makedirs(SAVE_DIR, exist_ok=True) 硬件初始化（使用OCR模型要求的分辨率） try: cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}“) except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}”) exit(1) disp = display.Display() UART初始化 device = “/dev/ttyS0” serial0 = uart.UART(device, 115200) logger.info(“UART initialized”) 登录获取token login_url = “http://111.230.114.23/api/user/login” headers_login = {‘Content-Type’: ‘application/json’} login_data = {“userAccount”: “lanyating”, “userPassword”: 12345678} json_data = json.dumps(login_data) try: login_response = requests.post(login_url, data=json_data, headers=headers_login) response_json = login_response.json() token = response_json.get(‘data’) if token: logger.info(f"Login successful, token obtained: {token[:10]}…“) # 只显示部分token以保护隐私 else: logger.error(f"Login failed: No token returned in response”) exit(1) except Exception as e: logger.critical(f"Login failed: {str(e)}") exit(1) class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward命令 (0x02) self.send_uart(“right”) # 初始化 photo_url 和 data_url self.photo_url = “http://111.230.114.23/api/file/upload” self.data_url = “http://111.230.114.23/api/data/add” # 确保 token 在整个类中可用 self.token = token def send_uart(self, command): """发送带十六进制前缀的UART命令，命令为单字节""" try: # 命令映射表 command_map = { "stop": 0x00, # 停止命令 "left": 0x01, # 左转命令 "right": 0x02 # 右转/前进命令 } # 获取命令对应的字节值 if command in command_map: cmd_byte = bytes([command_map[command]]) else: logger.error(f"Unknown command: {command}") return # 创建十六进制前缀字节序列 header = bytes.fromhex('ffff02') # 添加换行符 newline = b'\n' # 组合所有部分：header + cmd_byte + newline data_to_send = header + cmd_byte # 发送完整的字节序列 serial0.write(data_to_send) logger.info(f"UART sent: {data_to_send.hex()} (hex)") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0: logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") return None def save_data(self, data): try: params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0: logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") def handle_detection(self, objs, img): with self.lock: current_time = time.time() # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: text = obj.char_str().strip() # 获取OCR识别结果并去除空格 logger.info(f"OCR detected text: {text}") # 处理01-07的情况 if text in ["01", "02", "03", "04", "05", "06", "07"]: num = int(text) # 转换为整数 logger.info(f"Label {num} detected via OCR") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): print("开始上传") data = self.save_and_upload(img, num) print("上传成功") if data: self.save_data(data) self.add_timer(1.0, delayed_save) # 2秒后发送前进命令 def delayed_forward(): self.send_uart("right") # 发送前进命令 (0x02) self.state = SystemState.NORMAL self.add_timer(2.0, delayed_forward) break # 处理一个有效结果后退出循环 # 处理08的情况 elif text == "08": logger.info("Special label 08 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): print("开始上传08") data = self.save_and_upload(img, 8) # 使用19作为标签 print("上传成功08") if data: self.save_data(data) self.send_uart("left") # 发送左转命令 (0x01) # 进入等待标签1状态 self.state = SystemState.WAIT_FOR_LABEL1 self.add_timer(1.0, delayed_save) break # 处理一个有效结果后退出循环 elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: text = obj.char_str().strip() if text == "01": logger.info("Label1 after special handling") self.send_uart("stop") # 发送停止命令 (0x00) self.add_timer(1.0, lambda: self.send_uart("right")) # 发送前进命令 (0x02) self.state = SystemState.NORMAL break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") 主控制实例 controller = OperationController() 创建 Color 对象 red_color = image.Color(255, 0, 0) # 定义标准红色主循环 try: while not app.need_exit(): try: img = cam.read() except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 执行OCR识别 try: objs = ocr.detect(img) except Exception as e: logger.error(f"OCR识别失败: {str(e)}") disp.show(img) continue # 处理结果 if len(objs) > 0: controller.handle_detection(objs, img) # 显示OCR结果 for obj in objs: # 绘制检测框（四个点） points = obj.box.to_list() img.draw_keypoints( points, red_color, # 颜色 4, # 点大小 -1, # 连接所有点 1 # 线宽 ) # 绘制识别文本 img.draw_string( obj.box.x4, obj.box.y4, obj.char_str(), scale=0.5, color=red_color ) disp.show(img) except KeyboardInterrupt: logger.info(“用户中断”) except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info(“系统关闭”)

ocr = nn.PP_OCR(model="/root/models/pp_ocr.mud") logger.info("OCR model loaded") except Exception as e: logger.critical(f"OCR model load failed: {str(e)}") exit(1) # 保存目录 SAVE_DIR = "/boot/...

修改下面的代码，把登录获取token的部分换成固定的token：eyJhbGciOiJIUzI1NiJ9.eyJpZCI6MTkwNTgwNDA0MTExNjU2OTYwMSwidXNlclJvbGUiOiJhZG1pbiIsImV4cCI6ODY0MTc1MjM3MDQzNiwidXNlcm5hbWUiOm51bGx9.3TxID4LJExTSDFxo4jr8LuIgFYgO2cSp7Z3sqPATVc0。 import logging from maix import camera, display, image, nn, app, uart, time import requests import json import os import threading from datetime import datetime # 日志配置 logging.basicConfig( level=logging.INFO, format='%(asctime)s [%(levelname)s] %(message)s', handlers=[ logging.FileHandler("/root/operation.log"), logging.StreamHandler() ] ) logger = logging.getLogger("MAIX_PRO") # 状态定义 class SystemState: NORMAL = 0 # 正常检测模式 OBJECT_DETECTED = 1 # 物体检测处理中 SPECIAL_HANDLING = 2 # 特殊处理模式（标签08） WAIT_FOR_LABEL1 = 3 # 等待标签1状态 UPLOADING = 4 # 上传处理中状态 PAUSED = 5 # 暂停状态，等待UART信号 # OCR模型加载 try: ocr = nn.PP_OCR(model="/root/models/pp_ocr.mud") logger.info("OCR model loaded") except Exception as e: logger.critical(f"OCR model load failed: {str(e)}") exit(1) # 保存目录 SAVE_DIR = "/boot/Pictures/" os.makedirs(SAVE_DIR, exist_ok=True) # 更新ROI区域定义 (x, y, w, h) - 使用新参数 (138, 139, 44, 85) ROI_X = 138 ROI_Y = 139 ROI_W = 44 ROI_H = 85 # 硬件初始化（使用OCR模型要求的分辨率） try: cam = camera.Camera(ocr.input_width(), ocr.input_height(), ocr.input_format()) logger.debug(f"Camera resolution: {cam.width()}x{cam.height()}") except RuntimeError as e: logger.critical(f"Camera init failed: {str(e)}") exit(1) disp = display.Display() # UART初始化 device = "/dev/ttyS0" serial0 = uart.UART(device, 115200) logger.info("UART initialized") # 登录获取token login_url = "http://111.230.114.23/api/user/login" headers_login = {'Content-Type': 'application/json'} login_data = {"userAccount": "lanyating", "userPassword": 12345678} json_data = json.dumps(login_data) try: login_response = requests.post(login_url, data=json_data, headers=headers_login) response_json = login_response.json() token = response_json.get('data') if token: logger.info(f"Login successful, token obtained: {token[:10]}...") else: logger.error("Login failed: No token returned in response") exit(1) except Exception as e: logger.critical(f"Login failed: {str(e)}") exit(1) class OperationController: def init(self): self.state = SystemState.NORMAL self.current_label = None self.last_detect_time = 0 self.upload_complete = False self.lock = threading.Lock() self.timers = [] # 初始发送forward命令 (0x02) self.send_uart("right") # 初始化 photo_url 极 data_url self.photo_url = "http://111.230.114.23/api/file/upload" self.data_url = "http://111.230极114.23/api/data/add" # 确保 token 在整个类中可用 self.token = token # 启动UART接收线程 self.uart_receive_thread = threading.Thread(target=self.uart_receive_loop, daemon=True) self.uart_receive_thread.start() logger.info("UART receive thread started") def uart_receive_loop(self): """UART接收线程，处理接收到的数据""" while True: try: # 读取UART数据 data = serial0.read(1) # 每次读取一个字节 if data is not None and len(data) > 0: # 将字节转换为整数 byte_val = data[0] logger.info(f"UART received byte: {hex(byte_val)}") if byte_val == 0x02: # 收到0x02时重置状态为NORMAL with self.lock: logger.info("Received 0x02, reset state to NORMAL") self.state = SystemState.NORMAL # 发送前进命令 self.send_uart("right") except Exception as e: logger.error(f"UART receive error: {str(e)}") time.sleep_ms(10) # 避免过度占用CPU def send_uart(self, command): """发送带十六进制前缀的UART命令，命令为单字节""" # 如果当前处于上传状态，则不发送任何UART命令 if self.state == SystemState.UPLOADING: logger.warning(f"Blocked UART command during upload: {command}") return try: # 命令映射表 command_map = { "stop": 0x00, # 停止命令 "left": 0x01, # 左转命令 "right": 0x02 # 右转/前进命令 } # 获取命令对应的字节值 if command in command_map: cmd_byte = bytes([command_map[command]]) else: logger.error(f"Unknown command: {command}") return # 创建十六进制前缀字节序列 header = bytes.fromhex('ffff02') # 组合所有部分：header + cmd_byte data_to_send = header + cmd_byte # 发送完整的字节序列 serial0.write(data_to_send) logger.info(f"UART sent: {data_to_send.hex()} (hex)") except Exception as e: logger.error(f"UART send failed: {str(e)}") def save_and_upload(self, img, label): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info(f"Starting upload for label {label} (UART blocked)") # 生成文件名 timestamp = datetime.now().strftime("%Y%m%d_%H%M%S") filename = f"{SAVE_DIR}{label}_{timestamp}.jpg" # 保存图片 if img.save(filename, quality=90): logger.info(f"Image saved: {filename}") # 同步上传 with open(filename, 'rb') as file: files = { 'file': ('image.jpg', file, 'image/jpeg') } params = { 'biz': 'plant_picture', } headers = { "token": self.token } logger.info(f"Uploading {filename} with label {label}, Token: {self.token[:10]}...") response = requests.post( self.photo_url, files=files, headers=headers, params=params ) if response.json().get('code') == 0: logger.info(f"Upload success: {filename}, Response: {response.text}") return response.json().get('data') else: logger.warning(f"Upload failed: {response.text}") else: logger.error("Image save failed") except Exception as e: logger.error(f"Capture failed: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info(f"Upload completed for label {label} (UART unblocked)") return None def save_data(self, data): try: # 设置上传状态，阻止UART发送 self.state = SystemState.UPLOADING logger.info("Starting data save (UART blocked)") params = [{ "deviceName": 1, "plantId": 1, "growthStage": "flowering", "healthStage": "healthy", "height": "5", "crownWidth": "5", "humidity": '', "ph": '', "dan": '', "lin": '', "jia": '', "photoUrl": data, "notes": "" }] headers = { "token": self.token } response = requests.post( self.data_url, headers=headers, json=params ) logger.info(f"Response: {data}") if response.json().get('code') == 0: logger.info(f"Data save success: {response.text}") else: logger.warning(f"Data save failed: {response.text}") except Exception as e: logger.error(f"Data upload error: {str(e)}") finally: # 恢复状态，允许UART发送 self.state = SystemState.NORMAL logger.info("Data save completed (UART unblocked)") def get_ocr_text(self, obj): """安全获取OCR文本内容""" try: # 尝试获取文本内容 text = obj.char_str # 如果char_str是方法则调用它 if callable(text): text = text() # 确保是字符串类型 return str(text).strip() except Exception as e: logger.error(f"获取OCR文本失败: {str(e)}") return "" def handle_detection(self, objs, img): with self.lock: current_time = time.time() # 状态机逻辑 if self.state == SystemState.NORMAL: for obj in objs: # 使用安全方法获取文本 text = self.get_ocr_text(obj) logger.info(f"OCR detected text: {text}") # 处理01-07的情况 if text in ["01", "02", "03", "04", "05", "06", "07"]: num = int(text) # 转换为整数 logger.info(f"Label {num} detected via OCR") self.state = SystemState.OBJECT_DETECTED self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): data = self.save_and_upload(img, num) if data: self.save_data(data) self.add_timer(1.0, delayed_save) # 2秒后发送前进命令 def delayed_forward(): self.send_uart("right") # 发送前进命令 (0x02) self.state = SystemState.NORMAL self.add_timer(2.0, delayed_forward) break # 处理一个有效结果后退出循环 # 处理08的情况 elif text == "08": logger.info("Special label 08 detected") self.state = SystemState.SPECIAL_HANDLING self.send_uart("stop") # 发送停止命令 (0x00) # 1秒后保存并上传 def delayed_save(): data = self.save_and_upload(img, 8) if data: self.save_data(data) self.send_uart("left") # 发送左转命令 (0x01) # 进入等待标签1状态 self.state = SystemState.WAIT_FOR_LABEL1 self.add_timer(1.0, delayed_save) break # 处理一个有效结果后退出循环 elif self.state == SystemState.SPECIAL_HANDLING: # 等待上传完成 pass elif self.state == SystemState.WAIT_FOR_LABEL1: for obj in objs: text = self.get_ocr_text(obj) if text == "01": logger.info("Label1 after special handling") self.send_uart("stop") # 发送停止命令 (0x00) break def add_timer(self, delay, callback): timer = threading.Timer(delay, callback) timer.start() self.timers.append(timer) def cleanup(self): for timer in self.timers: timer.cancel() logger.info("System cleanup completed") # 主控制实例 controller = OperationController() # 创建颜色对象 red_color = image.Color(255, 0, 0) # 红色 - 用于检测框 green_color = image.Color(0, 255, 0) # 绿色 - 用于ROI框 blue_color = image.Color(0, 0, 255) # 蓝色 - 用于文本 yellow_color = image.Color(255, 255, 0) # 黄色 - 用于警告信息 # 主循环 try: # 帧率计算变量 frame_count = 0 last_log_time = time.time() while not app.need_exit(): try: # 读取图像 img = cam.read() frame_count += 1 except Exception as e: logger.error(f"摄像头读取失败: {str(e)}") continue # 绘制ROI区域边框 - 使用新的矩形参数 (138, 139, 44, 85) img.draw_rect(ROI_X, ROI_Y, ROI_W, ROI_H, green_color, thickness=2) # 添加ROI区域标签 img.draw_string(ROI_X, ROI_Y - 20, f"ROI: {ROI_X},{ROI_Y},{ROI_W},{ROI_H}", scale=0.7, color=blue_color) # 裁剪ROI区域 try: # 使用crop方法裁剪ROI区域 roi_img = img.crop(ROI_X, ROI_Y, ROI_W, ROI_H) except Exception as e: logger.error(f"ROI裁剪失败: {str(e)}") disp.show(img) continue # 执行OCR识别（仅在ROI区域） try: objs = ocr.detect(roi_img) except Exception as e: logger.error(f"OCR识别失败: {str(e)}") disp.show(img) continue # 调整检测框坐标（从ROI坐标转换到原始图像坐标） adjusted_objs = [] for obj in objs: # 直接修改原始对象坐标 obj.box.x1 += ROI_X obj.box.y1 += ROI_Y obj.box.x2 += ROI_X obj.box.y2 += ROI_Y obj.box.x3 += ROI_X obj.box.y3 += ROI_Y obj.box.x4 += ROI_X obj.box.y4 += ROI_Y adjusted_objs.append(obj) # 处理结果 if len(adjusted_objs) > 0: controller.handle_detection(adjusted_objs, img) # 显示OCR结果 for obj in adjusted_objs: # 绘制检测框（四个点） points = obj.box.to_list() img.draw_keypoints( points, red_color, # 颜色 4, # 点大小 -1, # 连接所有点 1 # 线宽 ) # 安全获取文本内容 try: text = controller.get_ocr_text(obj) # 绘制识别文本 img.draw_string( obj.box.x4, obj.box.y4, text, scale=0.5, color=red_color ) except Exception as e: logger.error(f"绘制OCR文本失败: {str(e)}") img.draw_string( obj.box.x4, obj.box.y4, "ERROR", scale=0.5, color=yellow_color ) # 显示状态信息 state_text = f"State: {controller.state}" img.draw_string(5, 5, state_text, scale=0.8, color=blue_color) # 显示检测结果数量 count_text = f"Detected: {len(adjusted_objs)}" img.draw_string(5, 25, count_text, scale=0.8, color=blue_color) # 显示当前时间 time_text = datetime.now().strftime("%H:%M:%S") img.draw_string(img.width() - 100, 5, time_text, scale=0.8, color=blue_color) # 显示帧率 if time.time() - last_log_time > 1.0: fps = frame_count img.draw_string(5, 45, f"FPS: {fps}", scale=0.8, color=blue_color) frame_count = 0 last_log_time = time.time() # 显示图像 disp.show(img) except KeyboardInterrupt: logger.info("用户中断") except Exception as e: logger.critical(f"致命错误: {str(e)}") finally: controller.cleanup() logger.info("系统关闭")

ocr = nn.PP_OCR(model="/root/models/pp_ocr.mud") logger.info("OCR model loaded") except Exception as e: logger.critical(f"OCR model load failed: {str(e)}") exit(1) # 保存目录 SAVE_DIR = "/boot/...

C#类库封装：简化SDK调用实现多功能集成，构建地磅无人值守系统

内容概要：本文介绍了利用C#类库封装多个硬件设备的SDK接口，实现一系列复杂功能的一键式调用。具体功能包括身份证信息读取、人证识别、车牌识别（支持臻识和海康摄像头）、LED显示屏文字输出、称重数据读取、二维码扫描以及语音播报。所有功能均被封装为简单的API，极大降低了开发者的工作量和技术门槛。文中详细展示了各个功能的具体实现方式及其应用场景，如身份证读取、人证核验、车牌识别等，并最终将这些功能整合到一起，形成了一套完整的地磅称重无人值守系统解决方案。适合人群：具有一定C#编程经验的技术人员，尤其是需要快速集成多种硬件设备SDK的应用开发者。使用场景及目标：适用于需要高效集成多种硬件设备SDK的项目，特别是那些涉及身份验证、车辆管理、物流仓储等领域的企业级应用。通过使用这些封装好的API，可以大大缩短开发周期，降低维护成本，提高系统的稳定性和易用性。其他说明：虽然封装后的API极大地简化了开发流程，但对于一些特殊的业务需求，仍然可能需要深入研究底层SDK。此外，在实际部署过程中，还需考虑网络环境、硬件兼容性等因素的影响。

2025-07-12 09:09:45,944 [CRITICAL] 致命错误: 'maix._maix.nn.OCR_Object' object has no attribute 'copy'

相关推荐

Maix-DualCamera_11.29(Schematic).pdf

[RMYC]基于MAIXBIT开发的装甲板识别[数据集模型文件程序]_-RMYC-MAIXBIT-.zip

Maix-Bit_1.09(Schematic).pdf

2025-07-12 09:23:25,327 [CRITICAL] 致命错误: 'builtin_function_or_method' object has no attribute 'strip'。修改代码后输出完整代码

C#类库封装：简化SDK调用实现多功能集成，构建地磅无人值守系统

大家在看

《极品家丁（七改版）》（珍藏七改加料无雷精校全本）(1).zip

密码：:unlocked::sparkles::locked:创新，方便，安全的加密应用程序

HkAndroidSDK.zip

matlab的欧拉方法代码-BEM_flow_simulation:计算流体力学：使用边界元方法模拟障碍物周围/附近的流动

基于YOLO网络的行驶车辆目标检测matlab仿真+操作视频

最新推荐

K210_Sipeed Maix Dock教程文档pro.pdf

C#类库封装：简化SDK调用实现多功能集成，构建地磅无人值守系统

Teleport Pro教程：轻松复制网站内容

【跨平台开发者的必读】：解决Qt5Widgetsd.lib目标计算机类型冲突终极指南

普通RNN结构和特点

探讨通用数据连接池的核心机制与应用

【LabVIEW网络通讯终极指南】：7个技巧提升UDP性能和安全性

简要介绍cnn卷积神经网络

基于ASP的深度学习网站导航系统功能详解

【Oracle数据泵进阶技巧】：避免ORA-31634和ORA-31664错误的终极策略