md /home/damon/ks_ws/src/racecar_ws/racecar_gazebo/scripts/keyboard_teleop.p

keyboard_teleop.p是一个Python脚本文件，位于/home/damon/ks_ws/src/racecar_ws/racecar_gazebo/scripts/目录中。这个脚本的作用是通过键盘控制racecar模拟器进行移动。在这个脚本中，通过读取键盘输入的方式来控制racecar的方向和速度，从而实现模拟器的遥控操作。这个脚本文件包含了一些用于检测键盘输入和发送指令给racecar模拟器的函数和逻辑。它可以让用户在模拟器中用键盘来控制racecar的运动，对于调试和测试模拟器非常有用。在使用这个脚本的时候，用户只需在该目录下运行相应的Python解释器即可启动模拟器，并通过键盘输入控制racecar的运动。这个脚本文件的编写对于模拟器的使用和测试非常重要，能够提高用户对racecar模拟器的控制和了解。

将下列数据写入文本文档，并保存命名为score.json。保存到/usr/local/spark/mywork目录下 { "sno":1 , "class":"ds01","name":" Tom" , "ML":86,"Maths":"90" } { "sno":2, "class":"ds01","name":"Jerry","ML":59,"maths":62} { "sno":3 ,"class":"is01","name":"Kitty","ML":88,"maths":85} { "sno":4 , "class":"ds02","name":"Harry","ML":92,"maths":83} { "sno":5 , "class":"is01","name":"Roen","ML":90,"maths":0} { "sno":5 , "class":"is01","name":"Roen","ML":90,"maths":0} { "sno":6 , "class":"ds01","name":"Alex","ML":75,"maths":95} scala> import org.apache.spark.sql.SparkSession //导入SparkSession包 scala> val spark=SparkSession.builder().getOrCreate() //定义spark会话 scala> import spark.implicits._ //导入隐式推断包下的所有内容 scala> val df = spark.read.json("file:///usr/local/spark/mywork/score.json") //读取本地文件score.json创建df scala> df.show(10) //显示score表前10行，如果省略行数，显示20行，超出最大行数显示全部 scala> df.distinct().show() //查询所有数据，并去除重复的数据 scala> df.drop("id").show() //丢弃学号后显示，注意df本身并不会变化 scala> df.select(“class”,"name","ML","maths").show() //另一种写法，select columnName from scala> df.filter(df("ML") >=90 ).show() //输出机器学习成绩不小于90的行，注意Roen会显示两次 scala> df.wher("ML">=90 ).show() //另一种写法，注意Roen会显示两次 select * from Tabel where scala> df.groupBy("class").count().show() //每班有多少个学生 scala> df.groupBy("class").agg(mean("ML").as("ML_avg"),Max("maths").as("maths_Max").show() //每班机器学习平均分和数学最高分，agg是聚合在一起的意思，用于多列分别进行统计计算.as()指定显示列标题 scala> df.sort(df("ML").desc).show() //将数据按 ML 降序排列 ,注意此时df("ML")向量（列表）可说明顺序。 scala> df.sort(desc("ML")).show() //另一种写法，desc降序 scala> df.take(3) scala> df.head(3) scala>df.takeAsList(3) //显示前三行，稍有不同，但不是重点，可自行观察 scala> df.select(df("name"),((df("ML")+df("maths"))/2).as("score.avg")).show() //求每个同学的平均成绩 scala> df.selectExpr("name","(ML+maths)/2 as score.avg).show() //另一种写法，求每个同学的平均成绩练习题目： 1、将下列 JSON 格式数据复制到 Linux 系统中，并保存命名为 employee.json。 { "id":1 , "name":" Ella" , "age":36,"sala":5800 } { "id":2, "name":"Bob","age":29,"sala":8500 } { "id":3 , "name":"Jack","age":29,"sala":6500 } { "id":4 , "name":"Jim","age":28,"sala":8800 } { "id":4 , "name":"Jim","age":28,"sala":8800 } { "id":5 , "name":"Damon","age":22,"sala":5900 } { "id":5 , "name":"Jerry" } 为 employee.json 创建 DataFrame，并写出 Scala 语句完成下列操作： (1) 查询所有数据； (2) 查询所有数据，并去除重复的数据； (3) 查询所有数据，打印时去除 id 字段； (4) 筛选出 age>30 的记录； (5) 将数据按 age 分组，并统计每个年龄的人数； (6) 将数据按 name 升序排列； (7) 取出前 3 行数据； (8) 查询所有记录的 name 列，并为其取别名为 username； (9) 查询年龄 age 的平均值； (10) 查询年龄 age 的最小值。

### 使用Scala编写Spark语句对employee.json文件执行操作以下是使用Scala编写的代码示例，完成对`employee.json`文件的多种数据处理操作： ```scala import org.apache.spark.sql.SparkSession import org.apache.spark.sql.functions._ // 创建SparkSession val spark = SparkSession.builder() .appName("EmployeeDataProcessing") .master("local[*]") .getOrCreate() // 读取JSON文件创建DataFrame val df = spark.read.json("file:///usr/local/spark/employee.json") // 1) 查询所有数据 df.show() // 显示所有数据[^1] // 2) 去除重复数据 val distinctDf = df.distinct() distinctDf.show() // 显示去重后的数据[^2] // 3) 打印时去除id字段 df.drop("id").show() // 显示去除id字段的数据[^2] // 4) 筛选age>30的记录 val filteredDf = df.filter(col("age") > 30) filteredDf.show() // 显示筛选后的数据[^2] // 5) 按age分组并统计人数 val groupedByAgeDf = df.groupBy("age").count() groupedByAgeDf.show() // 显示按age分组并统计人数的结果[^3] // 6) 按name升序排列 val sortedByNameDf = df.sort(asc("name")) sortedByNameDf.show() // 显示按name升序排列的结果 // 7) 取前3行 val top3Rows = df.limit(3) top3Rows.show() // 显示前3行数据[^2] // 8) 查询name列并取别名为username val renamedColumnDf = df.select(col("name").as("username")) renamedColumnDf.show() // 显示name列并取别名为username的结果 // 9) 计算age的平均值 val avgAge = df.agg(avg("age")).collect()(0)(0) println(s"Age Average: $avgAge") // 输出age的平均值 // 10) 查询age的最小值 val minAge = df.agg(min("age")).collect()(0)(0) println(s"Minimum Age: $minAge") // 输出age的最小值 // 关闭SparkSession spark.stop() ``` ### 说明 - 上述代码实现了用户提出的所有操作，并且每一步都对应了相关的引用内容。 - 在实际运行时，请确保`employee.json`文件路径正确无误。

请根据部分运行结果解决代码问题：调试：国家 = , 类型 = 调试：bd_text = 导演: 道格·里曼 Doug Liman 主演: 马特·达蒙 Matt Damon / 弗兰卡·波坦... 2002 / 美国德国捷克 / 动作悬疑惊悚调试：国家 = , 类型 = 调试：bd_text = 导演: 约翰·李·汉考克 John Lee Hancock 主演: 桑德拉·布洛克 Sandra Bu... 2009 / 美国 / 剧情家庭传记运动调试：国家 = , 类型 = ✅ 成功抓取第10页数据 ✅ 成功存储0条数据到数据库和Excel文件 Traceback (most recent call last): File "C:\Users\yuankuixingyeliu\PycharmProjects\pythonProject\毕设\250.2.py", line 220, in <module> clean_df = analyzer.get_clean_data() ^^^^^^^^^^^^^^^^^^^^^^^^^ File "C:\Users\yuankuixingyeliu\PycharmProjects\pythonProject\毕设\250.2.py", line 200, in get_clean_data raise ValueError("⚠️ 数据库无有效数据，请先运行爬虫") ValueError: ⚠️ 数据库无有效数据，请先运行爬虫进程已结束,退出代码1

<think>好的，我现在需要帮助用户解决豆瓣电影爬虫中国家和类型字段解析为空，以及数据库存储0条数据的问题。首先，我需要理解用户的问题背景。根据用户的描述，调试信息显示国家和类型字段解析为空，最终数据库没有存储任何数据，并且出现了ValueError异常。用户已经提供了三个引用，其中引用1提到豆瓣电影的数据是动态的，可能需要不断点击才能获取完整信息，但用户现在使用正则表达式解析可能存在问题。引用2和3涉及数据获取和Scrapy爬虫的执行。首先，我需要分析用户提到的parse_html函数中的正则表达式是否正确。用户的问题集中在国家和类型字段的解析上，这两个字段可能位于页面的某个特定部分，比如bd_text内容中。根据豆瓣电影页面的结构，通常国家和类型信息可能包含在类似“制片国家/地区: 美国”或“类型: 剧情 / 犯罪”这样的文本中。接下来，我需要考虑正则表达式是否正确匹配这些模式。例如，用户可能使用了类似`r'制片国家/地区: (.*?)\n'`的正则表达式，但可能存在空格或其他分隔符的问题。另外，如果页面结构有变化，或者数据是通过JavaScript动态加载的，那么正则表达式可能无法正确捕获数据，导致字段为空。然后，关于ValueError异常，这通常发生在尝试将空值或无效数据插入数据库时。例如，如果某些字段（如评分、年份）解析失败，导致这些字段为None或空字符串，而数据库表结构不允许为空，就会引发异常。需要检查数据库表的约束条件，并确保所有必要字段都被正确解析。另外，用户提到使用Scrapy框架，可能需要检查是否正确地处理了动态加载的内容。如果数据是通过AJAX请求加载的，可能需要使用Scrapy的中间件如Splash或Selenium来渲染页面，或者直接找到包含数据的JSON包，如引用1中提到的，可能隐藏在页面的某个脚本标签中。可能的解决方案步骤包括： 1. 检查正则表达式是否正确匹配国家和类型字段，可能需要调整正则表达式以处理多个国家或类型，使用非贪婪匹配，或者处理可能的换行符和空格。 2. 验证bd_text的内容是否包含所需数据，可能需要打印或记录bd_text以确认其内容。 3. 处理可能的多值情况，例如类型可能有多个，用特定分隔符连接。 4. 检查其他字段（如年份、评分）的解析是否正确，避免因这些字段为空导致数据库插入失败。 5. 使用try-except块捕获ValueError，并添加日志记录以确定具体是哪部分数据导致的异常。 6. 考虑是否有反爬机制导致数据未正确加载，可能需要设置请求头或使用代理。此外，引用1提到豆瓣电影的数据可能包含在JSON数据包中，用户可能需要直接提取该JSON数据，而不是依赖HTML解析，这样可以更可靠地获取数据，避免正则表达式的问题。例如，查找页面中的`<script type="application/ld+json">`标签，解析其中的JSON数据，这可能包含更结构化的电影信息。最后，用户需要确保数据库连接正常，并且插入语句正确，字段与表结构匹配，没有类型不匹配或约束违反的情况。</think>### 问题分析与解决方案根据你的描述，问题主要集中在**正则表达式未正确匹配国家和类型字段**以及**数据库存储失败**。以下是具体分析和解决方案： --- #### 一、正则表达式匹配问题（国家和类型字段为空） **原因分析**： 1. 豆瓣电影的“制片国家/地区”和“类型”字段可能包含**动态换行符、空格或特殊符号**，正则表达式未覆盖这些情况[^1]。 2. 页面结构可能动态变化，导致`bd_text`内容与预期不一致[^2]。 **解决方案**： 1. **优化正则表达式**，使用更灵活的匹配模式： ```python # 匹配国家（允许多个国家，如“美国 / 英国”） country = re.search(r'制片国家/地区[:：]\s*(.*?)\n', bd_text).group(1).strip() if re.search(r'制片国家/地区[:：]', bd_text) else "未知" # 匹配类型（处理多个类型的分隔符） genre = re.search(r'类型[:：]\s*(.*?)\n', bd_text).group(1).strip().replace(' ', '') if re.search(r'类型[:：]', bd_text) else "未知" ``` 2. **打印调试信息**，验证`bd_text`是否包含目标字段： ```python print("bd_text内容：", bd_text) # 检查是否包含“制片国家/地区”和“类型” ``` --- #### 二、数据库存储失败（ValueError异常） **原因分析**： 1. 部分字段解析为空（如评分、年份），导致插入数据库时违反非空约束。 2. 字段类型不匹配（例如将字符串插入整数字段）。 **解决方案**： 1. **添加字段验证**，确保关键字段非空： ```python # 示例：年份解析 year = re.search(r'(\d{4})', year_text).group(1) if re.search(r'(\d{4})', year_text) else None if not year: raise ValueError("年份解析失败") ``` 2. **使用异常捕获**，定位具体错误位置： ```python try: # 数据库插入操作 cursor.execute(insert_sql, (title, country, genre, year, rating)) db.commit() except Exception as e: print("数据库插入失败，错误信息：", e) db.rollback() ``` --- #### 三、完整代码调整示例 ```python def parse_html(self, response): # 提取bd_text内容 bd_text = response.xpath('//div[@id="info"]').get() print("调试信息 - bd_text:", bd_text) # 验证内容是否完整 try: # 国家匹配（处理空格和换行） country_match = re.search(r'制片国家/地区[:：]\s*([\u4e00-\u9fa5\s/]+)\n', bd_text) country = country_match.group(1).strip() if country_match else "未知" # 类型匹配（处理多个类型） genre_match = re.search(r'类型[:：]\s*([\u4e00-\u9fa5/]+)\n', bd_text) genre = genre_match.group(1).replace(' ', '') if genre_match else "未知" # 其他字段解析（示例：年份） year = re.search(r'(\d{4})', response.xpath('//span[@class="year"]/text()').get()).group(1) # 数据库插入 if all([country, genre, year]): # 确保关键字段有效 insert_sql = "INSERT INTO movies (title, country, genre, year) VALUES (%s, %s, %s, %s)" self.cursor.execute(insert_sql, (title, country, genre, year)) self.db.commit() else: print("关键字段缺失，跳过存储") except ValueError as ve: print("值错误：", ve) except Exception as e: print("其他错误：", e) ``` --- #### 四、其他注意事项 1. **动态数据加载**：若页面数据通过AJAX加载，需检查是否需解析JSON数据包（如引用[1]提到的JSON字段）[^1]。 2. **反爬机制**：添加`headers`模拟浏览器请求，避免被豆瓣拦截[^2]。 ---

阅读全文

md /home/damon/ks_ws/src/racecar_ws/racecar_gazebo/scripts/keyboard_teleop.p

相关推荐

运行pm2命令只出现[PM2] Spawning PM2 daemon with pm2_home=/root/.pm2

基于Java语言的Damon_Study个人学习仓库设计源码

pdksh-5.2.14-37.el5_8.1.x86_64

opencv_ffmpeg_64.dll

超文本传输协议_--_HTTP1[1].1(RFC_2616中文版)_下.txt

smartsvn-macosx-11_0_2.dmg

opencv_ffmpeg.dll

pico.js人脸检测Damon

tess4j_linux.rar

Windows7系统硬盘安装的办法_1.docx

scrt-7.3.7-1034.osx_x64(Mac破解版secureCrt)

pdksh-5.2.14-37.el5_8.1.x86_64包解压缩与使用指南

Damon Zucconi的atlas.damonzucconi.com项目实践

SL4A_R4.apk开发文档重点解读

在cpp中调用android节点“echo 10 25 > /sys/bus/i2c/drivers/aw210xx_led/1-0020/leds/aw210xx_led/multiple”

计算机就业指导.docx

C语言指针习题及答案.doc

大家在看

HFSS板子实物加工流程.pdf

基于GFFT的LFSR序列生成多项式估计方法

buliding\horse\pig\rabbit\table\wolf等各种点云数据集pcd文件

QT+Basler相机SDK开发源码+详细说明文档

C# Socket 实现的淘宝秒杀器（抢拍器）

最新推荐

计算机就业指导.docx

C语言指针习题及答案.doc

第7章-PLC控制系统设计.ppt

iBatisNet基础教程：入门级示例程序解析

【Dify工作流应用搭建指南】：一站式掌握文档图片上传系统的构建与优化

Tree-RAG

VC数据库实现员工培训与仓库管理系统分析

【IFIX 4.5 MB1 驱动更新深度解析】：专家分享关键步骤，避免更新陷阱

display: grid;瀑布流

C++实现高效文件传输源码解析