TensorFlow Object Detection-CSDN博客

sudo apt-get update
sudo apt-get install python3-pip
pip3 install tensorflow

git clone https://github.com/tensorflow/models.git
cd models/research

git clone https://github.com/tensorflow/models.git: 克隆 TensorFlow 的官方模型库，包含对象检测的相关模型和示例代码。
cd models/research: 进入克隆下来的仓库目录，进行后续操作。

pip3 install -r requirements.txt

pip3 install -r requirements.txt: 安装 models/research 目录下 requirements.txt 文件中列出的所有依赖项。该文件包含 TensorFlow Object Detection 所需的库。

使用 LabelImg 工具标注数据集，并将标注信息保存为 XML 文件。

Training Dataset (训练数据集): 用于训练模型的数据集。它包含了用于模型学习的输入数据和对应的标注数据。训练集是整个数据集中最大的一部分，模型通过不断调整参数来拟合这些数据。
Validation Dataset (验证数据集): 在训练过程中用于评估模型性能的数据集。它不用于更新模型参数，而是用于选择最佳模型。验证集帮助确定模型是否过拟合或欠拟合。
Test Dataset (测试数据集): 用于在训练完成后评估模型性能的数据集。它完全独立于训练集和验证集，用于提供模型在实际数据上的性能评估。

对于数据量和比例，没有固定的标准，因为这取决于具体问题和数据集规模。不过，一般建议如下：

假设有一个数据集包含 10,000 张图片：

python3 object_detection/dataset_tools/create_pet_tf_record.py --data_dir=path/to/dataset --output_dir=path/to/output

python3 object_detection/dataset_tools/create_pet_tf_record.py: 运行脚本将数据集转换为 TFRecord 格式。
- --data_dir=path/to/dataset: 数据集路径。
- --output_dir=path/to/output: 转换后的 TFRecord 文件保存路径。